Друзья, важное! ljsm

Apr 10, 2017 09:50

Если вы сохраняли свой ЖЖ с помощью утилиты ljsm от ati, то вам нужно сделать это снова ( Read more... )

Leave a comment

20_00 April 12 2017, 11:12:04 UTC
ati April 12 2017, 11:35:53 UTC
Добрый день.

есть ключик для выкачивания диапазона дат:
-d yyyy/mm-yyyy/mm

есть ключик для пересоздания индексного файла без выкачивания записей
-x

есть ключик для игнорирования сетевых ошибок (но не бесконечного повторения попыток выкачивания)
-I (i большое)

есть ключик для того, чтобы убедиться, что все локальные файлы, соответствующие выбранному диапазону дат, имеют ненулевой размер.
-r

Reply

20_00 April 12 2017, 11:38:58 UTC
20_00 April 12 2017, 12:01:27 UTC
ati April 12 2017, 12:03:29 UTC
Я возможно недостаточно ясно выразился: -x создаёт индекс именно для локально выкачанного архива.

Reply

20_00 April 12 2017, 12:05:39 UTC
20_00 April 12 2017, 13:13:49 UTC
ati April 12 2017, 13:18:25 UTC
Ура, отлично.

Странно, что индексный файл не создался, по идее должен создаваться в любом случае, если что-то скачалось.

Reply

20_00 April 12 2017, 13:27:17 UTC
ati April 12 2017, 16:36:48 UTC
О, точно, спасибо, это древняя ссылка уже давно не работает.

Reply

bgmt August 7 2017, 12:33:17 UTC
Добрый день,

я нечаянно закрыл окно терминала, когда он уже скачал все посты и почти все картинки. В результате полтора года картинок не скачалось. Журнал большой (это не мой, в скачиваемом почти в каждом посте картинки, качалось два дня). Т.е. мне нужно бы просто дозакачать недозакачанные картинки. Вероятно, это невозможно? Я не понял, кстати, хронологически ли они закачиваются: вроде да, судя по тому, что недостаёт именно в последних полутора годах.

Если это возможно, то как?
Если это невозможно, то, наверно, надо снова скачать журнал начиная с даты начала ошибки, причём, если это делается в той же директории (делать в той же или нет?), то нужно заменять уже скачанные посты (так? это флаг -O?) Но я не понимаю, присоединится ли результат сам по себе к уже правильно скачанной части, или надо что-то делать руками, и если да, то что.

Буду очень благодарен за ответ.

Reply

ati August 7 2017, 17:49:42 UTC
Добрый день.
Я чуть позже вникну в проблему и постараюсь написать что-то содержательное в ответ.

Reply

bgmt August 7 2017, 19:08:00 UTC
Спасибо, будет очень здорово. Потому что иначе мне снова три дня заново скачивать, очень не хочется.

Reply

ati August 8 2017, 15:09:11 UTC
У меня кажется плохие новости.

Сейчас логика работы программы такая: для всех постов за указанный период скачать сам пост, извлечь из него ссылки на картинки и перезаписать в теле поста ссылки на картинки с внешних ресурсов на локальный файл картинки. Сами картинки скачиваются в конце работы программы, после того, как все посты закачаны.

Соответственно у вас сейчас есть посты, в которых ссылки на картинки переписаны на локальные файлы, но самих этих локальных файлов нет. И ссылок на них нет. А значит и взять их неоткуда.
Видимо более resilient было бы скачивать картинки сразу после скачивания поста, но сейчас логика такая, как я описал.

Боюсь, что для того, чтобы нормально закачать все картинки, придётся заново скачивать архив за всё время жизни журнала. Чтобы в этом убедиться, откройте какой-нибудь старый пост из архива и посмотрите, есть ли в нём картинки.

Reply

bgmt August 8 2017, 19:40:41 UTC
Спасибо за ответ. Возможно, дело у меня не так плохо, как вам показалось - если возможна ещё одна операция, и тут я очень бы хотел вашего ответа. По моему впечатлению, картинки скачивались хронологически - во всяком случае, десяток старых постов вполне содержат фотографии, а последние полтора года - нет. Т.е. если возможно в ту же директорию заново скачать начиная с определённой даты, то пусть html файлы заменятся на ровно такие же, неважно, в картинки ведь пойдут картинки начиная с этой даты? (Конечно, если они пойдут в ту же директорию img, что раньше). Это может сработать? Какие опции тогда надо включать?
Спасибо!

Reply

ati August 8 2017, 19:49:34 UTC
Если картинок нет только в постах за последние 1.5 года, то можно просто стереть соответствующие каталоги с постами и заново запустить программу с обычными опциями (логин-пароль + скачивание картинок). Она определит, начиная с какой даты отсутствуют посты и докачает остальное.
Можно не удалять каталоги с постами, а запустить программу с дополнительными опциями -d и -O, результат (надеюсь) будет таким же, как и в предыдущем варианте.
Всё заново скачанное приложится к уже имеющемуся без каких-то дополнительных действий.

Надеюсь, мои разъяснения как-то помогли, если возникнут новые проблемы, постараюсь помочь.

Reply


Leave a comment

Up