Экспорт по годам в .html и открытие браузером + пересохранение в .maff с картинками я делал вручную. Есть ли возможность автоматизации - надо смотреть.
Да, конечно ljsm плох тем, что создает один огромный индекс за все годы. Но зато прекрасно сохраняет все картинки (правда. вот не youtube-вские ролики).
Но все-таки задача стоит "раздать как статический сайт нормальнрым веб-сервером". Поэтому .maff это лишнее.
Re: яндексовский поиск совсем нихрена не ловит мышей в ЖmpdApril 5 2015, 15:22:24 UTC
Не от хорошей жизни. Я когда игрался с Флексум (был такой сайт у АиП, где можно было свой поиск создавать), не мог понять, чего это мои инструкции на индексирование ЖЖ платформа не выполняет. Оказалось, что ЖЖ делает всё возможное, чтобы уважающие правила индексирования (специальные nofollow-атрибуты тэгов, меты в хедерах страницы, и т.д.) система не могла бы проиндексировать остальную часть твоего ЖЖ, отталкиваясь от одной конкретной страницы.
Например, вот, что я сейчас увидел на странице своего журнала в заголовке:
В результате комментарии сбэкпалены далеко не все. Ну не то, чтобы я очень по этому поводу переживал, но интересно есть ли решения лучше.
А кроме комментариев прочее бэкапится? Когда я в прошлом году решил проверить свои ljsm-овские архивы, то выяснил, что ЖЖ, похоже, как-то сменил формат. И в результате то, что сбэкапил ljsm, непригодно к использованию.
Сегодня - сбэкапилось. Правда как-то странно. С первого раза нормально сбэкапился 2015 год, а 2014 и 2013 создались файлы нулевой длины. Со второго - сбэкапились все.
Формат страницы они, правда, поменяли, так что пришлось немного править скрипт, чтобы он прописывал в индекс заголовки постов. Там было что-то штуки три варианта регекспа для этой цели, ни один не работал. Пришлось 4-й добавить.
Что-то я не понял про этот пеликан. Почитал - там есть куча плагинов для комментариев, но все они почему-то предполагают что у юзера нет возможности разместить простейший скрипт для обработки POST-запросов. Кто читает комментарии через API со стороннего сайта, кто извращается с генерацией mailto: ссылок.
А нормальной системы комментариев с авторизацией по OpenID нет.
ну так с простейшим скриптом это будет уже не статический сайт
впрочем, я создаю html комментариев самостоятельно, и цепляю его к посту посредством плагина Static comments, такую систему при желании можно расширить и до добавления комментариев. Хотя до авторизации по OpenID вряд ли.
Основное преимущество статического сайта - устойчивость к броскам нагрузки, сохранится. Возможность репликации по всяким cdn-ам тоже сохранится. Потому что обычно на один постинг комментария приходятся если не десятки тысяч, то по крайней мере сотни прочтений.
Кстати, в к прикручивании openid к форме постинга комментариев нет никакого rocket science.
А самостоятельно при этом создается именно готовый HTML или что-то вроде маркдауна?
И сохраняется ли при этом древовидность комментов?
А то я уже склоняюсь к идее попробовать поиграться с пеликаном на предмет опять уйти с ЖЖ/DW на собственный хостинг.
Comments 42
Экспорт по годам в .html и открытие браузером + пересохранение в .maff с картинками я делал вручную. Есть ли возможность автоматизации - надо смотреть.
Reply
Но все-таки задача стоит "раздать как статический сайт нормальнрым веб-сервером". Поэтому .maff это лишнее.
Reply
Reply
Комментарии со ссылками они проэтосамливают, да, а посты вроде не пропадали. у меня все ходы записаны.
Reply
Reply
Гугл действительно не видит, удивительно.
Хотя, конечно, локальный бэкап блога хочется иметь независимо от того, хорошо ли он проиндексирован поисковиками.
Reply
Я когда игрался с Флексум (был такой сайт у АиП, где можно было свой поиск создавать), не мог понять, чего это мои инструкции на индексирование ЖЖ платформа не выполняет.
Оказалось, что ЖЖ делает всё возможное, чтобы уважающие правила индексирования (специальные nofollow-атрибуты тэгов, меты в хедерах страницы, и т.д.) система не могла бы проиндексировать остальную часть твоего ЖЖ, отталкиваясь от одной конкретной страницы.
Например, вот, что я сейчас увидел на странице своего журнала в заголовке:
Reply
Reply
Но - помогает ли это благородному дону?
:-(
Reply
Reply
А кроме комментариев прочее бэкапится? Когда я в прошлом году решил проверить свои ljsm-овские архивы, то выяснил, что ЖЖ, похоже, как-то сменил формат. И в результате то, что сбэкапил ljsm, непригодно к использованию.
Reply
С первого раза нормально сбэкапился 2015 год, а 2014 и 2013 создались файлы нулевой длины. Со второго - сбэкапились все.
Формат страницы они, правда, поменяли, так что пришлось немного править скрипт, чтобы он прописывал в индекс заголовки постов. Там было что-то штуки три варианта регекспа для этой цели, ни один не работал. Пришлось 4-й добавить.
Reply
Reply
Видим там кучу строчкек вида
$title = $1 if ...
Добавляем к ним еще одну:
$title = "$1" if ($line =~ m#\w+: (.*?)#);
Reply
Reply
А нормальной системы комментариев с авторизацией по OpenID нет.
Reply
впрочем, я создаю html комментариев самостоятельно, и цепляю его к посту посредством плагина Static comments, такую систему при желании можно расширить и до добавления комментариев. Хотя до авторизации по OpenID вряд ли.
Reply
сохранится.
Возможность репликации по всяким cdn-ам тоже сохранится. Потому что обычно на один постинг комментария приходятся если не десятки тысяч, то по крайней мере сотни прочтений.
Кстати, в к прикручивании openid к форме постинга комментариев нет никакого rocket science.
А самостоятельно при этом создается именно готовый HTML или что-то вроде маркдауна?
И сохраняется ли при этом древовидность комментов?
А то я уже склоняюсь к идее попробовать поиграться с пеликаном на предмет
опять уйти с ЖЖ/DW на собственный хостинг.
Reply
Leave a comment