Feb 22, 2011 16:09
Я тут заморочился и переделал свой старый чистильщик html-кода.
Немного истории. Я работал в далеком году техником МАДИ. Мне часто присылали большие файлы в doc и просили разместить их на сайте. Разумеется я не дурак верстать каждый файл (особенно огромные сложные таблицы с бестолковыми данными) руками. Поэтому я начал думать как этот процесс автоматизировать. Перепробовал всяких утилит, но мне не нравился код, который они генерировали.
Я получал html методом "Save as html", а потом серией метких регулярных выражений приводил его в чувство и делал похожим на что-то нормальное. Через какое-то непродолжительное время я сделал небольшой одностраничный (как я люблю) сервис, который в одно окно принимал грязный код, а из другого выплевывал почищенный.
Сервис давал выбирать какие-то настройки - как именно чистить этот код. Что именно убирать. Но по факту, я всегда ставил все галки. Кроме того, сервис иногда глючило и он мог отрезать лишнего. Но это все равно было лучше, чем писать код руками.
С тех пор много воды утекло. И вот мне снова приходят файлы в doc, которые нужно размещать. И я переделал сервис.
Сперва я сделал получение результата аяксом. Потом добавил еще с десяток опций-галочек. А потом подумал и убрал все галки кроме четырех (одна из которых магическая).
Но самое мое большое достижение по-моему - это возможность вставки прямо из ворда. На то, чтобы понять как это делается и работает у меня ушло полдня. Это было занятно. Посему приглашаю оценить и проверить. Вдруг у кого-то из вас есть потребность выкладывать doc в веб.
За фичреквесты и особенно багрепорты буду благодарен.
лытдыбр,
работа,
интернет,
полезно