Выводы уж сами делайте

Apr 06, 2007 17:03

Список, приведенный у Алксниса. Здесь для удобства переведен в текстовый вид.

ДАТА 06.04.2007
ВРЕМЯ 10:49.22
СОСТАВ Государственная Дума
РЕЖИМ КОЛИЧЕСТВЕННОЕ ГОЛОСОВАНИЕ
ТИП ОТКРЫТОЕ
ОТСЧЕТ ОТ ОБЩЕГО ЧИСЛА
КВОРУМ 2/3  РАЗМЕР КВОРУМА  300
ТЕМА 4. О Федеральном законе "О Знамени Победы" (проект № 182778-4) (в ранее принятой редакции)РЕЗУЛЬТАТЫ ( Read more... )

Leave a comment

Прошу помощи зала! v_alksnis2 April 6 2007, 19:48:34 UTC
Уважаемый vorchunn,
я в своем посте сделал ссылку на Вас. Искренне Вам признателен за проделанную работу по переводу графики в текст. Я начал было этим заниматься сразу, как получил распечатки протоколов поименного голосования, но убил массу времени, но так ничего не добился, т.к. таблицы постоянно расползались. Не могли бы Вы меня проконсультировать, как наиболее эффективно переводить подобные протоколы в текст и размещать их в блоге.
Очень Вам буду признателен.

Reply

vorchunn April 6 2007, 20:18:24 UTC
В принципе, ничего сложного. Сконвертировал все gif-файлы в формат tif (наверное, подойдет и любой другой, воспринимаемый программой распознавания), загрузил картинки в ABBYY FineReader. Программа предложила переназначить разрешение картинок на 300dpi, согласился. Ну а дальше разметил области распознавания вручную, но не таблицами, а простыми текстовыми блоками. Запустил распознавание. Хоть Finereader и поругался немного на разрешение, но результат получился довольно чистым (лишь кое-где пробелы скушало). Дальше уже, наверное, можно было выкладывать и в таком виде, но чтобы было ближе к оригинальному тексту, вручную вставил сами списки в трехколоночные таблицы (особых знаний по html тут и не надо).

Reply

vorchunn April 6 2007, 20:27:48 UTC
При разбивке в Файнридере просто надо делить страницу на несколько однородных текстовых блоков, а не выделять всю область. Например, одна колонка списка - один блок. Дальше даже можно никуда не сохранять результат, а последовательно скопировать распознанное из окна программы в один текст.
Статистику голосования (вроде "ЗА________________ 79 чел. 100,0%
ПРОТИВ____________ 0 чел. 0,0%") тоже легко распознавать как отдельный текстовый (нетабличный) блок.
Вот. Вроде бы никаких особых сложностей.

Reply

vorchunn April 6 2007, 21:06:54 UTC
Да, и спасибо большое, что выложили эти списки.

Reply

Re: Прошу помощи зала! partizan74 April 7 2007, 07:54:21 UTC
Спасибо за списки.
Народ должен знать своих "героев"...
Тем более есть несколько весьма известных личностей.

Жаль у меня нет возможности каждой твари из списка в харю плюнуть.
Потому придется пока рисунком ограничится(см. ниже по комментариям)

Reply

ohtori April 7 2007, 13:19:51 UTC
Очень благодарен Вам за источник этой информации.
Я весьма далёк от Вашей политической линии и образа действий, но в данном случае Вы сделали очень важное дело.
Ещё раз благодарю.

Reply

Re: Прошу помощи зала! motl April 13 2007, 20:22:28 UTC
Уважаемый Виктор Имантович, большое спасибо Вам за размещение этих списков.

Reply


Leave a comment

Up