полная версия интервью. Сокращенная версия для газеты "The Kiev Times"
здесьОбъединенная база данных "Мемориал" с момента своего появления стала для поисковиков альфой и омегой. То, что раньше приходилось неимоверными усилиями добывать из Центрального архива Минобороны РФ (ЦАМО) и других архивов, стало общедоступным. Оригинальные донесения о потерях, карточки военнопленных, документы госпиталей и пр. вскрыли колоссальный пласт информации о погибших. А что означает эта работа для их родственников вообще трудно передать словами. "Мемориал" открыл поистине огромные возможности для поиска сведений порой не просто о месте гибели человека, но и о его пути на войне. Помогает в этом и параллельный проект "Подвиг народа", где выкладываются наградные листы с описанием подвига. Разработчик ОБД Виктор Тумаркин рассказал нам о возможностях базы данных, дезинформации в документах, а также о том, может ли содержимое архивов поставить, наконец, точку в спорах о количестве потерь Красной армии в Великой Отечественной войне.
- Виктор Иосифович, какой была первопричина появления ОБД "Мемориал", чистое человеколюбие Минобороны России, желание открыть доступ к архивам?
- Было соответствующее распоряжение, а потом и указ президента. Но идея создания банка данных выросла из локальной задачи по автоматизации учета паспортов захоронений. А потом это переросло в иное качество - учесть вместе с ними весь массив документов, хранящихся в наших архивах. Первая же попытка совместить паспорта захоронений с документами о потерях, сделанная нами, убедила в эффективности такого метода. В ЦАМО нашли донесение: апрель 1945 года, наступление на какой-то немецкий город, 34 человека в донесении числятся убитыми и похороненными, а 28 пропали без вести. А в паспорте захоронения, по порядку, с немножко измененными фамилиями, были обозначены все. Просто одна воинская часть солдат потеряла, другая нашла и похоронила. На одном простом примере стал виден эффект создания системы. Где-то 15 сентября 2006 года генералу Владимиру Исакову, который возглавлял тыл, показали работу, и он оценил необходимость создания этого ресурса. А к концу года было уже 1,5 млн. записей. Их мы сделали за счет взносов коммерческих организаций, и если бы не было этих полутора миллионов, не было бы и остального ОБД. В 2007 году пошло государственное финансирование и нам была поставлена задача загрузить уже 20 млн. записей. Это было ужасно, но деваться некуда, справились.
- Как это у вас получилось, за счет автоматизации процесса?
- Технология основывалась на том, что все документы сканируются, а потом по их образу вся информация вводится руками, никакого автоматического распознавания. Для этого были образованы два стационарных цеха, где установлены высокопрофессиональные сканеры, в том числе бесконтактные. Кое-что сканировали непосредственно в архивах. Дополнительно работают пять цехов по ретроконверсии в разных городах, плюс пять тысяч "надомников". Это люди, которые через интернет получают кусочки изображений с той информацией, которую им надо ввести.
Один и тот же документ обрабатывает несколько операторов, чтобы заполнить все поля, которые необходимо. Обязательная проверка и двойной ввод: если совпадает - идет дальше, если нет - третий смотрит, кто из двух операторов ошибся. Плюс отдельные стадии проверки, плюс обязательная проверка в технологическом департаменте. Тем не менее, иногда ошибки возникают. Иногда хватаешься за голову: как при такой степени контроля вы могли внести вот такое?! Говорят: ну как, операторы ввели по-разному, а тот, кто проверял - нажал не на ту кнопку. Но есть и объективные вещи, безобразные почерки, которые можно разобрать совершенно по-разному. При таких объемах отсутствие ошибок невозможно.
- Можно ли сказать, сколько процентов документов уже обработано в российских архивах? И можно ли сегодня уже говорить о каком-то общем результате?
- В процентах, наверное, никто не сможет сказать. По ЦАМО, допустим, фонды по безвозвратным потерям обработаны полностью, это немножко более 250 тысяч донесений. Но еще часть, процентов 15 разбросано по разным фондам, и их надо каким-то образом находить. Кроме того, архивов много. Есть еще ведомственные архивы, например, архив НКВД, это свои трудности. Скажем, пограничников нам отдали только частично. Немецкие "Саксонские мемориалы" получили информацию из архивов КГБ Украины и Беларуси, но нам не отдают. Документы о военнопленных у нас в базе - это часть, что-то держит у себя ФСБ. По договоренности с ним из фильтрационной картотеки в 190 тысяч карточек размещаются только записи, сами образы не показываются. Но хотя бы по записям и по тому, где находится эта информация, можно узнать куда обращаться при необходимости.
Но в целом на сегодня в ОБД доступно 14,5 миллионов образов документов и около 31 миллиона записей из 38 тысяч архивных дел и картотек. И 42 тысячи паспортов воинских захоронений. Это не считая Книг Памяти. И то, что они совместились в одном массиве, дает потрясающий эффект. Ведь главная задача - предоставление людям возможности осуществлять самостоятельный поиск информации о своих родных, проводить свой собственный анализ. Работники архива не занимаются исследованиями. Они по своей картотеке проверяют, есть ли по данным, которые им присылают, информация или она отсутствует. У них гора этих писем. Сейчас люди находят своих родственников с искажениями фамилий, и понимают, почему им ответили, что данных нет. Вот на днях получили письмо: 60 лет искали, не могли найти, а на вашем сайте за 20 минут нашли. Но на самом деле для достижения такого эффекта понадобилась очень большая организационная и техническая работа.
- А реально ли с помощью банка данных поставить финальную точку и прекратить споры о количестве потерь Красной армии в войне?
- Безусловно, анализ банка данных в этом сможет помочь. Поставить финальную точку - не думаю. По той простой причине, что по 1941 году донесений о потерях очень мало, всего 40 томов. В то время как на 1942 или 1943 год томов больше тысячи. Есть много повторов в разных документах, притом встречаются такие, что непонятно, речь об одном человеке или о разных. Я должен поспорить с Игорем Ивлевым (историком, автором ресурса Солдат.ru - ред.), который говорит, что у нас 10% повторов. Их больше. Где-то на человека одна запись, где-то три, на генерала Карбышева, к примеру, четыре.
В массиве донесений ВМФ порядка 450 тысяч записей, хотя имеется картотека, в которой порядка 150 тысяч записей. И в Военно-морском флоте на самом деле учет был очень хороший. Но на самом деле, для разных массивов этот показатель разный. И повторения мы допускаем сознательно, это необходимо потому, что в одном документе может быть информация, которая отсутствует в другом. Можно установить судьбы отдельных, конкретных людей. Ради этого стоит делать повторы.
В некоторых документах есть существенная дезинформация. Скажем, послевоенные результаты подворовых опросов. Мы обязаны в качестве даты выбытия обозначать ту дату, которую обозначил военком. А как он это делал? Насколько я понимаю, добавлялось примерно месяца три к дате последнего известия. И это обозначалось как дата пропажи. А если человек жил на оккупированной территории, эти три месяца добавлялись к дате ее освобождения. Вот и получается, что последнее известие о человеке в 1941 году, а военком пишет: "Считать пропавшим без вести в марте 1944 года". Бывает так, что появляются записи на живых, причем, иногда их имена есть даже в паспорте захоронения.
- Одно время были закрыты записи на дезертиров, осужденных, предателей и прочих, сейчас они доступны? И почему закрывались?
- Был момент, что у какого-то губернатора родственник был осужден, у кого-то еще подобные моменты вскрылись, и встал вопрос, а можно ли такие вещи публиковать? Надо, мол, это закрыть. У нас не было возможности закрывать по одной записи, и мы вынуждены были закрывать листами. В результате оказались "закрытыми" другие люди, оказавшиеся на том же листе. Поднялся большой шум, писали президенту, премьер-министру, и т.д. В результате правовое управление Минобороны сочло, что публиковать все это можно, и мы снова их открыли. Сейчас записи все доступны, но мы модифицировали поля "Причины выбытия" на "иные". Сюда же относятся самоубийства, но иногда, к сожалению, по ошибке попадают и боевые причины.
- Я встречал такие экзотические причины смерти, как "напились технического спирта".
- Вы знаете, это не экзотические причины. К сожалению, они достаточно распространенные, вплоть до того, что немцы сознательно оставляли цистерны с метиловым спиртом при отступлении. Конечно, страшно читать, что целый взвод погиб от отравления, но такое случалось. И они были не только среди наших военнослужащих. Я видел страшный документ из ГАРФа (Государственный архив РФ. - ред.), когда в лагере перемещенных лиц, после освобождения, в английской зоне оккупации, тоже где-то раздобыли спирт и большое количество людей умерло.
- А что с документами госпиталей и учетными карточками захоронений, все ли они обработаны? Ведь по Украине есть далеко не все карточки.
- По Украине введено в базу порядка 13 тысяч захоронений, но при этом по Киеву и Киевской области - ноль, их просто нет в архиве. По Западной Украине совсем мало, по Крыму всего 48, но из них 21 - по Феодосии, 21 по Судакскому району и четыре в Керчи. Еще ряд документов будет вводиться в ближайшее время, то, что накопилось за 2011-12 годы. А накопилось много потому, что работают министерские представительства в странах Европы, идут паспорта из России и европейских стран. Все то, что поступило - порядка 75 тыс. имен, 700 с чем-то паспортов плюс дополнения к старым, и еще материалы из Латвии, там 313 захоронений и порядка 130 тысяч имен. Это я надеюсь, будет введено в этом году. На данный момент в базе около 40 тысяч паспортов и немного более 2,5 млн имен. Это конечно немного. Но мы помним, что в ОБД вообще нет Польши, поскольку она есть в казанской базе (МИПЦ - ред.). В принципе, эту базу я получил, но паспорта без приложенных списков, она сырая, ее нельзя выкладывать. Исправляют ее до их пор, и я боюсь, что при перезахоронениях многое было потеряно. Мы попытаемся получить через Минобороны протоколы эксгумации, хранящиеся в польском Красном Кресте. Это документы крайне тяжелого качества, на польском языке, разумеется. Представляю, что ошибок будет много. Тем не менее, документы имеет смысл выставить, чтобы было хоть как-то.
Что же касается документов госпиталей и медсанбатов, то в том, что ЦВМА передал в ЦАМО, информация не по всем из них. Я бы оценил объем в 2/3. Порядка 11 тысяч дел у нас обработаны и загружены, но проиндексированы не все. Про некоторые медучреждения дел было много, и мы выбирали на каждый временной период документы так, чтобы дело было наиболее полным. То есть, допустим, если есть и алфавитные списки, и книги учета умерших, и книги погребения, мы брали набор такой, чтобы они покрыли весь период существования. Но если книга целиком повторяла тот период, который мы размещали, то размещали ее в ОБД без индексирования.
- В ОБД содержится информация о большом количестве людей, найденных и опознанных поисковыми отрядами, либо просто есть информация о судьбе тех, кто числится пропавшим без вести и т.п. Как ее можно вводить в базу?
- Для этого мы ввели в итоге блок дополнительной информации. И любой человек, который зарегистрировался, может ввести ее: включить фото, сделать ссылки на сайт, добавить вордовский файл или просто добавить текст. Но это появляется не сразу, а проходит модерацию. За это большое спасибо поисковикам, которые по собственному желанию проверяют эти записи. Просят такой же блок сделать в «Подвиге народа», но мы не делаем потому, что непонятно, кто будет его модерировать.
- Чего не хватает в ОБД? И как быть с теми документами, которые находятся в Украине? Ведь фактически, все документы военного периода - один массив и относятся к одной армии. Но страны у нас теперь разные и ОБД - российский проект.
- Проект-то российский, но затрагивает страны всего бывшего СССР. И понимая это, мы даже делали выборки по месту призыва и передавали руководству всех стран. По Украине получилось 2 млн. 600 тысяч записей и это то, что можно отнести к героическим потерям. А не хватает многого. В первую очередь, паспортов захоронений, документов военкоматов, прежде всего, похоронок. Третье - документы о военнопленных. Они не централизованного хранения, находятся в самых разных архивах по всему миру. Пытаемся добывать. Нет у нас Книг Памяти, мы с удовольствием их возьмем у вашего проекта, если дадите. И я полагаю, безотносительно к тем базам, которые создаются в республиках, было бы полезным сконцентрировать в ОБД все данные как в неком едином месте. Если бы Украина могла заняться выявлением документов в своих архивах, дальше можно действовать по-разному. Где массивы большие, мы можем со своими сканерами приезжать и сканировать, если будут соответствующие договоренности.
- Чтобы пополнять единую базу нужно волевое решение на высшем уровне, провести ревизию и приступить к обработке?
- Конечно, только желание двух сторон. Мы исполнители, мы не решаем, что загружать, что нет. Мы можем только предложить. Но нам уже известно какой огромный эффект это принесло и продолжает приносить.
- Ведете ли вы статистику посещения сайта, кто больше всего интересуется содержимым базы?
- Всего можно по целенаправленному посещению выделить 150 стран, из которых входы совершили 28,5 млн посетителей. Больше всего посещений, разумеется, из России - 21,7 млн, 76%, на втором месте - Украина - 3,23 млн. Что касается различных городов, из которых выходили на сайт, то их более 11 тысяч. На первом месте Москва - 5,6 млн, на втором Питер, на третьем Киев, один миллион заходов. Ежедневно у нас порядка 15-25 тысяч посещений в день, но на 9 мая и 22 июня зашкаливает.
- Есть ли какой-то случай, особенно Вас зацепивший, запомнившийся, какая-то история человека?
- Прошлым летом я встретил школьного друга, разговорились, он узнал, чем я занимаюсь и сказал, что его теща ищет своего брата. Никак не может найти, и в нашей базе его нет. Я сказал, что может быть имя не так записано, не нужно искать точное совпадение. И тем же вечером они его нашли. Летом ездили в Карелию, снарядили экспедицию, привезла женщина горсть земли с могилы. Все лето у них прошло под потрясением от этого события.
- Таких историй я тоже знаю много. Поэтому позвольте Вас поблагодарить за нужную работу.
- Наверное, все-таки не меня, а весь наш коллектив.
Дмитрий Заборин,
координатор проекта "Электронная Книга Памяти Украины"