НТЦ Информрегистр. Лаборатория Разработки и Внедрения Информационных Технологий. ЭИ и ЭБ.2

May 19, 2016 03:28


Продолжение предыдущей публикации. Повторюсь, дабы снять возможное недоумение почему у нас тут и такие материалы.


С одной стороны, это представляет интерес с позиции историчности: где (в каких ведомствах), когда и как была начата - неначата такая работа, как шел процесс и к чему какое ведомство/госструктура пришли к периоду современности, по части ЭБ.

С другой стороны, мы продолжаем исследования истоков и поиск причин начала погромов самодеятельных электронных библиотек, начавшегося в России около 2004-го года.

Поскольку НТЦ Информрегистр, в лице Лаборатории Разработки и Внедрения Информационных Технологий, начал деятельность по части электронных изданий/электронных библиотек еще в начале 90-х,  то его деятельность никак не может быть обойдена вниманием.

В данном разделе в хронологическом порядке приведены проекты, которыми занималась и занимается в наст.время Лаборатория. Особый интерес вызывает НПЭБ (Научная Публичная Электронная Библиотека), запущенный в 2013 году совместно с Педагогической Академией РФ. Построена данная ЭБ уже на современных технологиях представления электронных книг (электронных изданий), предполагается очень высокая интеграция библиографических стандартов по-максимуму, повышенная устойчивость к нагрузке - 50 тыс.посетителей в сутки и более и много прочих прогрессивных элементов. Интересно еще и то, что, исходя из ТЗ на проект, НПЭБ должна составлять мощную конкуренцию коммерческим ЭБС (электронно-библиотечным системам), о которых мы уже писали.

Ранее:
НТЦ Информрегистр. Лаборатория Разработки и Внедрения Информационных Технологий. ЭИ и ЭБ.1
НТЦ Информрегистр. Лаборатория Разработки и Внедрения Информационных Технологий. Публикации
Лидеры и аутсайдеры в среде идеологов ЭБ. И опять немного про комьюнити.
Электронные библиотеки и ведомственность в РФ. Некоторые штрихи.
Е.Горный, К.Вигурский Развитие электронных библиотек: мировой и российский опыт, проблемы и...
и некоторые другие публикации (в частности, про ФЭБ) из нашего раздела Разное.



ГлавнаяЧто такое электронная библиотека?ТехнологииПрограммное обеспечениеИстория лабораторииПубликацииСсылкиБиблиотекаСотрудникиКонтакты
Электронные издания на компактных оптических дисках (продолжая "Практика и проекты" предыдущего текста)

ЭНИ «Классификационные системы»

Электронное научное издание «Классификационные системы» создавался в 1994-95 гг. по заданию Миннауки РФ. ЭНИ было тиражировано на CD-ROM и находилось в коммерческом распространении в 1995-97 гг. Оно являлось первым в России машиночитаемым собранием разнообразных широко используемых классификационных систем (классификаторов):

-Универсальная десятичная классификация (УДК).
-Библиотечно-библиографическая классификация для научных (ББК-Н) и массовых (областных) библиотек (ББК-О).
-Международная классификация изобретений (МКИ), редакция 5.
-Государственный рубрикатор научно-технической информации (ГРНТИ).
-Классификатор научных специальностей ВАК (ВАК).
-Товарная номенклатура внешнеэкономической деятельности (ТН ВЭД).
-Общероссийский классификатор продукции (ОКП).
-Общероссийский классификатор видов экономической деятельности, продукции и услуг (ОКДП).
-Система обозначений объектов административно-территориального деления России (СОАТО).
-Система обозначений органов государственного управления России (СООГУ).
-Классификатор форм собственности (КФС).
-Классификатор организационно-правовых форм хозяйствующих субъектов (КОПФ).
-Классификатор стран мира (КСМ) - проект ГОСТ Р на базе стандарта ISO.
-Классификатор языков (КЯ) - проект ГОСТ Р на базе стандарта ISO.
-Общеправовой классификатор отраслей законодательства (ОКОЗ).

Информационные массивы перечисленных классификаторов были получены, как правило, у их владельцев или официальных держателей в объемах, соответствующих действующим официальным версиям, и актуализированы по состоянию на ноябрь 1994 г.
Все классификаторы представлены полными текстами в составе специализированной информационно-поисковой системы (ИПС РЕГИСТР), обеспечивающей поиск по лексике с учетом грамматики русского языка и классификационным кодам, просмотр результатов поиска, а также сохранение отобранной информации в текстовом файле. ИПС РЕГИСТР позволяет работать как с каждым классификатором отдельно, так и со всеми вместе.

ЭНИ «Грибоедов» и «Пушкин»

ЭНИ «Грибоедов» посвящено жизни и творчеству классика русской литературы А.С. Грибоедову. Оно явилось дальнейшим развитием идей, сформированных при создании ЭНИ «Классификационные системы». Фактически это издание стало полигоном для отработки основных принципов и технологических решений создания ЭНИ.
В работе по созданию ЭНИ, выполненных в 1995-96 гг. принимали участие компания «CompTek International» и ИМЛИ им. А.М.Горького РАН.
ЭНИ «Грибоедов» включало более 15 тысяч страниц печатной информации:
полные тексты всех известных произведений Грибоедова по 5-10 наиболее авторитетным изданиям;
полные тексты более 300 наиболее значимых работ о жизни и творчестве Грибоедова;
библиографию Грибоедова и литературы о нем (около 10 тыс. описаний);
летопись жизни и творчества Грибоедова;
несколько указателей;
около 400 изображений
и ряд других материалов.

В специальном разделе был представлен впервые подготовленный в России в полный словарь языка Грибоедова, содержащий около 13 тыс. лексем и более 130 тыс. словоупотреблений. Для каждой лексемы и словоформы представлены грамматические характеристики, каждое словоупотребление сопровождается контекстом. Полнота и точность представления информации в ЭНИ «Грибоедов» должна в полной мере обеспечить потребности квалифицированного специалиста-филолога.

Информационная система ЭНИ обеспечивает:
работу с полными текстами различных видов,
использование развитой системы гипертекстовых и гипермедийных связей,
различные способы навигации во всем информационном пространстве издания,
эффективные информационные поиски как по произвольным словам (словосочетаниям), так и по различным формальным признакам,
удобный пользовательский интерфейс
и другие возможности.

В качестве для реализации полнотекстового информационного была использована поисковая система «Яндекс».

Подготовка ЭНИ «Пушкин» была приурочена к 200-летнему юбилею поэта. Оно охватывало все творческое наследие Пушкина, сопровождаемое научным комментарием, фундаментальную научную библиографию, наиболее значимые работы о его жизни и творчестве. В ЭНИ были представлены изобразительные материалы (портреты, рисунки, фотографии), а так-же факсимиле пушкинских рукописей. Общий объем информации составил более 20 тыс. печатных страниц текста, около 400 изобразительных материалов и примерно 40 тыс. библиографических описаний.
Работы по подготовке этого издания проводились в рамках программы подготовки Пушкинского юбилея. В реализации проекта помимо нашего отдела принимали участие ИМЛИ им. А.М.Горького РАН, РГГУ, РГБ и Центр ПИК. К работам были также привлечены компании «CompTek International» и «АНЕТ». Работы проводились в два этапа.
На первом (завершение - май 1999 г.) подготовлена тиражируемая на CD-ROM версия электронного издания.
На втором (завершение - декабрь 1999 г.) - подготовлена полная сетевая версия издания.

ЭНИ «Информ-норматив», «Библио-норматив»

ЭНИ «Информ-норматив» было предназначено для обеспечения информационных центров, разработчиков различных информационных и программных продуктов, а также средств вычислительной техники, для специалистов, занятых разработкой стандартов в области информатики и вычислительной техники, комплексной информацией в машиночитаемой форме об отечественных и международных нормативных документов.

Подготовка этого издания осуществлялось в 1996-97 гг. при участии ИПК «Издательство стандартов» и компании «CompTek International». При его создании в полной мере использовались все научно-технические и технологические решения, полученные к тому времени при подготовке ЭНИ «Грибоедов».

В частности, в нем была использована также информационная система и поисковая машина «Яндекс».

Информационная база состояла из четырех частей: стандарты, правовые документы, классификаторы и словари. Первая часть - стандарты, содержала около описания более 2.5 тыс. стандартов, в числе которых стандарты ISO, IEC, CCITT, национальные стандарты США, России и др. Из этого числа около 200 стандартов были представлены полными текстами. Вторая часть - правовые документы, включала около 500 нормативно-правовых актов: законов, указов, постановлений и др., принятых за десять предшествующих лет. Все нормативные акты были представлены полными текстами. Правовые документы были сгруппированы в следующие рубрики: Конституция и конституционные законы, Кодексы, Законы РФ, Акты Президента и Правительства РФ, законы и акты иных органов. Третью часть составили четыре классификационные системы, представленные своими фрагментами, действующими в области информатики и вычислительной техники: ГРНТИ (Государственный рубрикатор научно-технической информации), УДК (Универсальная десятичная классификация), ОКП (Общероссийский классификатор продукции), ОКС (Общероссийский классификатор стандартов). В четвертую группу вошли два словаря по информатике: словарь сокращений и терминологический словарь. Основным источником словарных статей являются терминологические стандарты и терминологические приложения к стандартам.

ЭНИ было тиражировано на CD-ROM в 1997 г. и находилось в коммерческом распространении.

После успешного распространения ЭНИ «Информ-норматив» в 2000 г. было принято решение о подготовке на его основе нового электронного издания.
В программном обеспечении ЭНИ «Библио-норматив» были использованы результаты работ, полученные за годы прошедшие после выпуска предыдущего издания, в частности результаты работ по ЭНИ «Пушкин». Кроме того, был существенно изменен пользовательский интерфейс.
ЭНИ «Библио-норматив» подготавливалось совместно с ВИНИТИ. Оно было тиражировано на CD-ROM и распространялось с конца 2001 г.

ЭНИ «Лермонтов» и «Тургенев»

В продолжения серии изданий на компактных оптических дисках, посвященных классикам русской литературы, в 1999 г. были начаты работы по созданию ЭНИ «Лермонтов» и «Тургенев». Для обоих электронных изданий были проведены подготовительные работы, включавшие разработку структуры изданий и подготовку перечней материалов, подлежащих представлению в электронной форме.
Далее, в 2000-2001 гг., велась подготовка информации для ЭНИ «Лермонтов». Однако, ввиду готовящегося в 2002 г. открытия Фундаментальной электронной библиотеки «Русская литература и фольклор» было принято решение издание на компактном оптическом диске не выпускать, а всю подготовленную информацию разместить в соответствующем разделе электронной библиотеки.
Работы по ЭНИ «Тургенев» из-за недостаточности финансирования продолжения не имели.

Одновременно с рассмотренными работами выполнялся в инициативном порядке проект по созданию коммерческого продукта по русской литературе.
Предполагалось подготовить и выпустить на компактных оптических дисках серию электронных издания, каждое из которых было бы посвящено жизни и деятельности одного из великих русских писателей.
Предполагалось наличие двух пользовательских интерфейсов: на русском и английском языках, что повысило бы интерес к этому проекту зарубежных читателей.
За 2000-2001 гг. разработана концепция и состав серии электронных изданий, подготовлено программное обеспечение и сформирована демонстрационная версия на компактном оптическом диске. Однако отсутствие средств на полномасштабное развитие этого проекта и перевод специалистов, занятых в нем, на подготовку к открытию Фундаментальной электронной библиотеки «Русская литература и фольклор» не позволили продолжить начатые работы.

ЭНИ «Журнал Московской Патриархии»

Незавершенный проект, проводился также в 2000-2001 гг. он предполагал создание полнотекстовой информационно-поисковой системы "Журнал Московской Патриархии". Эта система должна была содержать полные тексты выпусков журнала за все годы его существования, полные тексты всех выпусков «Информационного бюллетеня Московской патриархии» и разнообразные указатели к этим изданиям. Предполагалось, что система будет доступна читателям через интернет, а также будет распространяться на компактных оптических дисках. Работы по проекту закончились созданием демонстрационной версии системы.

Фундаментальная электронная библиотека «Русская литература и фольклор». Электронный фонд русской литературы

Интенсивное развитие информационных технологий и их популярность в обществе, а также положительные результаты работ по преобразованию печатной информации в электронную форму и выпуск электронных научных изданий позволили обоснованно ставить вопрос о создании больших массивов (десятки Гб) проблемно ориентированной информации. В 1999 г. директором ИМЛИ им. А.М. Горького РАН чл.-корр. РАН Ф.Ф. Кузнецовым была высказана идея создания электронного фонда русской литературы.

Основные задачи электронного фонда русской литературы виделись в следующем: создание качественных и доступных электронных массивов текстов, представляющих русскую литературу и фольклор, материалы научных исследований по русской филологии, а также создание программного обеспечения, позволяющего специалистам-филологам работать с этими текстами.

Практическим шагом по реализации этой идеи стало создание Фундаментальной электронной библиотеки «Русская литература и фольклор» (ФЭБ) и начало работ по созданию портала ИМЛИ им. А.М. Горького РАН. Дальнейшая, всесторонняя проработка идеи создания электронного фонда русской литературы привела к существенному расширению задачи и увеличению состава участников.
В итоге была открыта программа Историко-филологического отделения РАН «Филология и информатика: создание системы электронных ресурсов для изучения русского языка, литературы и фольклора» (2003-2005 гг.).
Успешное завершение Программы позволило продолжить работы по перечисленным направлениям в рамках новой программы Историко-филологического отделения РАН на 2006-2008 гг. «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов». Координаторами программы являются: директор ИМЛИ им. А.М. Горького РАН акад. А.Б. Куделин и директор Института лингвистических исследований РАН акад. Н.Н. Казанский.

Электронная библиотека «Нормативная база ГСНТИ»

Успешные концептуальные и программные решения, полученные при создании Фундаментальной электронной библиотеке «Русская литература и фольклор», в 2002 г. привлекли внимание специалистов Минпромнауки РФ и по их инициативе начались разработка электронной библиотеки «Нормативная база ГСНТИ». В создании библиотеки принимали участие специалисты ВИНИТИ.

Данный проект преследовал следующие цели:
информирование широкой общественности о деятельности ГСНТИ
предоставление свободного доступа к текстам официальных документов, регламентирующих деятельность в сфере научно-технической информации, архивного, библиотечного и издательского дела,
повышение эффективности как научных исследований, так и информационной деятельности.

Электронная библиотека состоит из следующих разделов:
Нормативно-правовые документы, регулирующих деятельность в сфере научно-технической информации смежных областях. К ним относятся Федеральные законы, Постановления и Распоряжения Правительства, Указы и Распоряжения Президента, ведомственные и региональные приказы и т. п.
Стандарты двух систем: Государственной системы стандартизации (ГСС) и Системы стандартов по информации, библиотечному и издательскому делу (СИБИД).
Классификаторы и терминологические словари:
Универсальная десятичная классификация
Государственный рубрикатор научно-технической информации
Терминологический словарь по информатике
Англо-русский словарь по информатике.
Термины Юникод.
Термины SGML, HTML, XML.
Публикации
Ссылки

Всего было подготовлено и представлено в библиотеке около 500 полнотекстовых документов, в том числе около 400 нормативно-правовых акта, 60 стандартов, два классификатора и четыре документа типа "справочники-словари".

Работы по информационному наполнению библиотеки продолжались в течение 2003 и 2004 гг. после чего Минпромнауки РФ прекратило финансирование этой работы.

Информационно-аналитической системы «Русская поэзия»

С 2005 г. сотрудники отдела участвуют в работах по созданию информационно-аналитической системы «Русская поэзия» (ИАС РП). Проект ведется при поддержке Российского фонда фундаментальных исследований; руководитель проекта акад. В.Е. Захаров.
В ходе работ отдел участвовал в разработке концепции ИАС РП, проектировании экспериментального варианта первой очереди системы и подготавливали информацию. При этом были сформированы четыре БД:
Personalia - коллекция биографической информации о русских поэтах и ученых, работающих в области поэтологии;
Библиография - библиографический указатель публикаций поэтических произведений и научных работ по поэтологии;
Поэтология - коллекция текстов научных работ по поэтологическим дисциплинам;
Поэзия - коллекция текстов поэтических произведений.
В 2006 г. была подготовлена программно-технологическая база для создания и ведения тезауруса по русской поэзии и сформирована экспериментальная БД.
С 2007 г. осуществляется загрузка информации в систему и формирование тезауруса.

Подготовка информации для сервиса «Яндекс-словари»

В конце 2004 г. следует приглашение компания «Яндекс» участвовать в проекте создания нового раздела (сервиса) портала "Яндекс". Этот раздел должен представлять собой интегрированную словарно-энциклопедическую систему широкого профиля.
Фактически, основной целью проекта является создание электронной библиотеки, которая должна предоставлять пользователям интернета максимально качественную, достоверную и актуальную информацию обо всех сферах жизни человека. Источниками такой информации выступают универсальные и тематические энциклопедии, справочники, различные словари русского языка и иностранных языков. Для структуризации накапливаемой информации разрабатывается рубрикатор контента. Адекватное представление в сети некоторых энциклопедических изданий, в частности обладающих иерархической структурой, потребовало определенной доработки программного обеспечения сервиса.

С января 2006 началась практическая деятельность по подготовки контента. Эта деятельность включает приобретение прав на издание, подготовку информации и публикации ее в разделе «Яндекс-словари». В свою очередь подготовка информации складывается из оцифровки печатного издания, вычитки полученных электронных текстов, разметки информации и преобразование в загрузочные форматы.
В среднем ежемесячно обрабатывается 4-5 книг для раздела «Яндекс-словари».

Электронная библиотека Московского Городского Психолого-Педагогического Университета (psychlib.ru).

Библиотека создана при технической поддержке и по технологии Лаборатории в 2007-м году.

Библиотечная информационная система "БиблиоНавигатор"

В 2009 году разработан движок полнотекстовой информационной системы нового поколения. В нём пользователь видит графические образы страниц печатного издания, а функциональность поиска и импорта сохраняются на уровне текстовых электронных документов. На этой платформе базируется БИС "БиблиоНавигатор". [Подробнее...]

Научная педагогическая электронная библиотека Российской академии образования (elib.gnpbu.ru)

Проект новой Научной педагогической электронной библиотеки направлен на сохранение научного наследия России и уникального опыта в области педагогики и психологии. Электронная библиотека должна предоставить всем заинтересованным лицам свободный доступ к трудам классиков педагогики и психологии, а также к результатам современных исследований в рассматриваемой области.
Проект выполняется НПБ им.К.Д.Ушинского Российской академии образования. [Подробнее...]
Электронная библиотека открылась 4 октября 2013 г. по адресу: http://elib.gnpbu.ru.

* * *
Для внутреннего представления печатного издания в библиотеке используется следующий стек форматов и представлений:
опись издания - файл в формате XML, в котором перечислены все страницы издания, а также разделы оглавления и другие особенности, страничной структурой.
графическое представление страниц издания - последовательность файлов в графическом формате JPG.
текстовое представление издания, мастер-файл - файл в формате HTML; на структуру HTML наложен ряд ограничений, обеспечиваю-щих адекватное представление именно печатного издания.
графические индексы - файлы, в которых хранится постраничная привязка текстовых строк, расположенных на странице, к соответствующим областям графического представления страницы.
Спецификации на формат представления графических индексов разработаны в рамках проекта НПЭБ.
В отношении представления других информационных объектов системы, в частности персоналий и архивных материалов, выбор форматов представления производится по принципу максимальной совместимости с форматами представления изданий.

* * *
Создание и функционирование НПЭБ сопряжено с решением комплекса юридических вопросов, в том числе с вопросом использования результатов интеллектуальной деятельности.
Опыт Российской Федерации по вопросу легитимизации деятельности электронных библиотек базируется на общих нормах ГК РФ, доктринальных работах и концепции совершенствования законодательства РФ об интеллектуальной собственности. В Российской Федерации применяются статьи 1273 и 1274 ГК РФ, действует Бернская Конвенция по охране литературных и художественных произведений, устанавливающая критерий добросовестности, применяются общие положения о добросовестности в соответствии со статьей 401 ГК РФ.
При функционировании НПЭБ предполагается использовать охраняемые объекты (результаты интеллектуальной деятельности): литературные произведения, произведения изобразительного искусства, ноу-хау, программный код, базы данных и другие.

история, электронные библиотеки, электронные книги

Previous post Next post
Up