Полный
перепост материала РИАН:
Российская система интеллектуального анализа текстов выходит на рынок
13:2215.04.2015 (обновлено: 13:23 15.04.2015)683110
В Объединенной приборостроительной корпорации сообщили, среди задач, которые способен решать лингвистический процессор Ontosminer - поиск необходимых сведений, мониторинг СМИ, анализ больших массивов данных, систематизация документооборота и информации.
МОСКВА, 15 апр - РИА Новости. Первую российскую систему интеллектуального анализа текстов и данных выводят на рынок, сообщили РИА Новости в Объединенной приборостроительной корпорации («ОПК», входит в Ростех).
Как пояснили в «ОПК», сфера возможного применения лингвистического процессора Ontosminer, совместной разработки с российской компанией «Авикомп Сервисез», очень широка. Среди задач, которые он способен решать - поиск необходимых сведений, мониторинг СМИ, анализ больших массивов данных, систематизация документооборота и информации (статистической, научно-технической, правовой, медицинской и т.д.).
«Это еще одна ступень на пути к созданию искусственного интеллекта. Мы научили машину понимать и анализировать письменную речь, извлекать из нее необходимые факты и смыслы», - отметил директор департамента инновационного развития «Объединенной приборостроительной корпорации» Александр Калинин.
Система позволяет компьютеру «чувствовать» морфологию, синтаксис языка, «понимать» семантику отдельных слов и текста в целом. В качестве эксперимента с сегодняшнего дня тестовая версия программы открыта для вузов и научно-исследовательских учреждений в бесплатном режиме. Заказчиками системы также выступает ряд государственных ведомств.
«В отличие от традиционных поисковых систем в качестве запроса здесь выступает не отдельное слово, а целый документ (отрывок текста, статья и т.д.), после загрузки которого система выдает все, что есть на заданную тему в информационном пространстве», - пояснили в «ОПК».
В настоящий момент, отмечают в корпорации, в «голове» у лингвистического процессора - десятки миллионов документов. Планируется довести их число до нескольких сотен миллионов
Если быть честным то не ясно даже идёт ли речь о чём-то вроде Базы данных, куда вносятся тексты с семантической разметкой (которую проводит неведомо кто и неведомо как) или речь идёт о ПО, которое позволяет владельцу (если ПО станут продавать) самостоятельно собирать большие массивы данных с самостоятельным извлечением из них семантики силами ПО без персонала владельца базы
Запись опубликована
Планета е-книг. You can comment here or
there.