Преамбула такая. Я делаю сервис, который занимается извлечением ключевых атрибутов из слабоструктурированных текстов. Предметная область - нормативно-справочная информация, машиностроение.
Делаю для себя, так как периодически возникает необходимость поискать какой-то фрагмент текста в больших текстовых файлах (гигабайты или десятки гигабайтов). Текущая версия - макет с минимальным функцилналом.
1. Редактор Оценок - десктопная прога на C# WinForms, работающая с текстами в БД SQLite. Позволяет быстро расставлять и редактировать оценки, а также выгружать корпус в текстовый формат (CSV с табуляцией в качестве разделителя
( Read more... )