Широко изветстным среди специалистов- аналитиков продуктом группы компаний "Кронос-Информ" является документальная система поиска информации (ДСПИ) «Cros» (
http://www.cronos.ru/cros.html).
Кстати, «Cros» полезен не только аналитикам, но и всем кто так или иначе связан с хранением и обработкой больших оцифрованных массивов текстовой информации. «Cros» может быть полезен в журналистике, маркетинге, социалогии и так далее.
Основное назначение ДСПИ «Cros» - создание и поддержание структурированных архивов - банков документов, полнотекстовый поиск в них документов по запросам и формирование отчетов из найденных фрагментов.
При работе с ДСПИ «Cros» ключевым элементом является
банк документов. В этом банке в сжатом виде хранятся исходные документы, их свойства - атрибуты, а также служебная информация. В процессе работы возможно добавление в банк новых документов - файлов различных текстовых форматов, удаление и экспорт в исходные файлы.
К документам относятся любые файлы текстовых форматов. В общем случае в банке документов могут храниться файлы любых форматов, в том числе графическая информация. Однако для возможности поиска нужных документов по их содержимому формат данных должен быть распознан программой.
ДСПИ «Cros» обеспечивает автоматическое распознавание следующих форматов:
- «Текст» в кодировках DOS (cp 866), Windows (cp 1251), KOI8-R, Unicode (UTF-32 BE/LE не поддерживаются);
- DOC (MS Word 6.0/95, Word 9);
- XLS (MS Excel 5.0/95, 97-2003);
- DOCX (MS Word 2007-2010);
- XLSX (MS Excel 2007-2010);
- PPTX (MS PowerPoint 2007-2010);
- HTML;
- RTF;
- PDF (Спецификации 1.7 или более ранней);
- ODF (OpenDocument Format) - текстовые документы и электронные таблицы.
Атрибуты документов, хранимых в банке, предназначены, в первую очередь, для поиска необходимой информации. Важнейшим атрибутом является содержимое документа, т. е. его текст. Наряду со стандартными атрибутами, обязательно присутствующими для каждого документа, пользователем могут создаваться и дополнительные.
Для оптимизации контроля, автоматизации добавления документов в банк документов и ускорения поиска поддерживается многоуровневая структура банка документов в виде особых разделов -
областей поиска. Области поиска могут содержать документы либо другие (вложенные) области поиска. В целом структура областей поиска схожа с иерархической структурой каталогов (папок) современных операционных систем.
Версия 6.4
Работа над ошибками:
- При добавлении документов Word добавляются лишние пробелы между некоторыми словами
- Исправлены ошибки совместимости с Windows server 2012 R2
- Не отображается часть действий в окне системного журнала
- Исправлена падение программы при одновременной работе нескольких заданий планировщика по загрузке файлов в банк документов.)
- Считывание ключа регистрации при обновлении.
- При работе с файлами формата RTF в окне просмотра не отображался символ длинного тире.
- Исправлена ошибка с индексированием XLSX документов
- Исправлена ошибка отображения фиксируемых действий в окне включения системного журнала
- Исправлена работа запросов при поиске с несколькими условиями с использованием спец. знака * (звёздочка)
Новое:
- Новый формат хранения данных. Банки занимают меньше места, ускорен поиск информации. Банки документов созданные в версии 6.4 создаются в новом формате.
- Поддержка PDF 1.7
- В окно оптимизации добавлен новый параметр "Новый формат хранения данных", для конвертации существующих банков документов в новый/старый формат хранения данных
- UTF-16 BE, UTF-32 BE/LE не поддерживаются
- [Режим "Планировщик заданий"] Изменён интерфейс основного окна;
- [Режим "Планировщик заданий"] Добавлена возможность сортировки заданий по всем столбцам.
- [Режим "Планировщик заданий"] Копирование задания
- [Режим "Планировщик заданий"] Добавлена возможность создание клонов заданий. Для создания одинаковых заданий Планировщика в список заданий добавлено контекстное меню и панель инструментов