Там развесистость в смысле деления на категории. Слова - отдельно, семантическое ядро - отдельно, "стоп-слова" - отдельно. Удобней пользоваться. Ну и общая статистика: слов, значимых слов, символов, повторов, ошибок и т.п.. Тоже интересно.
Посмотрел. По-моему -- не очень, поскольку: считает как-то сомнительно. Смотрите, по тому рассказу, который я приводил в качестве примера: первый анализатор - "девушка" - 15; второй анализатор - "девушка" -- 22. По статистике Ворд -- 16. ;-)
Не говоря уже о том. что что такое "Семантическое ядро", "Классическая тошнота документа" и прочее умствование... Нет, больше -- не всегда -- лучшЕ!
А можно делать проще и использовать ворд)) Он точно так же неплохо считает, хотя все проблемные словечки приходится вбивать собственноручно) Зато подсчет происходит во всем тексте, а не в кусочках по 60кб)
Посмотрите предыдущий пост на эту тему (ссылка в начале), там как раз про Ворд... ;-) Этот подход как раз и хорош для самопроверки, а для известных проблем -- да, Ворд в процессе правки, еще ДО данной процедуры...
А мне -- меньше! Ибо -- считает как-то сомнительно. Смотрите, по тому рассказу, который я приводил в качестве примера: первый анализатор - "девушка" - 15; второй анализатор - "девушка" -- 22. По статистике Ворд -- 16. ;-)
Не говоря уже о том. что что такое "Семантическое ядро", "Классическая тошнота документа" и прочее умствование... Нет, больше -- не всегда -- лучшЕ!
Вот не уверена. Ловить такие вещи надо, да, но порой попытка заменить как или что на нечто иное приводит к противоположному результату: на гладком предложении появляется горб неуместного слова.
Я бы сказал, что (по большей части) выявив проблемы надо не слово менять (или не только слово), а посмотреть на структуру речи. Чаще всего "навязчивые повторы" означают зависание автора вокруг какой-то из своих языковых проблем.
Comments 22
Reply
Reply
Reply
По статистике Ворд -- 16. ;-)
Не говоря уже о том. что что такое "Семантическое ядро", "Классическая тошнота документа" и прочее умствование... Нет, больше -- не всегда -- лучшЕ!
Reply
Или нашли у меня?)
Reply
Reply
Reply
Reply
Reply
Кстати, хорошая идея насчет многоточий)) Пойду у себя подсчитаю)) А то грешу ими. Ох как грешу)
Reply
Reply
Reply
По статистике Ворд -- 16. ;-)
Не говоря уже о том. что что такое "Семантическое ядро", "Классическая тошнота документа" и прочее умствование... Нет, больше -- не всегда -- лучшЕ!
Reply
Reply
Reply
Leave a comment