Leave a comment

Comments 4

kincajou October 26 2010, 08:34:24 UTC
там и "Связанные записи" такие же бессвязные.
А секрет прост. Я ещё в прошлом веке слышал программу, которая лабает как бы осмысленные тексты, просто пробегая по достаточно большому объёму исходного массива данных, которым может быть книга. Принцип работы элементарен: находится слово-вхождение, затем программа его ищет второй раз (в том же виде) и смотрит на следующее за ним слово. Затем следующее ищется второй раз, и берётся уже следующее за найденным. И так далее. Почти безошибочно получается "связная" речь с согласованными падежами и т.п., но абсолютная бессмыслица при этом

Reply

rainy_sunny October 26 2010, 08:40:27 UTC
Тьфу, а я ведь читал об этой штуке на днях, но почему-то подумал, что она работает сомнительно и можно ещё как-то по-другому. А ведь, наверное, это то, что надо.

Reply

rainy_sunny October 29 2010, 10:55:41 UTC
>находится слово-вхождение, затем программа его ищет второй раз (в том же виде) и смотрит на следующее за ним слово. Затем следующее ищется второй раз, и берётся уже следующее за найденным

Я что-то не понимаю: ведь в таком случае в копипасте не будет встречаться таких двухсловных словосочетаний, которые не встречаются в самом тексте. Например, в каком тексте может встретиться "управленческая косоворотка" или "изъявлявшая канифоль"? Или я что-то недопонял?

Reply

kincajou October 29 2010, 17:08:01 UTC
Значмит, алгоритм чуточку усложнён и ищет, например, следующее слово по словарю (в смысле, вместо "чебоксар" он вставит "чебуреки"). Или рифму. Или из словаря синонимов.

Reply


Leave a comment

Up