Прощай, Википедия:)

Jul 10, 2009 09:45

Я тут увидел СТРАШНОЕ (авторская орфография):
ycnokoutellb wrote: Кстати, Константин, мне люди пишут чтобы я обязательно начал править Вики - вы там еще активно учавствуете?
konstkaras wrote: Не участвую, надоело. Но за советами можно.
ycnokoutellb wrote: В приниципе Википедия довольно объективна, если смотреть в общем, а не на детали. Но некоторые ( Read more... )

Тоиди Копсу

Leave a comment

Re: Бани. kisa_i_osya July 11 2009, 16:05:14 UTC
Отчасти ;-)

На самом деле, что касается применения статистических методик к Фоменко придраться сложно. Антифоменковцы не зря дружно ругают что угодно, но только не его статметоды (возможно, еще и по причине сугубо гуманитарного образования). К его статистике, фактически, можно выдвинуть только одну реальную претензию -- странные методы нормализации очень рыхлого статматериала. Тут, правда, неясно можно ли и как сделать иначе.

И результат в общем таки да: в полученном Фоменко массиве статистических данных есть странные артефакты. Это факт. Другое дело, что не стоит воспринимать это как даже намек на историческое исследование, чем эти артефакты объясняются -- сугубо неясно. Тут уже открывается простор для интерпретаций. Фоменко предпочел "короикую историю", но почти так же можно было бы доказать, например, прямое божественное вмешательство или найти корреляции между династиями и верблюдами. Вообще, интерпретация статистики -- тема сложная, там самое главное уметь вовремя остановиться ;-)

Но и отказываться от статистики тоже глупо. У меня сейчас цель простая совсем: понять какие слова встречаются чаще и встречаются "не просто так", а по какой-то причине (на этом этапе совершенно неважно по какой -- то ли это общеупотребительный предлог будет, то ли в корпусе окажется много текстов, живописующих "бани" или "коней", то ли еще почему). Это уже потом, имея фактуру вида "в 90% книг корпуса такого-то слова "баня" и "пиво" сильно связаны в статистическом смысле" можно начинать думать "а почему они связаны?". А пока мы этого не значем, наш удел -- спекуляции, основанные, по сути, на личных вкусах.

Reply

Re: Бани. vostlit July 11 2009, 16:17:00 UTC
Проблема Фоменко - объединение в исследуемый массив неоднородных данных. Если грубо говоря взять среднее арифметическое количества блох на отдельной собаке и количества рыб в ближайшем водоеме - то тоже при известном желании, зажав нос и выключив свет, найти и скорость света и число пи и время правления фараона павлика 5... Он слишком поздно понял что летописи - не базы данных..

Reply

Re: Бани. kisa_i_osya July 11 2009, 16:27:35 UTC
Не, там хитрее. Проблема среднего она с давних времен известна, с летописями он все свои фокусы не на пустом месте придумывал, а именно, чтобы найти некоторый инвариант, который позволил бы это решить. У них с товарищем (забыл как его друга звали) есть попутное исследование забавное, где они нашли инвариант, который можно задействовать при определении авторства: не словарный запас, не стиль, не частотник, а, если правильно помню, число предлогов на длину заданного фрагмента текста. А на самом деле все апросто: на таком уровне человек своим мозгом уже в общем-то не в состоянии достоверно подделать данные, даже если имитирует стиль.

Reply

Re: Бани. vostlit July 11 2009, 16:40:31 UTC
Почему-то он не попробовал свой метод на действительно тяжелых случаях типа рукописи войнича.

Reply

Re: Бани. kisa_i_osya July 11 2009, 17:08:16 UTC
На Шолохове пробовал, я так понимаю, тогда именно он на слуху в основном был (начало 90-х все же, народ еще верит печатному слову и фамилию Шолохов помнит 8).

Reply


Leave a comment

Up