Отличную
статейку в Сайнсе накатали на той неделе ребята из Гарварда. Гугл сделал
новый сервис - можно строить график по встречаемости заданного слова во всех отсканированных книгах мира (это около 5 миллионов книг, примерно 4% от всех книг за всю историю). Ну ребята поигрались с этим сервисом, со всякими интересными словами и сравнениями и
(
Read more... )
Comments 11
http://ngrams.googlelabs.com/graph?content=body%2Csoul&year_start=1800&year_end=2000&corpus=0&smoothing=3
http://ngrams.googlelabs.com/graph?content=%D1%82%D0%B5%D0%BB%D0%BE%2C%D0%B4%D1%83%D1%88%D0%B0&year_start=1800&year_end=2000&corpus=12&smoothing=3
Reply
Как освоение стадистики?
Reply
а стадистика ждет пока своего часа... много дел, много пациентов... вот послезавтра наступят праздники, и можно взяться за освоение) хотя более важно пока глубокое освоение шизофрении - перечитываю ночами учебники по психиатрии.
Reply
Круто, уже прямо пациенты... то есть ты уже так хорошо знаешь испанский? или там не надо хорошо знать? А они сильно от наших, отечественных пациентов отличаются?
Reply
http://ngrams.googlelabs.com/graph?content=прийти%2C+приехать&year_start=1800&year_end=2000&corpus=12&smoothing=3
Reply
Но все равно игрушка клевая;)
http://ngrams.googlelabs.com/graph?content=%D0%BF%D1%80%D0%B8%D0%B4%D1%82%D0%B8,+%D0%BF%D1%80%D0%B8%D0%B9%D1%82%D0%B8&year_start=1800&year_end=2000&corpus=12&smoothing=3
Reply
Слово "Бог" нужни было искать с твердым знаком на конце!
Вообще очень интересно получается, если искать слова так, как они писались до революции. Например, "Дворец" и "Дворецъ". Жалко, что никаких старых букв, кроме Ъ на раскалдке нету.
Reply
( ... )
Reply
Да... сыроватый продукт, сыроватый, но думаю что гугло-менеджеры этого и добивались своей совместной статьей с гарвардцами. Сделали сервис, написали статью в одном из самых влиятельных журналов и все тестировщики мира нервно курят в уголке, тонны писем с находками всяких багов:)
Reply
я нашла чудесный словарь, который любое слово переводит в дореволюционую орфографию. И пыталась через эту гугл-систему что-то искать с 'ять', но нифига не получилось.
Может просто браузер не распознает, или баг в системе.
Ну да, статью в Сайенс про такой незамысловатый сервис - это прикольно. С другой стороны, это ж столько работы, создать базу данных! Так что может они и заслуживают.
Reply
Leave a comment