Разбор чтений японских иероглифов по косточкам

Dec 30, 2010 19:16

Как-то в процессе совершенствования программы для изучения японского у меня возникла идея собрать небольшую статистику по чтениям иероглифов. Например, какое количество кандзи имеет только ON чтения и совсем не имеет KUN чтений? Какие чтения наиболее часто используются, а какие встречаются только у одного кандзи? И так далее. В итоге, кое-что получилось =) Например, если брать выборку из 1945 штук (старый Jouyou набор), то получается следующее:

Всего одно ON чтение имеют 1460 кандзи
2 ON чтения имеют 401 кандзи
3 ON чтения имеют 63 кандзи
4 ON чтения имеют 11 кандзи
5 ON чтений имеют 5 кандзи
5 иероглифов имеют только KUN чтения: 込, 枠, 畑, 峠, 匁
375 иероглифов имеют только ON чтения...

Также, я построил таблицу всех иероглифов, сгруппированных по конкретным чтениям и отсортированных по порядку изучения в школе и по частоте встречаемости. А также таблицу, где можно посмотреть, какие конкретно иероглифы сколько разных ON чтений имеют.



Если навести мышкой на любой иероглиф - можно посмотреть его толкование.

Нужно теперь выучить все уникальные чтения, которые встречаются только у одного кандзи =)

Хотелось бы отметить, что собранная статистика точна лишь на определенный процент, т.к. не учитывает, к примеру, изменения чтения в зависимости от того, какое это сочетание (はん->ぱん, и так далее).

PS. Надо бы придумать что-нибудь еще... Поиграться с KUN чтениями или другими параметрами. Может быть у кого-нибудь есть идеи?

PPS. Google Chrome не совсем корректно отображает таблицу. Но это его проблемы, ибо во всех остальных браузерах всё ок.

японский язык, мысли, программирование, мои статьи

Previous post Next post
Up