Интересное исследование для любителей разного рода статистики.
Mathematical Modelling for Japanese Kanji Strokes in Relation to Frequency, Asymmetry and Readings.
http://www.lang.nagoya-u.ac.jp/~ktamaoka/gyouseki/sadokuari/2005/TA2005.pdfАвторы демонстрируют различные распределения по кол-ву штрихов, числу произношений, структуре компонентов в словах на основе иероглифов. В какой-то мере это попытка исследовать сложность письменности на основе кандзи.
В частности, из 1945 базовых кандзи (тех, что были еще до 2010 года):
- 699 кандзи имеют одно произношение (35.94%, из них 667 - только Он, 32 - только Кун).
- Среднее кол-во штрихов с учетом частотности - 8 (статистика бралась по статьям Asahi Shimbun с 1985 по 1998).
- Среднее кол-во штрихов без учета частотности - 12.
- Чем больше кол-во штрихов, тем меньше произношений.