В тайском в конце может быть еще [ŋ] и [w], который, как и [j] - глайды.
Что же касается древнеирландского, то глухие согласные звуки в нем не делались звонкими в конце слова, просто в орфографии использовались буквы, обозначающие в современном ирландском звонкие. В современном ирландском орфография уже отображает "правильную" картинку: póc → póg, bec → beag и т.п. (т.е. произношение не изменилось, изменился способ передачи звуков на письме).
Блин, точно, не вспомнил. [w] у нас две штуки, и я их до сих пор на слух не различаю: 1. как часть дифтонга, например, เมา [mau] (пьяный) 2. как нормальная финаль ข้าว [kha:w] (рис)
И спасибо за объхяснение, так становится намного логичнее.
Ирландский - интересно, спасибо. Тайский - и так тренирую каждый день на практике. :)
Хотя сейчас, в контексте изменившейся политической обстановки, надо бы путонхуа дотянуть до приемлемого уровня. А то мало ли что: вдруг, у Неньки с Китаем общая граница появится, бгг.
Ну вот у меня есть насущная проблема, котору я, как ни странно, почему-то не могу решить в Азиях. Речь вот о чём. Есть у меня софт, который превращает тайский текст в IPA. То есть, сперва делает syllabification, а потом уже - дело техники. Никакого словаря нет принципиально, только слоги. Очевидно, код имеет ограничения типа ตากลม, которое может быть как ตา กลม (круглые глаза) или ตาก ลม (ловить ветер). Ну и редупликацию не умеет, очевидно. พัทยา - а читается не [пхат-йа:], как казалось-бы, а [пхат-тха-йа:].
Но в остальном, работает.
Вот енту тулзу хочу расширить на кхмерский и лаосский. Но нигде не нашёл corpus слов, которые заведомо правильно силлабифицированы. В идеале, конечно, мне бы просто набор правил, но я их и из корпуса могу "вычислить".
У меня есть мешок знакомых, которые являются нативными спикерами лаосского и кхмерского. Большинство - грамотные, могут писать-читать. Но вот объяснить и написать корпус, на основании которого я мог бы вывести набор формальных правил - нет таких.
[g] -> в конце слова/слога [k],
[d] -> [t]
В тайском и кхмерском ещё хуже, там в конце слога может быть только стоповая [p/t/k], или назал [m/n], или палатал [j]. И всё. А остальное:
[c/ch/s] -> [t]
[r/l] -> [n]
Reply
Что же касается древнеирландского, то глухие согласные звуки в нем не делались звонкими в конце слова, просто в орфографии использовались буквы, обозначающие в современном ирландском звонкие. В современном ирландском орфография уже отображает "правильную" картинку: póc → póg, bec → beag и т.п. (т.е. произношение не изменилось, изменился способ передачи звуков на письме).
Reply
[w] у нас две штуки, и я их до сих пор на слух не различаю:
1. как часть дифтонга, например, เมา [mau] (пьяный)
2. как нормальная финаль ข้าว [kha:w] (рис)
И спасибо за объхяснение, так становится намного логичнее.
Reply
Reply
Тайский - и так тренирую каждый день на практике. :)
Хотя сейчас, в контексте изменившейся политической обстановки, надо бы путонхуа дотянуть до приемлемого уровня. А то мало ли что: вдруг, у Неньки с Китаем общая граница появится, бгг.
Reply
А про границі - єто ага, тут ни одна гадалка не поможет понять, "что день грядущий нам готовит" :-)))
Reply
Речь вот о чём.
Есть у меня софт, который превращает тайский текст в IPA. То есть, сперва делает syllabification, а потом уже - дело техники.
Никакого словаря нет принципиально, только слоги.
Очевидно, код имеет ограничения типа ตากลม, которое может быть как ตา กลม (круглые глаза) или ตาก ลม (ловить ветер). Ну и редупликацию не умеет, очевидно. พัทยา - а читается не [пхат-йа:], как казалось-бы, а [пхат-тха-йа:].
Но в остальном, работает.
Вот енту тулзу хочу расширить на кхмерский и лаосский. Но нигде не нашёл corpus слов, которые заведомо правильно силлабифицированы.
В идеале, конечно, мне бы просто набор правил, но я их и из корпуса могу "вычислить".
У меня есть мешок знакомых, которые являются нативными спикерами лаосского и кхмерского. Большинство - грамотные, могут писать-читать. Но вот объяснить и написать корпус, на основании которого я мог бы вывести набор формальных правил - нет таких.
Может, подскажете чего? Был бы крайне
Reply
Leave a comment