Халява

Jan 04, 2008 11:19


На последнем Localization World довольно много обсуждалась тема Community Translation и как использование энтузиастов позволяет сэкономить на услугах профессиональных переводчиков. Другим направлением экономии предлагается машинный перевод. Имея в виду совершенно очевидные недостатки машинного перевода, никто особо не настаивал на его использовании: рассматривались, скорее, варианты "что бы такого сделать, чтобы меньше платить переводчикам" (с очевидными ответами).

С community-based translations не все так очевидно: тут пока не попробуешь - не узнаешь. Если слушать Sun Microsystems и Google, то все расчудесно: энтузиасты все переводят, потом профессионалы проверяют, а на выходе получается хороший перевод.

В реальности все не совсем так. Иногда получается, иногда нет. Суть моего первый проекта с Гуглом состоял в том, чтобы проанализировать качество перевода уже существующего компонента, выпущенного на 12 языках. Пользователи практически всех языков жаловались на качество, и нужно было выяснить, что правда, а что нет. Результаты были примерно такими:
  • 3 языка были чудовищными. Арабы призывали к физической расправе над переводчиками (я не шучу).
  • Еще три языка были просто плохими, включая русский. Переводом нельзя было пользоваться.
  • Два языка имели сомнительное качество, но в целом продуктом можно было пользоваться.
  • Остальные переводы были ничего себе...

То есть, примерно половину языков пришлось переделывать заново, еще пара языков требовала доводки, остальные просто подчистили. Картина, кстати, не самая плохая: нексолько подобных экспериментов с использованием сети партнеров и студентов-добровольцев просто провалились.

Означает ли это, что результатом community-based translation всегда будет плохой или посредственный результат? - Не обязательно: еще фон-Нейман писал о том, как создать надежную систему из ненадежных элементов.
Но надеяться на то, что на халявных переводах можно создать нормальную бизнес-модель - это очень сильно рисковать. Гугл с его бабками может себе позволить рисковать, но удивительно то, что они - после стольких лет - так ничему и не научились. Читаем сегодняшний пост Олега Козырева "причуды толерантности":

"в аккаунте на YouTube в профиле только три варианта семейного положения можно выбрать:
- не женат/ не замужем
- встречаюсь
- в поиске
женатые, видимо, не предусмотрены (как и те, кто не ищет)"

Смотрим английский оригинал и видим три варианта:
- single
- taken
- open
То есть, "не женат/не замужем", "женат/замужем", "в поиске". Сэкономили и на халяву получили геморрой. Международного скандала, конечно, не выйдет, но на месте Гугла я бы таки заплатил баксов 20, чтобы кто-нибудь им проверил бы русский перевод Youtube.

machine translation, бардак, халява, localization, google

Previous post Next post
Up