Закрытие темы полноценного машинного перевода

Aug 07, 2014 18:52

Народ с надеждой смотрит на компьютерщиков - ну когда же наконец они изобретут свой хвалёный искусственный интеллект, чтобы он нам нормально переводил тексты с одного языка на другой, а не так как сейчас, тупо и убого ( Read more... )

вынос мозга

Leave a comment

maslyaev August 16 2014, 10:31:44 UTC
Извиняюсь за задержку с ответом. С моей стороны, конечно, было свинством постить спорную измышлятину непосредственно перед уходом в оффлайн на неделю.

Собранный в кучу ворох текстов - это не контекст. Вернее, конечно, контекст, но совсем не тот, который нужен. Контекст - это в первую очередь среда обитания того существа, которое принимает сигнал и получает из него информацию.

Моя любимая иллюстрация на эту тему - шагающий экскаватор. Для него (вернее, для его управляющей системы) понятия "препятствие на пути" и "нога застряла" - естественные. А вот понятие "вкусный борщ" - не естественное. Допустим, мы сделали экскаватор не только шагающим, но и чихающим. То есть когда засоряется воздухозаборник, резко подаётся воздух "в обратку", и засор прочищается. У такого экскаватора понятие "чихать" становится тоже естественным, и он может получить специальные управляющие схемы, которые распознают сигнал о том, что рядом кто-то чихает (хотя бы даже водитель экскаватора), и заранее накачивают давление в специальный баллон, чтобы при необходимости сразу без задержки чихнуть. Таким образом, тупая железная громадина получает ещё одно человеческое свойство, притом получает не какую-то убогую имитацию. Всё по-настоящему.

Передвижение на ножках и чихание - это просто и понятно, но что такое нужно прикрутить к железяке, чтобы она естественным образом врубилась в то, что пушистый котёнок - очень милый объект, а усатый таракан - редкостная гадость, я себе не очень представляю. А ведь для того, чтобы получить полноценный человеческий контекст, железяка должна обрести миллионы человеческих свойств, которые нам даже в голову не приходит осмысливать потому что мы их в силу своего образа жизни считаем само собой разумеющимися вещами.

Когда переводчик осваивает новый язык, ему всего лишь нужно освоить новую для него знаковую систему обозначения вещей, с которыми он уже знаком потому что они составляют его среду обитания и его собственную сущность.

Готовы ли мы пустить в наш мир искусственных существ, имеющих ту же самую сущность, что и мы сами? Живущих в тех же пространственных временных масштабах, что и мы сами? Имеющих те же самые цели интересы, что и мы сами? Мне кажется, что нет. Хотя бы потому, что это совершенно бессмысленное действие. Получив наш контекст, искусственное существо неизбежно "в нагрузку" получит и наши слабости. Например, начнёт тормозить, лениться и вредничать. Попытка "отключить" слабость приведёт к тому, что сразу снизится качество решаемой задачи. Существо, не знающее, что такое лень, никогда качественно не переведёт "Обломова".

Reply

vitus_wagner August 16 2014, 11:54:21 UTC
Да, конечно, ворох текстов - это плохой контекст. Но даже такой контекст позволил существенно улучишть машинный перевод.

Далее. не следует недооценивать принципиальную разницу контекстов разных человеческих культур. Литературы о том, почему русские (или американские) привычки не работают в Китае или Японии, или европейские - в Америке написано море.

Рекомендую почитать. Например овчинниковские "Ветку сакуры" и "Корни дуба".

Плюс к тому, имеется огромное количество профессиональных контекстов. У меня есть несколько знакомых по ЖЖ переводчиков, которые регулярно пользуются помощью френдов для того чтобы въехать в контекст предметной области переводимой книги. Вот переводит, к примеру, человек мемуары английского командира торпедного катера. А там вполне понятные и милые английские слова означают что-то совсем не то.

Ну и вообще, любой контекст, которым владеет человек-переводчик был им усвоен за его жизнь, то есть первые десятки человеко-лет.

Что касается того, готовы люди или нет впустить в свою жизнь ИИ - да кто их спросит! Обяхательно найдутся люди, которые сочтут это удобным и выгодным. И остановить не удастся. Как не удалось остановить массовую автомобилизацию со всеми ее недостатками, ubiquitous surveillance и прочие уродливые плоды технического прогресса.

И то, что компьютеры от этого начнут врать и тормозить человечество совершенно не остановит. Компьютеры уже тормозят. Ну и что?

Reply

maslyaev August 16 2014, 13:11:17 UTC
Дополнительные контексты, осваиваемые переводчиком для перевода всяких специфических текстов - очень маленькие верхушечки айсберга. Даже какая-нибудь молекулярная биология, которая вообще кажется тёмным лесом без единой звёздочки - тоже всего лишь верхушечка, базирующаяся на гигантском объёме того, что кажется нам само собой разумеющимся и имеется у нас по праву рождения.

Нам, живущим в пространстве, не нужно объяснять, что такое пространство, хотя это пипец как нетривиально. Алгоритм, выполняющий преобразование строк символов (например, компилятор C++), сколь бы он ни был интеллектуальным, не является существом, обитающим в нашем грешном трёхмерном пространстве. Мы все интуитивно понимаем, что такое время. Мы все понимаем, что значит "больно", и чем это отличается от "кисло". Для нас причины, следствия и то, чем первое отличается от второго - самоочевидные вещи. "Боюсь, я не смогу это объяснить" - фраза, которая понятна, но понятна она в первую очередь потому, что человек, её читающий, является существом, которое:
- имеет способность бояться (то есть попадать в ситуации, когда оно не может предотвратить нежелательные события);
- общается с себе подобными (то есть что-то кому-то объясняет);
- делит события на желательные и нежелательные;
- проводит логическую границу между собой и внешним миром;
- обладает целенаправленным поведением, то есть воздействует на мир в интересах достижения результата;
- ... и так далее тысячи пунктов, большинство из которых нам даже понять трудно, потому что они описывают проблемы и непонятки, само существование которых нам кажется абсурдом.

Даже малозначительные отличия в сущностях существ со страшной силой разрушают контекст. Например, люди и кошки - существа, сущность которых почти идентична. С точки зрения каких-нибудь разумных вихрей Сатурна, взявшихся изучать устройство соседних планет, было бы совсем не понятно, с какой радости людей и котов следует считать разными объектами, а не вариацией одного и того же. Несмотря на то, что у людей и котов есть мегатонны общих "само собой разумеющихся" контекстов, полноценное общение, тем не менее, чрезвычайно затруднено. Тех различий, которые бы показались внешнему наблюдателю сущей ерундой, уже достаточно для того, чтобы привести к непроходимому взаимонепониманию в большинстве ситуаций.

Но, конечно же, дело не в чудовищной сложности создания общего контекста. Думаю, конструировать существ, функционирующих на тех же принципах, что и мы сами (и коты, конечно, и муравьи, и экосистемы, и растения и т.п.) люди довольно скоро научатся. Ничего запредельно сложного в этом нет. Нужно только немножко привести миропонимание в порядок. Основная проблема в том, что, получив колоссальнейший простор для творчества, мы в качестве оборотной стороны медали получим наглядное понимание того, что вариативность решений настолько велика, что попасть в конкретное решение, которое можно было бы считать человеком (а это есть необходимое условие качественного перевода текстов) - вообще без шансов. Да и не нужно это никому. Задача того не стоит. Есть гораздо более интересные и нужные задачи.

Reply

vitus_wagner August 16 2014, 13:23:42 UTC
Нет абсолютно никакой необходимости, чтобы искусственное сущетство можно было считать человеком для того, чтобы оно могло качественно переводить с одного человеческого языка на другой тексты про людей.

Точно так же как переводчику мемуаров моряка не требуется самому быть моряком. Хотя консультант, разбирающийся в морском деле бывает нужен.

Да, естественно, это существо должно уметь оперировать базовыми для человека категориями пространства, времени, социальных отношений.

Но это, вообще говоря, нужно не только и не столько для перевода текстов. Для деятельности какой-нибудь Siri - то есть цифрового ассистента, расширителя сознания, это тоже нужно. Цифровой помощник должен общаться с человеком на естественном языке. Поэтому освоение этого контекста программами неизбежно. А качественный машинный перевод будет побочным эффектом. Точно так же как нынешний прогресс в этой области - побочный эффект существования поисковых машин.

Вообще не надо переоценивать сложность и уникальнгость человека. Это не образ божий. это наглая и самодовоольная обезьяна, которая не в состоянии понять кота только потому что не хочет поверить в то, что у другого существа могут быть какие-то отличия. Коты, конечно, тоже твари наглые и самодовольные, но когда от этого зависит их еда или безопасность, они прекрасно понимают людей.

Что касается пространства и времени то я имею огромный массив наблюдений над людьми, позволяющий утверждать, что 90% горожан не понимают ни того, ни другого. Про время у меня в ЖЖ есть целая серия постов с соответствующим тегом. Дискуссии там крайне показательны.

Reply

maslyaev August 16 2014, 14:27:22 UTC
Если существо (не важно, естественное или искусственное) не человек, оно, возможно, сможет переводить тексты. Но переводить не через понимание, а через применение таблиц соответствия строк символов. Переводчику мемуаров моряка достаточно небольшой таблицы, а всё остальное у него уже есть. Но именно в той части, где применяется таблица, и будет основная масса косяков перевода. Поэтому переведённые мемуары моряка неплохо бывает отдать на вычитку именно тому, кто в курсе морской темы.

Насчёт сложности - полностью согласен. Но с уникальностью есть засада: можно легко скопировать чёрный квадрат Малевича, но добиться того, чтобы копия была чёрным квадратом именно Малевича - никак невозможно.

С пространством и временем, а также с дремучестью населения по этим темам, Вы слишком мягко выразились. 90% - слишком оптимистичная оценка. На самом деле, здесь примерно сто процентов. Темы действительно убийственно сложные и, что-то мне подсказывает, не понятные вообще никому. Например, я в одной книжке вычитал очень элегантное доказательство того, что время - абсолютно статичная вещь. То есть оно вообще никак не течёт. Но как это совместить это с собственной интуицией времени, мне пока что совсем не понятно.

Reply


Leave a comment

Up