Mar 15, 2023 14:56
Первые впечатления от GPT-4: он заметно "умнее" GPT-3.5 (предыдущей версии ChatGPT).
Я просмотрел записанные у меня скриншоты "фейлов" GPT-3.5, и выбрал четыре ярких примера. На всех четырех GPT-4 сработал на отлично или очень хорошо.
Задания были: знаменитый шахматный этюд Рети (я отзеркалил его, так, чтобы расположение фигур не встречалось в данных для тренировки или как минимум очень редко), и объяснить три разных неприличных анекдота.
На этюд он вначале дал неправильный первый ход; когда я спросил, что делать после ответа черных, он извинился, передумал и дал правильную последовательность ходов, причем хорошо объясняя смысл каждого хода (!). GPT-3 вообще не мог найти ни одного правильного хода, и быстро терял понимание того, где находятся фигуры на доске.
На каждый из трех анекдотов GPT-4 объяснил, в чем игра слов, там, где она была, и конфликт контекстов, делающий анекдот смешным. Предыдущая версия галлюцинировала несуществующие каламбуры и не замечала настоящие.
Список вопросов и ответов GPT-4 в комментариях.
Погрешности: неправильное первоначальное решение в этюде. В ответе на первый анекдот GPT-4 сгаллюционировал несуществующее слово "seman", но при этом суть юмора и игры слов правильно уловил и описал. Вроде все.
искусственный интеллект