Из первых рук (Сэм Альтман) про ГПТ

Apr 09, 2023 18:48

image Click to view



Начал смотреть интервью Сэма Альтмана Лексу Фридману. Так как там почти 3 часа то смотреть придется точно частями. Посмотрел условно говоря первую треть до 47-й минуты. Запишу что мне показалось интересным в этой части.

1. Когда они создали компанию и объявили свою цель (создание сильного ИИ) их все, включая специалистов, посчитали фриками. Говоря откровенно, я тоже что-то слышал в то время про создание, и тоже подумал что какие-то малоизвестные люди собираются построить ИИ, не работая в Гугле, Микрософте или Фейсбуке. Ерунда какая-то. У них же нет ни мощностей ИИ-гигантов, ни, что намного более важно, накопленных данных для обучения.

2. Процесс алайнмента(доброжелательности к человеку) вовсе не ортогонален производительности. Те системы (ГПТ-3) которые получались после обучения из ящика, были малопригодными и извлечь из них их способности было сложно. То есть дообучение с использованием мнения людей про ответы ИИ не просто повысило безопасность, но повысило и эффективность моделей.

3. Объем этого самого дообучения с помощью человека удивительно скромный по сравнению с основным тренингом. Это собственно было известно, но факт стоит отрефлексировать еще раз - дообучать эти системы с помощью людей это недорогая часть.

4. По поводу, из чего состоял дата сет для ГПТ-4, конкретики не было дано. Исходя из общих фраз - сама подборка тренировочного сета это гораздо более важная часть чем многим кажется. В ГПТ модели вовсе не тащили весь интернет.

5. ГПТ-4 была натренирована уже в конце лета 2022 (чат ГПТ - на предыдущей версии, напомню, публике был предложен лишь в конце ноября 2022). После чего они изучали её возможности и как извлекать пользу. У них в компании есть люди которые месяцами по 12 часов в день колдуют над промптом и смотрят на результаты. То есть промпт-инженеринг это не будущая, а уже текущая профессия.

6. Был намек, что специалисты компании уже используют возможности ГПТ-4 в своей повседневной работе как помощника и это существенно повысило их производительность. То есть программирование уже трансформировалось, и да, ГПТ 4 по сути сейчас работает вместе с людьми, чтобы делать следующее поколение продукта.

7. Вопрос о размере сети ГПТ-4 был обойден, но судя по всему те, кто говорил про увеличении числа параметров попали в молоко. То есть размер сети ГПТ-4 вовсе не 100 триллионов, как предсказывалось многими.

8. Что однако очень важно: по словам Альтмана в процессе работы над ГПТ-4 было придумано столько разных мелочей в каждой строке пайплайна разработки, что количество перешло в качество. И как я понимаю, Альтман намекает на то, что повторить это кому то со стороны будет архисложно. Множество придумок, мелочей и секретиков. Другими словами, другие конторы, включая ИИ гигантов, не смогут выдать аналог ГПТ-4 с нуля в разумное время даже если бросят гигантские деньги. Им придется все это придумать и внедрить по каждой мелочи. Ну как бы только ленивый не высказал версию что известное письмо про то, что надо остановить ИИ-разработки хотя бы на 6 месяцев, появилось неслучайно. Open AI уже похоже действительно не догнать.

Просмотр и Продолжение следует

9. По поводу публичных ботов и вопросов на которые ИИ не стоит отвечать. В компании работают над системой которая будет распознавать неправильные вопросы(и посылать пользователя) но она пока сырая.

10. Тезис - для построения AGI больщих языковых моделей с точки зрения Альтмана скорее всего будет недостаточно. Надо будет придумать что-то еще, и никто не знает, в чем заключается это самое еще. Но, с другой стороны Альтмана и не удивит, если какой-нибудь ГПТ-10 окажется искомым AGI прямо из коробки.

11. Более того, мы может быть никогда и не построим AGI но вместо мы как минимум получим инструмент который очень сильно усиливает именно наши естественные человеческие возможности. То есть важны не шашечки, а именно ехать. У нас есть желание облегчить нашу жизнь и усилить наши возможности. Если такие инструменты добьются хотя бы этого, сие будет уже очень-очень неплохо.

12. Супер-интеллект в понимании Альтмана обязательно должен сам уметь придумывать что-то новое. Новые научные концепции и теории. Недостаточно компилировать лишь старое и известное, хотя и в этом куске еще конь не валялся.

deep learning

Previous post Next post
Up