Очень интересные статьи о гугловском Gemini и о AI вообще

Feb 28, 2024 14:07

Первая статья больше концентрируется на том, что было не так с гугловским Gemini (плюс кое-что ешё, скажем, оказывается, в ИИ Майкрософта снова начала всплывать психопатичная "Сидни").

The Gemini Incident

Вторая это скорее более общие обсуждения насчет ИИ, корпораций, и проблесках тревожного будущего.

The Gemini Incident ContinuesОбе весьма ( Read more... )

ИИ

Leave a comment

eugene_gu February 29 2024, 04:36:56 UTC
> почему Midjourney не умеет рисовать реальное оружие
---
Меня больше всего удивляет неумение рисовать буквы и цифры.
Глаза умеет, лица умеет... но куда как более простые и формализованные знаки - никак.
Даже абракадабру "по-мотивам" не может.


Reply

r3po February 29 2024, 06:42:39 UTC
А он не умеет читать. В смысле не понимает, что буквы это часть текста. Для него это что-то вроде орнамента.
Это все равно как сейчас попросить случайного человека с улицы написать что нибудь на древнеегипетском. Каждый много раз видел эти надписи, по памяти можно попытаться нарисовать какие-то крючки, полосочки, что-то там птичка, потом глаз, потом рыбка. Но для любого египтолога это надпись будет выглядеть как то, что на картинке.

Reply

eugene_gu February 29 2024, 13:59:57 UTC
Пусть и не умеет читать, но хотя бы иметь банк символов из цифр и латинских букв для исполнения "орнамента" он вполне может.

Reply

r3po February 29 2024, 16:15:00 UTC
Может. Но его учат именно рисовать, а не собирать картинку из готовых кубиков с фрагментами изображений.

Reply

eugene_gu February 29 2024, 17:12:31 UTC
Благодарю за ликбез :)

Reply

vakhnenko February 29 2024, 07:08:38 UTC
Да, в буквы они не умеют. Я не так уж плохо разбираюсь в LLMных промтах, но сколько ни бился - не смог заставить Bing правильно написать слово "Standards" в картинке (надо было для презенташки). Лучший результат имел три грамматические ошибки, остальные и того хуже.

Reply


Leave a comment

Up