Добавление мультур к культур для картинок: Google AutoDraw: ailev

ailev

Добавление мультур к культур для картинок: Google AutoDraw

Apr 12, 2017 18:47

Убого, но работает -- вот так выглядят инструменты автоматизации рисования от Гугля (можно уже пробовать самому -- https://www.autodraw.com/):

Click to view

Deep learning, конечно, делает чудеса. Это явно продолжение эсперимента https://quickdraw.withgoogle.com/# (писал http://ailev.livejournal.com/1313161.html, там нужно было на скорость нарисовать что-то так, чтобы Гугль определил, что именно вы нарисовали). А ещё AutoDraw открыт для пожертвований в изображениях -- https://www.autodraw.com/artists, это ещё и краудсорсинг. Дальше ждём подобных возможностей не только в редакторах постов социальных сетей, но и в Word, PowerPoint, Visio, а далее повсюду, где есть текст и можно добавить картинку. Следующий шаг -- саму картинку будут давать не пользователи, а "автохудожник" будет генерировать сам (покажут какой-то нейроархитектуре десяток фотографий, десяток дудлей на темы этих фотографий -- и попросят нарисовать дудль, могут ещё и добавить указания, каким стилем рисовать и как раскрашивать). При этом полноценные картинки по дудлям генерят уже давно, а вот раскрашивать их научились не так давно -- вот Scribbler, который просто не на серверах Гугля для всех, а просто исследовательский проект с кодом в GitHub: http://scribbler.eye.gatech.edu/. Или вот для редакторов изображений одежды и обуви: https://arxiv.org/abs/1609.03552. В нашем случае AutoDraw фотографическую картинку даже генерировать не нужно, художественный стиль не нужно переносить.

Я уже делал прогноз, что вся мощь искусственного интеллекта будет не великим творцам помогать добиваться невиданных высот, а полным тупицам помогать одолевать уровень плохо выученных людей -- и даже поминал рисование в этой связи (http://ailev.livejournal.com/1240994.html): в январе 2016 года "меня тут спросили в комментах по поводу компьютров-художников: не будут ли они помогать крутым художникам (http://ailev.livejournal.com/1240745.html?thread=13291433#t13291433)? Нет, они будут помогать совсем не-художникам или очень плохим художникам. Крутым художникам останутся только традиционные-без-интеллекта графические редакторы типа http://www.paintstormstudio.com/. Работу хороших художников будут стремиться не как-то усилить до неведомо каких высот, до недосягаемого на сегодняшнем уровне state-of-the-art, а наоборот -- автоматизировать, упростить текущий уровень и передать его людям ниже по цепочке способностей". Это просто реализация тезиса "Компьютерная помощь крутым перцам не пользуется спросом, пользуется спросом расширение возможностей дебилов и полная автоматизация работы умных людей -- на другое денег не будет" (мой пересказ неполиткорректными словами цитаты из Doug Engelbardt в том же посте, из которого первая цитата).

Дальше нужно понимать, что это просто autocomplete, только для картинок, а не для текстов. Т.е. это протягивание линии рассуждений из "Приложения для добавления мультур к культур: генерация речи по намерению" http://ailev.livejournal.com/1269236.html до графики. Суфлёр будет подсказывать не только текст, выбор эмотикона, кусок программного кода, но и изображения. Или кусок модели изделия в САПР, это не вопрос. Ну, и цитатка в продолжение предыдущих: "Вот и мучайтесь: то ли считать, что это ход на автоматизацию, где за человеком остаётся намеревание, intent какого-то действия, сообщения, программы, а всё остальное берёт на себя уже отнюдь не тупой компьютер, или ход на опрощенчество, когда вся мощь отнюдь не тупого компьютера сводится к добавлению мультур к высказываемому культур. Куда вымощена дорога благими намерениями создателей автокомплитов, нам всё одно не понять. Наверное, в пользовательский рай. Но мультур победит культур, конечно. Он добавится к каждому и всякому культур, ибо неживые суфлёры будут повсюду, и они будут дьявольски удобны в этом раю.

Подсказки суфлёра к танцам обсуждал в "хореоботе -- уже" (http://ailev.livejournal.com/1337386.html): "К этому моменту придумают и какой-нибудь имплант, чтобы наушником ухо не затыкать. Приходишь на вечеринку, танцуешь, а тебе мягенько подсказывают, о чём у тебя должна петь душа, какое у тебя должно быть самовыражение -- многие партнёры такому хореоботу были крайне рады. ... То, что для особо тупых можно прямо дёргать мышцу электричеством, я не пишу".

Последний раз я поднимал эту тему противоречивости хода на опрощение как одновременно культурного достижения и антидостижения по отношению к своему курсу системного мышления: "как связаны заявленная в курсе "борьба со сложностью" с сопротивлением к "опрощению"" (два дня назад, http://ailev.livejournal.com/1340273.html).

Нет, я не против. Огонь не нужно больше добывать трением, ибо у каждого появляются спички. А потом не нужно иметь и спички, ибо открытый огонь вообще оказывается не нужным в части его ручного зажигания. В области интеллекта всё точно так же. Будем надеяться, что все эти "опрощения" происходят в тех областях, которые сами по себе не нужны, а носитель ранее интеллектуальных и фронтирных умений идёт не просто валяться на диване и постить котиков в фейсбуке в перерывах между компьютерными играми, а пытается прорваться на каком-то другом участке цивилизационного фронтира.

Но машинное обучение с его бодрым deep learning ведь немедленно туда доберётся и предложит к тамошнему фронтирному культур добавлять фронтирный же мультур, уж какой есть -- опрощённый, зато даром и быстро. Не смоешься, не скроешься, AI тебя настигнет. Никто не уйдёт обиженным, никто не уйдёт.

Экспансия на новые виды приложений идёт стремительно, люди пишут методички типа Best Practices for Applying Deep Learning to Novel Applications (https://arxiv.org/abs/1704.01568). Это вам не оптимальную архитектурку нейросети предложить. Это много, много уровней выше. Поэтому пока только инструкция, написанная людьми для людей. Но это не значит, что Best Practices не является паттерном, и паттерны нельзя распознать-намайнить. Или даже сгенерировать, инструкцией для тупых. А кто совсем уж будет тупой, то для того этот сгенерированный паттерн и применят без участия человека, породят новое приложение машинного обучения. Всё равно ведь, что порождать.

Интересно, когда появится компания со слоганом "породится всё"? Мультимодальное порождение мультур к любому культур! По буковке за раз, по пикселю за раз, по узлу графа за раз -- это ж всё равно.