Get Mystery Box with random crypto!

Искусственный интеллект от OpenAI выполняет любые капризы в ка | Артем Бородатюк

Искусственный интеллект от OpenAI выполняет любые капризы в картинках

Помните, я писал о GPT-3? Это языковая модель от OpenAI, способная выдавать тексты не хуже рядового копирайтера.

Недавно я познакомился с ее расширением – нейросетью DALL·E (Дали + WALL-E). Она генерирует оригинальные изображения в ответ на текстовый запрос, причем много вариантов, и с тем или иным успехом может нарисовать практически что угодно.

Что может

Даже если запрос похож на бред, картинки получаются вполне адекватными. Зацените:

1. Кубический дикобраз.

2. Улитка-арфа.

3. Лемур на моноцикле.

4. Дайкон в балетной пачке выгуливает собаку.

Но DALL·E хороша не только в сюрреализме. Она отлично справилась с запросом на кресло в форме авокадо, неплохо нарисовала витраж с синей малиной и на троечку сделала вывеску с названием создателя.

В основе технологии лежит тот же GPT-3. Как именно работает нейросеть – подробно описано на сайте OpenAI и в научной статье разработчиков.

Критика

Чтобы искать недостатки у чего-либо, сперва нужно определить критерии «идеальности». Какие задачи должна выполнять эта нейросеть? Если преобразовывать текст в изображение – она справляется с этим на отлично, всегда выдает результат, еще и с вариантами.

Если создавать абсолютно реалистичные изображения – она ошибается. Многие предметы «из-под пера» DALL·E нарушают законы физики. Она может вместо двух запрошенных предметов нарисовать один. Но все же рисует и как-никак в запрос попадает. В общем, DALL·E у мамы гуманитарий и творческая личность, а с физикой и математикой у нее пока хуже.

Но любой ли человек справится с задачей нарисовать реалистично, объемно, по памяти хотя бы просто велосипед? Конечно, нет. Я молчу о том, чтобы нарисовать красиво животное, а не как тут.

Так же, как и GPT-3 – это не имитация текстов Набокова, а скорее очень даже хороший SEO-текст, DALL·E – это все же не Дали, а пока просто не самый внимательный ученик художественной школы.

Новые угрозы от AI?

Когда мы говорим об искусственном интеллекте, мы с ним внутренне соревнуемся и в глубине души боимся фантастических сценариев захвата власти роботами. Правда?

GPT-3 может отобрать хлеб у копирайтеров с бирж труда, а DALL·E – у выгоревших дизайнеров. Но ведь это просто пинок под зад, чтобы повышать квалификацию. Реально опасаться конкуренции ИИ не стоит, ведь он не может придумывать новое, он лишь ловко компилирует ранее изученное. Конечно, в скорости обучения нам с ним не потягаться, но и это не баг, а фича: отдавая машинам рутинные задачи, мы освобождаем свой ум для настоящего творчества.

Ян ЛеКун, главный по AI в Facebook, считает, что ожидания от подобных технологий часто завышены: «Пытаться построить интеллектуальные машины масштабируя языковые модели – как строить высотные самолеты для полета на Луну. Вы можете бить рекорды, но полет на Луну потребует совершенно другого подхода».

А вот новые этические проблемы реальны. Об этом говорят сами OpenAI.

- - -

Почему мы ожидаем от ИИ того, что это будет сразу искусственный «величайший ум»? Разве не круто уже то, что нейросеть может делать что-то, как человек хотя бы средних талантов?

Такие вопросы у меня возникли после прочтения комментов. Не знаю, как у вас, но у ребят на Хабре возникло много претензий к DALL·E. Больше всего мне понравилось сравнение ее с экскаватором: одни говорят, что экскаватор все равно не заменил человека с лопатой, а другие – что ценность изобретения от этого не страдает. И обе стороны правы.

Когда мне захотелось посмеяться над некоторыми результатами GPT-3 и DALL·E, я вспомнил, сколько времени потратил в универе на рефераты и сколько там в итоге было воды. Вот где бы мне помогли технологии OpenAI.

p.s. Прочитайте, кто такой Ян ЛеКун, а потом посмотрите на его home page :). Ощущение такое, что его тоже собрал ИИ. А ведь ссылка на этот сайт прямо сейчас указана в его био на FB.

@artemborodatiuk