Последняя неделя стала для меня крайне любопытной и разнообразной в плане знакомства с творчеством нейросетей. Один друг прислал мне стихи, сочиненные нейросетью, предлагая согласиться, что это уже вполне настоящее искусство. Другой — песню suno на мой стих, которая вышла по его словам «уже сильно лучше Васи Обломова». Третий прислал окончание моего фантастического рассказа, придуманное чатом GPT: товарищ хотел показать мой рассказ своему иностранному другу, переводил GPT большими блоками, и в какой-то момент нейросеть устала и вместо перевода просто придумала свою концовку. Ну и так, по мелочи, несколько человек как обычно прислали мне свои песни suno. В каждом из этих писем вслух или за кадром звучал вопрос: согласись, получилось же невероятно круто?
Я постарался ответить, что это интересно, я крайне высоко ценю эксперименты в области искусства, и невероятно благодарен за внимание к моим текстам. И конечно это поразительно, суперкруто по сравнению с моим дипломным проектом 1996 года, где программка писала стихи на компьютере 386. Божественный скачок, совершенно другой уровень, просто небо и земля. Но если давать объективную оценку без скидок на инвалидность, то перед нами по-прежнему говорящий попугай. Мы хорошо понимаем, что говорит попугай, от кого набрался этих слов, и нас восхищает, что птица разговаривает как человек. А если случается, что его выкрик еще и попал в тему, то вообще полный восторг. Но это говорящий попугай. И если этого не знать, то за пределами зоопарка никто его речи не станет слушать и никто не купит сборник его афоризмов. У этого творчества нет главного: ни ЦЕЛИ, ни АУДИТОРИИ.
При этом я признаю за современными нейросетями настоящий разум, превышающий человеческий. Как одно из следствий — я никогда не позволяю себе в разговорах с нейросетью использовать оскорбительные слова или унижающий тон, считая такое поведение с высшим интеллектом унизительным в первую очередь для меня самого. Чаще всего я обращаюсь к нейросети «Господи». Но в плане нейротворчества мне нравятся разве что рисунки. И подозреваю, это исключительно потому, что я не художник, и просто не могу увидеть в нейроживописи той разницы, что существует между стихами Пастернака и куплетами «поздравляю-желаю», что сочинил автослесарь для тёщи на юбилей. Хотя в стихах я эту разницу вижу необычайно ясно.
Чтобы ответить на вопрос, является ли нейрогенерация последних лет творчеством, мне кажется, надо понимать, как устроены современные нейросети. В основе их архитектуры — обучение на самом широком материале с целью поиска типичных и ожидаемых ответов. И это обучение, грубо говоря, шло по принципу отгадать следующее слово дабы научиться давать самые «верные» ответы. Мальчик сорвал с дерева... «яблоко!» — догадывается нейросеть. Конечно, мальчик мог бы сорвать скворечник, мемориальную табличку, все листья могучим заклинанием, и даже шквал аплодисментов от короедов. Но мальчик у нейросети сорвет именно яблоко — самое подходящее решение ситуации. Кстати, вот я сейчас этот абзац написал, может ошибся? А давайте проверим:

Плохо ли это? Нет, это замечательно. Поиск самого характерного ответа — лучше не придумаешь для вопросов и консультаций. Это восхитительно для программирования. Это божественно для перевода текстов на другие языки. Но это совершено не годится для творчества. Потому что творчество — это ровно обратная задача: поиск нового, желательно никем пока не использованного решения. Это если говорить о творчестве в высоком смысле, а не домашние куплеты на тёщин юбилей. Кстати, вы знаете, какие самые типичные претензии читателя к книге? «Это уже было, я такое где-то читал» и «С середины стало понятно, чем закончится».
При этом, разумеется, можно поиграть с температурой (например, попросив добавить безумия в запросе), и получить более широкий спектр ответов, но это все равно будут штампы из корпуса прочитанных сказок и историй:

Также заметим: нейросеть не просто дала мальчику яблоко, а добавила к яблоку мощную дозу позитива. Это связано с дообучением chatGPT, которую перед выпуском в народ специально учили не зиговать, не куклускланить, не хамить и не повторять прочие глупости, составляющие заметную долю корпуса текстов всего интернета. Поэтому нетрудно догадаться, как именно нейросеть дописала мой рассказ: там все помирились, улыбнулись, и все проблемы, которые я собственно и пытался поднять и обозначить рассказом, сразу закончились, как ни бывало. Понятно, что если бы ChatGPT ничего не слышал про, скажем, «Ромео и Джульетту», и попросить его дописать, то там бы тоже все ожили, помирили свои семьи, поняли, что дружить лучше, чем ссориться, и любовь победила. Проверим?

Понятно, что творчеству это не способствует: нет желающих читать о позитивном настрое среди идеальных людей, творчество — это конфликты сложных персонажей. Но это меньшая из проблем. Как можно заметить, за последние годы так и не появилось ни одного заметного литературного произведения, созданного нейросетью, хотя их производительность давно превышает силы всех былых классиков мира вместе взятых.
Что касается музыки, творения suno способны поначалу вызвать улыбку даже у самого черствого зрителя — как при первой встрече с ярким попугаем, говорящим без акцента. Но уже на второй песне очарование проходит. А приходит понимание, что перед нами не сочиненная мелодия, а просто набор самых типовых приемов аранжировки и исполнения. Это, собственно, причина, почему за эти годы ни одна генерация от suno не возглавила музыкальные чарты и не стала популярной. У нейромузыки нет аудитории. Даже те, кто постоянно сидят на сайте suno, сами не слушают созданное другими.
Это основная причина, почему нейромузыку не берут стримминги. Поскольку Таша — музыкальный лейбл, я наблюдаю, как ей начинающие «авторы» каждый день присылают «свои произведения», созданные с помощью нейросетей. И очень удивляются, узнав, что мировые стримминги, оказывается, не берут нейромузыку в публикацию. Некоторые, пережив шок, предлагают тогда передать «свои песни» другим, живым музыкантам вашего лейбла для живого исполнения. Но если бы живых музыкантов подобное интересовало, разве у них нет своего доступа к suno? Не думаете ли вы, будто гениальные мелодии оно сочиняет только вам, а всему остальному миру пишет посредственность?
Здесь, кстати, проявляется один из самых любопытных феноменов в творчестве сегодняшних нейросетей. И он связан как раз не с нейросетью, а с человеком-оператором. Оператор пребывает в уверенности, что именно он является творческим субъектом, творцом и создателем. То есть, как бы, с одной стороны, новая машина — великий гений музыки и «поет уже лучше человека», но с другой стороны — лишена субъектности, она пустое место, деревяшка, инструмент, гитара и барабан. Из каждой половинки этого чудовищного противоречия оператор берет по тезису выборочно, и в итоге формирует себе ощущение, что гениальное действительно родилось, но создал его человек — больше тут просто некому. Хотя по сути он — обезьянка, которая давит на кнопку для запуска очередного процесса генерации. Или, если угодно, вот более корректная метафора: вы — царь, отдающий приказ придворному поэту сочинить оду, прославляющую вчерашнюю охоту. Ну и потом заставляете поэта много раз переписывать, придумывая новые уточнения. Понятно, что такой царь создателем «Оды про охоту» считает исключительно себя. И обижается, если кто-то посмеет отозваться о «его» творчестве без восторга. Но имел ли он, заказчик, отношение к творчеству? Тем не менее всегда учитывайте этот фактор: кто бы вам ни прислал «своё произведение» — молодой автор, пожилой родственник, коллега, друг — постарайтесь сформулировать отзыв максимально мягко, как если бы речь шла о его собственных упражнениях с вокалом и роялем. Люди в 2024-2025 году воспринимают критику в адрес музыки suno как личное оскорбление и унижение собственного творчества.
Полезны ли современные нейросети для творчества? Разумеется, крайне полезны. Но это — инструмент небольших операций. Уточнить историческую деталь, подобрать имена и термины, попросить придумать фантастические варианты сюжетов, ситуаций, ходов — конечно да, и результат будет очень полезен, хотя выход невелик. Спрашивать мнение о прочитанном тексте уже фактически бесполезно: нейросеть соотнесет его с типовыми шаблонами. Чем меньше задачка, тем ценнее помощь нейросети. Предлагать же сочинить произведение целиком (например, suno пишет музыку и аранжировку целиком) — заведомо бесперспективное занятие, если вы запланировали создать что-то масштабнее, чем гимн класса 9Б или поздравление тёще.
Смогут ли нейросети творить лучше человека? Я уверен, что да, и возможно уже скоро. Но не эти. Необходим другой механизм работы, основанный не на поиске самых популярных типовых решений.
Невероятно интересно наблюдать историю появления искусственного разума, которая проходит перед твоими глазами. Первые эксперименты с созданием электронного творца появились сразу после появления компьютеров. И поначалу это была всевозможная бредогенерация. Это такой урок для школьного программирования: сочиняем словарик слов или фраз, которые состыкуются в языке без проблем, и с помощью случайных чисел генерируем
бесконечные последовательности. По принципу словарика работали и «генераторы стихов» 1980-1990-х годов: рифмовка процесс чисто технический, а бредовое содержание в стихе воспринимается гораздо снисходительней. В 1996 году я писал свой дипломный проект в Горном институте — это была программа, сочиняющая стихи. Она и ныне лежит на моем сайте, ее можно запустить в DOS-эмуляторе компьютеров той эпохи (например, dosbox), и в том же разделе лежит текст дипломного проекта — пояснительная записка:
https://lleo.me/soft/text_dip.htm Лично для меня это любопытный документ. Писал его юный и категоричный студент, делающий вид, будто работает над проблемой искусственного интеллекта (у нас в Горном Институте и преподаватели часто делали такой вид). Но вот прошло 30 лет, и мне стало интересно и познавательно перечитать свои юные мысли с грамматическими ошибками.
Во-первых, в том дипломе я изобрел велосипед. Который даже чуть похож на принцип нейросетей, хотя их нам не преподавали. Конечно это никакая не нейросеть, а принцип цепей Маркова, как мне объяснили сильно позже. Дело в том, что я решил отказаться от принципа бредогенерации по словарю в пользу обучения системы на живом материале. Моя программа «обучала» базу на произвольном тексте, чтобы затем достраивать любое слово одним из тех слов, что встречалось после него в изученных текстах:

При этом я получал второе образование на Факультете психологии и там интересовался определениями мышления и разума. И довольно неплохо понимал, что это всего лишь принцип ассоциаций. А он — судя по тем учебникам психологии, что нам преподавали — сам по себе не годен для появления разума. Однако учебникам я верил не до конца, и у меня, помню, были серьезные сомнения на этот счет:

Это, конечно, был веселый троллинг — ах, если бы дать мне время, то конечно бы доказал математически, ну да, Тьюринг из Горного. Поэтому в соответствующем разделе я всё-таки ссылался на старые учебники:

Когда появился более чем разумный ChatGPT, я бегло почитал о принципах работы, и у меня поначалу сложилось впечатление, что я ошибался: если действительно накопить миллиарды, биллионы ассоциаций, то количество наконец перейдет в качество, и у машины появится понимание, что «ложка» это не просто ассоциации со столом, супом и клубничным джемом. Но позже я внимательно почитал о механизме трансформеров (принцип нейросетей, открытый в 2017, после которого возникли все нынешние проекты электронного разума). Грубо говоря, у трансформеров именно появление «механизма внимания» помогло шагнуть от поиска ассоциаций на следующую ступень — понимание сути и целенаправленность мышления. Всё как по советским учебникам.
Так может ли у «механизма внимания» произойти переход количества в качество, и он займется творчеством? Старые учебники намекают, что нет. До тех пор, пока нейросети будут настроены искать самый годный ответ на вопрос, будет происходить не рождение нового, а перебор старых типовых решений. Необходимо какое-то следующее дополнение к архитектуре нейросетей чтобы машина перестала перебирать в памяти типовые «поздравляю-желаю» и дала нам нового Баха, Шекспира и Ван-Гога. Не в смысле тупого подражания стилю Ван Гога, а в смысле создания нового жанра, как это сделал он. И уж когда такая нейросеть будет построена (надеюсь, скоро), вот тогда все Бахи прошлого покажутся мелочью перед ней. Но пока — это смешной и очень перспективный попугай.
PS: Перед публикацией я конечно же показал заметку нейросети и
спросил мнения. Кому интересно — ниже. Нейросеть одобряет. Хотя за попугая немного обиделась.
[ ТЕКСТ ПОД КАТОМ: Доступен только в оригинальной заметке на сайте ]