Я сейчас пребываю в перманентном шоке от происходящего. И дело все в нейронках, а точнее в NanoBanana, Suno и Kling. Да, нейронки уже сильно задолбали, про них говорят из каждого утюга. Сейчас AI должен быть в любом стартапе, иначе что же это за стартап-то такой? И я не ошибусь, думаю, если укажу, что и дня не пройдет , чтобы на Хабре не вышла статья про нейронку – как использовать, какая лучше пишет код, кто и как ее использует и т.д. Но речь дальше пойдет даже не о них и программировании, а нейронках для создания визуального контента и той скорости, с которой они меняются.
Мы за каких-то три-четыре года дошли от первых попыток через Midjourney сгенерировать что-то реалистичное на фото, до генерации неотличимого от настоящего видео. Да, всего каких-то три года, и все соцсети уже завалены роликами, сгенерированными полностью нейронками. И самое печальное, что теперь непонятно, вот эта говорящая голова настоящая, или это цифровой аватар. А голос настоящий, или нет? Или локация в кадре вообще существует в реальности? Да котикам уже страшно умиляться в нельзаграме, так как непонятно насколько они настоящие. С каждой новой нейронкой уплетание Уилл Смитом пасты выглядит все адекватней и уже больше похоже на рекламу макарон, чем на рекламу рехаба.
Приятного аппетита, У. СмитЯ уж молчу про музыку, очень много треков полностью генерируется через нейронки и попадает в чарты, рекомендации, вирусится в тех же соцсетях. Два года назад два парня выпустили нейро-рок-кавер на Asti в исполнении Хэтфилда из металики, была просто информационная бомба, и чтобы свести полноценный такой трек у них ушло немало времени.
Тот самый каверМиллионы просмотров / прослушиваний, журналисты брали интервью, к ним в сообщество пришло много людей в ожидании следующих ремиксов. А сейчас за пару минут и промтов (условно), тебе хоть полная частушка про приключения русалки, хоть Билли Айлиш поет «Прекрасное далеко» и это уже даже не удивляет. Невероятно быстрый прогресс, и с такой же невероятной скоростью это все просачивается в нашу повседневную жизнь. Да что уж там, появились первые нейро-инфоцыгане, которые продают курсы по тому, как создать аватара и как заработать миллионы. Да-да, у людей по 5-20к подписчиков, со всех роликов не наберется и миллион просмотров суммарно, но с радостью впарят курс / гайд / интенсив из информации, которая общедоступная в интернете. И лапши развесят на уши, какие они успешные, как им цифровой аватар приносит по несколько сотен тысяч рублей в месяц, а они тратят лишь 15 минут в день – вот такие вот гении со знаниями, недоступными простым смертным. Ну а что, лох не мамонт, как говорится.
До нейронок и так мало чего было настоящего, нельзяграм и тикитоки были завалены псевдо миллионерами, псевдо успешными людьми и псевдо счастливыми. Да, нужно было держать в уме, что увидел в интернете смело дели на 10 и не ошибешься, но все равно было место искренности – в проблемах, переживаниях, комплексах, в достижениях и т.д. А теперь и этому места останется еще меньше, если и останется вообще – пять минут в нейронке, и вот у тебя реалистичный бывший пожарный без руки, или девушка с ожогом в пол лица, или карлик, разговаривающий басом – все что угодно, насколько хватит фантазии, чтобы привлечь внимание, захватить его и монетизировать. И это уже ставится на поток, поэтому вопрос лишь времени, когда этого станет так много, что люди с их реальными, пусть и не такими "захватывающими" судьбами, но настоящими, просто уйдут на второй план. И по факту каждый релиз таких инструментов, как NanoBanana, Kling и т.д. – это как очередная станция, мимо которой мы проносимся на поезде на огромной скорости, и вернуться назад уже нельзя. И движемся мы все вместе до конечной станции, до матрицы. До какой-то среды, где либо вообще не будет грани между реальностью и вымыслом, либо оба будет очень тонкой, едва заметной. Поэтому хочется немного остановить этот локомотив, пока все это безумие не зашло слишком далеко.
И не удивлюсь, что найдется масса людей, готовых осознано эту грань не замечать, лишь бы получить свою порцию дофамина – побыть пять минут президентом, забить решающий гол в финале Лиге чемпионов, провести вечер с мисс мира: да все что угодно будет сгенерировано за пару минут, вы только подписку оформите. События, которые невозможны для 99,9% людей станут доступны – только попроси нейронку. Да, ненастоящие, но а кто не представлял себя у зеркала в чужой роли или образе? А тут и представлять не надо будет, вы все увидите, что захотите, и все будет в точности так, как именно вы захотите – как от такого устоять?
Но будет мне, я немного спойлерю события. Сейчас пока массовый гражданин умиляется сгенерированным котикам, сопереживает несуществующим людям с их вымышленными судьбами и гадает, с крыши на камчатке в сугроб прыгают по-настоящему или нет. Да, пока еще видны артефакты нейро-видео, пока мало просто написать промт и получить хороший результат, даже 10 секунд сделать сложно – нужно больше деталей, несколько попыток, нужны эффекты, чтобы прятать неестественность сгенерированного персонажа. Но это сейчас и пока, а два года назад вообще не получалось сгенерировать бегущего человека, как ты не проси, а сейчас уже можно указывать как он бежит, во что одет, как наезжает камера, как развиваются волосы, как расставлен свет и т.д – и вот вы имеете шот, который выглядит как полноценный рекламный ролик с бюджетом в пару миллионов. Мы еще далеки от этой, конечной станции, но поезд только набирает ход и тормозов у него нет. И во всем этом нейро хаосе меня одолевают два противоположных чувства.
С одной стороны, я ловлю испанский стыд со всего происходящего. С этой тонны фейковых роликов, с этих неестественных местами аватаров, с людей, которые не понимают ну столь очевидных генераций. Отдельно потешно выглядят блогеры, которые продают мастер классы по использованию нескольких промптов для работы в двух нейронках, скорее всего через хигсфилд. Ну и конечно, золотые горы и обещания успешного успеха, ведь у них получилось – поверь на слово. С другой стороны, у меня появляется какое-то дежавю, что я также реагировал и на биткоин, когда он только появился, мол кому он нужен, ну майнит кто-то его, ну и что дальше. И также реагировал на ролики, когда люди в тик-токе танцевали вирусные танцы или повторяли вирусные тренды, стримили игры или снимали пранки и челленджи. И такое же ровно чувство испытывал от рекомендаций скупать земли, или вкладывать в недвижимость, хотя ставки по ипотекам были 12% – и показал рост цен и текущие события, кто скупил и вложил, скорее выиграл, чем проиграл. И вот думаю, а не новый ли этот голубой океан? Пока одни потребляют такой контент, другие создают, осваивают новые модели, промты, техники и т.д.
И вот уже сейчас бизнес предпочитает в своих помещениях включать нейро-треки, так никому не надо платить отчисления и тебя никто не накажет за авторские права. Через лет 5-10 будут уже вечеринки с полностью сгенерированными аудио треками?
Уже сейчас много карточек на маркетплейсах сгенерировано нейронками, как само описание, так и визуальная часть – фото, видео. И, очевидно, кому-то за это заплатили. Иллюстрации в нейронках к статьям, книгам уже как будто всегда были с нами, а что впереди, через пару лет? При всем этом отторжении к нейро контенту, происходящее вызывает дичайший интерес у меня как у айтишника. А ведь можно это автоматизировать? У меня же есть и домашний сервер, есть n8n, Openrouter – что-то из этого можно состряпать. А можно через API на регулярной основе готовить промпты в одной модели, передавать в другую и постоянно публиковать новый контент как по расписанию? А что, если сделать не одного аватара, а, скажем, семь?
Или придумать концепцию нейро-сериала, продолжение которого определятся по самым популярным комментариям под последней частью? Скажем, возможно стоит в поезде переместиться поближе к машинисту, а не плестись в его конце?
И вот это вот все неимоверное пугает. Все и сразу. С какой легкостью можно сделать аватар, придумать историю, сгенерировать контент из ничего. И, скорее всего, это и выглядеть будет как будто настоящее. Авторам для этого не нужно ничего уметь, даже камера не нужна нормальная или хотя бы айфон, знать как свет расставлять в локации. Всего 20 $ в месяц за подписку и вот вы блогер в режиме 24/7. И есть те, кто будет за такой контент платить, и кто будет его потреблять. И все произошло это за считанные годы, буквально вот на наших глазах. А судя по увеличившемуся спросу на память и улетевшим в стратосферу ценам на нее, мы только-только набираем скорость.
Спасибо, что дочитали мою статью! У меня есть небольшой телеграм канал, буду рад подписке и неформальному общению.
Источник


