Медиа о настоящеми будущем в России
Меню

Почему GPT-5 не стал прорывом и когда нейросети станут по-настоящему прикладными — спросили у разработчика

В начале августа вышел GPT-5 — новая версия нейросетевой модели, имя которой в свое время стало нарицательным. «Пятому» прочили славу умнейшего среди ИИ нового поколения, но не случилось. А когда случится? И что, великая нейросетевая революция откладывается?

Нейросети планомерно опутывают мир, и Россия не исключение: в развитие искусственного интеллекта в РФ, по итогам 2024 года, инвестировали до 305 млрд рублей, а его разработкой занимаются тысячи специалистов. С одним из них, Никитой Воронухиным (специализируется на машинном обучении, machine learning), мы обсудили «новый чат джипити» и то, как будет меняться мир под влиянием ИИ. Итак, GPT-5: ожидания и реальность.

Никита ВоронухинML-разработчик

— У каждого были свои ожидания от GPT-5: кто-то боялся (или надеялся), что теперь-то ИИ точно освободит его от работы, а кто-то ожидал обычного скучного планомерного развития, которое и произошло.

Но стоит отметить, что улучшение модели в тестах с условных 40% до 80% — это значительно более простая задача, приводящая к заметным улучшениям, чем улучшение с 95% до 96%. GPT сейчас находится как раз на этапе вот этих «однопроцентных» шажков. И поэтому, хотя улучшения в производительности не самые впечатляющие, они потребовали большого объема работы. При этом я думаю, что претензии пользователей в большинстве своем обоснованные:

компании часто специально перегревают ожидания

Мне кажется, разговоры о том, что GPT-5 станет первым представителем нового поколения нейросетей, были преувеличением. Пожалуй, чем-то новым в свое время стал Gemini 1.5 с контекстным окном в 1 млн токенов и рассказом про успешные испытания 10 млн токенов, что в моменте было лучше в 5–10 раз, чем у конкурентов. Да и сейчас, кстати, GPT-5 до такого окна не дорос (в нем 400 000 токенов). Хотя в рамках своего окна он показывает лучшие результаты.

Примечание АЧБД: в контексте ИИ токен — это минимальная единица данных, на которые разбивается текст, картинка и другая информация, обрабатываемая моделью. Условно говоря, количество токенов отражает глубину детализации разбора данных. А в случае контекстного окна количество токенов отражает объем данных, которые модель может помнить в моменте, — например, часть прошлой переписки, отрывок видео и так далее.

Нейронки смогут выйти на новый уровень, когда появятся лучшие архитектурные решения. Пожалуй, последним таким влиятельным изменением были трансформеры 2017 года (трансформером называется архитектура современных нейронных сетей. — Прим. АЧБД).

Нейросети в ближайшем будущем

В ближайшем будущем можно ожидать улучшения памяти нейросетей — чтобы они лучше запоминали предыдущие диалоги и имитировали «друга» (окончательно лишив кого-то социального взаимодействия). Будут и какие-то экстенсивные улучшения во всех областях, где они применяются — от геологоразведки до анализа предпочтений пользователей.

Наверное, в потенциально большие изменения также могут вылиться попытки уменьшить размеры моделей и затраты на их использование. Это приведет к большему внедрению нейронок в домашние устройства.

Нейросети как персональный режиссер

Нейросети уже сейчас могут генерировать фильмы индивидуально для пользователя, но их качество — крайне низкое. И проблема не только во всяких артефактах типа лишних пальцев на руках «актеров», но и в том, что необходимо создать один глобальный большой сюжет, запомнить его, расписать подробно каждую сцену, запомнить происходящее и обстановку в предыдущей сцене.

А если учесть, что такой фильм еще и должен кому-то понравиться, то задача становится еще сложнее, ведь нужно как-то узнать предпочтения пользователя в конкретный момент. Это влечет необходимость сбора данных о пользователе, причем желательно не только из чата с нейросетью. Другой вариант — когда пользователь подробно расписывает то, что он хочет увидеть. Но интересно ли тогда будет смотреть фильм?

Подобные фильмы будут создаваться скорее кинокомпаниями или обычными людьми для других и относиться к категории B. Но в целом развитие нейросетей позволит людям создавать больше всяких инди-проектов — игр, сериалов, фильмов. Ведь многие хотели бы реализовать свои творческие идеи, но не обладают навыками программиста, художника и бюджетами, необходимыми для создания относительно крупных проектов.

Нейросети в отдаленном будущем

Они станут еще более активно использоваться в разных отраслях экономики, где происходит много однотипной обработки информации, при этом достаточно сложной для алгоритмического описания, и заменять целые профессии. Но одновременно с этим они будут создавать спрос на экспертов, которые будут оценивать их работу и нести за нее ответственность.

Скорее всего, получат большое развитие прикладные ИИ, а не «универсальные» типа LLM (large language models, то есть большие языковые модели вроде ChatGPT. — Прим. АЧБД). Весьма вероятно, это вызовет некоторые этические дискуссии из разряда:

можно ли доверять ИИ вынесение судебных решений, постановку диагнозов, консультирование по каким-то щепетильным вопросам и так далее?

Наверняка с появлением более легковесных моделей появится возможность дообучать ИИ под заказ под свои нужды, чтобы, допустим, сделать цифрового клона умершего родственника. Вместе с тем будет остро стоять вопрос ограничения ИИ — хоть модели и безвольны, но всякого рода ограничения, которые устанавливаются компаниями на LLM, весьма часто и быстро обходятся пользовательскими инструкциями, что может создать серьезные проблемы.

Поделиться
Фото: Сергей Елагин/Бизнес Online/ТАСС. Текст: Дмитрий Зерин