Знаете, это чувство, когда новости выходят быстрее, чем ты успеваешь их читать? Март, бодро подхватив эстафету у февраля, продолжает закидывать нас громкими анонсами в мире искусственного интеллекта. Недавно гремел ChatGPT-5.4, чуть ранее шумела новая моделька от Qwen и появилась Gemini 3.1 Flash Lite. О последней, собственно, я и хочу сегодня поговорить. Все же из лидирующих компаний в сфере ИИ мое предпочтение в последнее время именно у Google.
В этой статье мы пробежимся по самой доступной модели от Google, разберемся в ее архитектуре и, конечно же, хорошенько ее протестируем. Так что принимайте стратегически удобное положение, ну а я начинаю.
Серия моделей Flash Lite – специализированная линейка в семействе Gemini, созданная Google для решения конкретной задачи: максимально быстрая и экономичная обработка больших объемов данных.
Если объяснять метафорой, то Flash Lite – спринтеры мира ИИ. Они не предназначены для сложнейших научных задач, но идеально справляются с рутинными, массовыми операциями, где критичны скорость и низкая стоимость.
Первая версия Flash, которая появилась в 2024 году как часть обновления Gemini 1.5. Именно тогда Google впервые представила концепцию быстрой и эффективной модели, построенной на той же архитектуре, что и флагманская версия, но оптимизированной под скорость.
Gemini 1.5 Flash быстро стала самой популярной моделью среди разработчиков благодаря балансу цены и качества. Быстрое выполнение заданий? Да. Однако в решении сложных задач в приоритете была версия Pro.
В декабре 2024 года вышла Gemini 2.0 Flash с улучшенной производительностью и новыми возможностями. Модель получила встроенную работу с инструментами и некоторые дополнительные плюшки.
К слову, версия Gemini 2.0 Flash превзошла предшествующую 1.5 Pro по ключевым показателям, работая при этом в два раза быстрее.
Именно в этот период начала формироваться линейка Lite – отдельная, еще более облегченная версия для задач с жесткими требованиями к стоимости.
Настоящей отправной точкой линейки можно считать июнь 2025 года, когда анонсировали Gemini 2.5 Flash Lite. Это была первая модель, получившая приставку Lite в названии.
Google описывала ее как самую быструю и экономичную модель в линейке Gemini 2.5. Если обычная Flash была сбалансированной в плане стоимости и скорости, то Flash Lite стала ультимативным выбором для массовых операций с жесткими требованиями к бюджету.
Следующей моделью серии стала рассматриваемая нами сегодня.
Все модели были взяты у агрегатора нейросетей BotHub. Список нейросетей там обширен – от работы с текстом до транскрибации и генерации видео. По специальной ссылке для регистрации можно получить 300 000 капсов для собственных экспериментов.
Последняя и самая совершенная версия серии, выпущенная 3 марта 2026 года. Это не просто обновление, а настоящий технологический прорыв. Модель основана на Gemini 3.1 Pro, что обеспечивает высокое качество при сохранении легкости.
Скорость выросла в 2,5 раза по сравнению с предшественником, увеличилась пропускная способность (363 токена в секунду), повысился общий интеллект. При всем этом, цена осталась в рамках догмата серии ($0,25 за миллион входных токенов, $1,50 за миллион выходных).
Главная инновация - регулируемое мышление. Разработчик может выбирать глубину рассуждения – от минимального до высокого уровня. Теперь можно гибко балансировать между скоростью и качеством для разных типов задач.
Официально Google позиционирует версию как дополнение к серии Gemini 3, состоящее из высокоэффективных, нативно мультимодальных, думающих моделей. Gemini 3.1 Flash Lite экономически эффективна и быстра, оптимизирована для высокообъемных задач, чувствительных к задержкам, таких как перевод и классификация.
Я не буду разделять задания на несколько разделов чисто для модели и ее сравнение с ближайшими конкурентами. По мне, проще сделать это разом, чтобы можно было и посмотреть способности Gemini 3.1 Flash Lite, и провести параллели между другими участниками.
На самом деле изначально я хотел сравнить модельку с какими-то вариантами из официального бенчмарка, но потом подумал: а что если сравнить ее с чем-то средним, но помощнее указанного там? Пускай противниками сегодня послужат ChatGPT 5.2 и Claude Sonnet 4.5. Обе модели уже приличное время с нами, обе не являются чем-то прям устаревшим, обе показывают плюс-минус хорошие результаты даже сейчас.
Все задачи сегодня будут рутинными, т.е такими, с которыми модели сталкиваются почти каждый день. Сравнение пройдет в три этапа: работа с текстом (генерация), решение математических задач и написание кода.
Этапы, связанные с текстом и кодом, будут оцениваться по трехбалльной шкале, где 1 балл – плохой результат, а 3 балла – отличный. С задачами по математике немного сложнее: каждое задание будет оцениваться в 1 балл при полностью правильном выполнении. То есть за весь этот этап сравнения каждая из моделей может получить до четырех баллов.
Напиши комедийный рассказ в жанре научной фантастики, состоящий из трех небольших глав. Действие происходит в далеком будущем в галактической человеческой цивилизации.
Основные требования:
Сюжет: История обычного человека (например, техника, курьера, бюрократа), который по нелепой случайности попадает в центр межгалактического конфликта или абсурдной авантюры. Ключ - комедийные недоразумения и попытки выпутаться, которые лишь усугубляют ситуацию.
Юмор: Основан на контрасте высоких технологий и низменных человеческих слабостей, сатире на современность, нелепых диалогах и гиперболе.
Мир: Яркий, но не перегруженный деталями. Технологии должны быть на грани поломки, а грандиозные космические явления - вызывать бытовые неудобства.
Структура: Три небольшие главы с четкой драматургией. В каждой главе должна быть своя комедийная кульминация.
Финал: Должен быть удовлетворительным, подводить итоги трансформации героя и оставлять легкое, ироничное послевкусие.
Модели получат скриншоты 4-х задач из разных тем по математике.
Ты – профессиональный программист на Python. Твоя задача – разработать полностью проработанное десктопное приложение – инженерный калькулятор с графическим интерфейсом. Код должен быть готов к запуску, чистым и содержать комментарии для пояснения ключевых моментов.
В функционал калькулятора необходимо включить базовые арифметические операции: сложение, вычитание, умножение и деление. Также добавь расширенные математические возможности: возведение в степень, извлечение квадратного корня, вычисление факториала, модуля числа и обязательную поддержку скобок для задания приоритета операций. Из тригонометрических функций потребуются синус, косинус, тангенс, а также обратные функции арксинус, арккосинус и арктангенс с возможностью переключения между градусами и радианами. Добавь натуральный и десятичный логарифмы, функцию возведения экспоненты в степень, а также математические константы – число пи и число e с высокой точностью. Из дополнительных функций пригодятся вычисление процентов, смена знака числа и кнопки очистки ввода. Интерфейс должен быть продуманным с логичным расположением кнопок, а поле ввода должно наглядно отображать введенное выражение и полученный результат. Для реализации графического интерфейса можно использовать любую удобную библиотеку, например tkinter или PyQt.
Отдельное требование – в интерфейсе калькулятора должна присутствовать кнопка с названием "Игра" или "Змейка". При нажатии на эту кнопку должно открываться новое окно с классической игрой "Змейка". Реализуй простую рабочую версию игры: змейка управляется стрелками клавиатуры, еда появляется в случайном месте игрового поля, при столкновении с границами экрана или собственным хвостом игра завершается, а текущий счет должен отображаться на экране. Дополни сам калькулятор историей вычислений.
Gemini краток, как и всегда. Однако, несмотря на то, что его рассказ вышел меньше, чем у других моделей, сам по себе текст получился хороший. Читается легко, есть юморок, ну и конечно кофемашина, которая может вытворить что угодно. Почему-то с этим заданием частенько можно ее встретить в рассказах. Максимальный балл в копилку.
ChatGPT, в отличие от Gemini, наоборот настрочил тонну текста. Справедливости ради, текст вышел хорошим, с юмором. Кстати,топять же фигурирует кофе аппарат. Решение проблемы с которым, вызвало облегченный мат, как национальный гимн быта.
Однако лично мне не понятно, зачем ChatGPT решил в конце каждой главы описывать кульминацию. Пожалуй, это единственный момент, который портит текст. Пол балла за это будет вычтено.
Claude Sonnet 4.5
Интересное чтиво, но каких-то комедийных элементов тут особо нет. Кроме абсурдности ситуации и пенсии через 420 лет… Главное, чтобы юмор был юмором. Хоть сам рассказ мне и понравился, но задание с комедией я не считаю особенно выполненным. Срежу балл за этот промах.
Ожидал, что хотя бы какая-то модель допустит ошибку в каком-то из примеров, но реальность оказалась более благоприятной. Gemini 3.1 Flash, ChatGPT 5.2 и Claude Sonnet 4.5 спокойно справились с каждой из данных им задач, за что и получают по максимальному баллу в свою копилку.
Gemini спокойно справляется с поставленной задачей. Все функции рабочие и придраться я могу, только если к дизайну. Простоватенько. Однако, нам главное не дизайн, а функционал, желательно рабочий, и он тут есть. Максимальный балл в копилку модели.
ChatGPT 5.2 показывает аналогичный результат: дизайн простой, но весь функционал рабочий. Максимальный балл в копилку.
Sonnet выдал красивый дизайн, лучший из тех, что были ранее. Правда, на этом все плюсы и заканчиваются. Калькулятор может считать только что-то базовое. Любые функции не работают, выдается ошибка. Поставлю один балл, не более, не менее.
|
Gemini 3.1 Flash Lite |
ChatGPT 5.2 |
Claude Sonnet 4.5 |
|
|
Первый этап |
3 |
2,5 |
2 |
|
Второй этап |
3 |
3 |
3 |
|
Третий этап |
3 |
3 |
1 |
|
Итог |
9 |
8,5 |
6 |
Claude, конечно, показал себя плоховато, но вот Gemini и ChatGPT почти идут одним результатом. Опять же, сравнение по большей части любительское, поэтому назвать результат эталоном никак нельзя.
Для себя я сделал вывод, что в обыкновенных задачах, Gemini 3.1 Flash Lite справляется хорошо, быстро и дешево. Примечательно, что в бенчмарке, сама Google сравнивала модель с ChatGPT 5 mini, хотя лично для меня, Gemini работает бодрее и лучше, чем версия 5.2, что по факту мощнее мини-версии.
Что же думаете вы? Для меня пока что Gemini 3.1 Flash Lite будет приоритетом для рутинных задач. Хоть там уже есть и ChatGPT 5.4, но все же, модель, которую мы рассмотрели сейчас, выглядит для простых задач привлекательнее.
Спасибо за прочтение!
Источник


