Компания Google выпустила модель Gemini 3 Flash — более доступную и ускоренную версию своего искусственного интеллекта. Новинка уже доступна разработчикам через Gemini API, Google AI Studio и Vertex AI, а также внедрена в приложение Gemini и режим ИИ в поиске Google, где она заменит предыдущую версию 2.5 Flash.
Gemini 3 Flash позиционируется как баланс между производительностью и стоимостью. По данным Artificial Analysis, модель работает примерно в три раза быстрее Gemini 3 Pro, при этом заметно дешевле в использовании: цена составляет $0,50 за миллион входных токенов против $2 у версии Pro. Стоимость генерации выходных токенов также ниже — $3 за миллион против $12 у Pro.

В тесте GPQA Diamond модель набрала 90,4%, что лишь немного уступает результату Gemini 3 Pro (91,9%). На Humanity’s Last Exam разница также оказалась минимальной — 33,7% против 37,5%. При этом на бенчмарке SWE-bench Verified Gemini 3 Flash показала результат 78%, сопоставимый с Pro-версией, но при значительно меньшей задержке.
В Google отмечают, что даже с минимальным уровнем режима “thinking” новая модель нередко превосходит предыдущие поколения с максимальными настройками рассуждений. Это делает Gemini 3 Flash универсальным решением для задач, где важна скорость ответа без заметной потери качества.
Модель продолжает стратегию линейки Flash, ориентированной на эффективность. Для разработчиков доступны дополнительные способы снижения стоимости — кэширование повторяющихся запросов со скидкой до 90%, а также Batch API, уменьшающий цену асинхронной обработки на 50%.
Читать по теме
Новых клиентов BetBoom ждет фрибет до 10 000 ₽ за регистрацию с промокодом ESPORTSMAX