Google представила «лучшую в мире» ИИ-модель Gemini 3

19.11.2025

08:30

Google представила Gemini 3 — свою самую мощную ИИ-модель. Она объединяет все возможности линейки и «считается лучшей в мире».

https://youtu.be/98DcoXwGX6I?si=gbncDWQfWAyRBV3Y

«Каждое поколение Gemini основано на предыдущем. Прорывы Gemini 1 в области встроенной мультимодальности и длинного контекстного окна расширили диапазон обрабатываемой инфомрации и ее объем. Gemini 2 заложил основу для агентских возможностей и расширил границы рассуждений и мышления. [...] Gemini 2.5 Pro возглавлял рейтинг LMArena более шести месяцев», — говорится в анонсе.

Gemini 3 — «передовое решение» для логического мышления, созданное для понимания глубины и нюансов. Она улавливает тонкие детали в творческих идеях и разбирает комплексные задачи.

«ИИ гораздо лучше понимает контекст и смысл промпта, поэтому вы получаете то, что вам нужно, с меньшим количеством подсказок», — написала команда в блоге.

Модель уже доступна в поисковике Google, приложении Gemini, AI Studio, Vertex AI и бесплатной среде для вайб-кодинга Google Antigravity.

«Это лучшая в мире модель для мультимодального понимания и наша самая мощная нейросеть для агентного и вайб-кодинга. Она обеспечивает богатую визуализацию и более глубокую интерактивность — все на базе современных методов рассуждения», — отметили CEO Google DeepMind Демис Хассабис и технический директор Корай Кавукчуоглу.

Дополнительно представлен усовершенствованный режим рассуждений Gemini 3 Deep Think. Сначала к нему получат доступ тестировщики по безопасности, после чего инструмент станет доступен подписчикам Google AI Ultra.

https://forklog.com/news/ai/novyj-dzhejlbrejk-vzlomal-zashhitu-ii-v-99-sluchaev

Цифры

Gemini 3 Pro способен «воплотить в жизнь любую идею» благодаря «современному мышлению» и мультимодальным возможностям. Модель значительно превзошла версию 2.5 Pro по всем ключевым показателям.

В рейтинге LMArena она заняла первое место с результатом 1501 Elo, демонстрируя рассуждения на уровне доктора наук. Высокие показатели также зафиксированы в тестах Humanity’s Last Exam (37,5%) и GPQA Diamond (91,9%).

В тесте по математике MathArena Apex модель получила 23,4%. В заданиях на мультимодальное мышление результаты выше: на MMMU-Pro — 81%, а в Video-MMMU — 87,6%. В SimpleQA Verified показатель составил 72,1%.

«Это означает, что Gemini 3 Pro обладает высокой способностью решать сложные проблемы по широкому спектру тем, таких как наука и математика, с высокой степенью надежности», — говорится в блоге.

Команда проекта подчеркнула, что ответы Gemini 3 Pro умны, лаконичны и прямы. Он «говорит вам то, что нужно услышать, а не то, что вы хотите».

https://youtu.be/huK9q10qf40?si=TDdMnGNTJ-u63wu9

Gemini 3 Deep Think

Gemini 3 Deep Think — новый режим рассуждений на базе Gemini 3, который в ходе тестов набрал 41% в Humanity’s Last Exam, 93,8% в GPQA Diamond и 45,1% в ARC-AGI-2.

Тесты Deep Think Gemini 3. Источник: Google.

Компания позиционирует Gemini 3 как универсального помощника, способного справляться с любыми задачами благодаря мультимодальному мышлению и высокой производительности. Модель поддерживает контекстное окно объемом до 1 млн токенов.

Модель может распознать рукописный рецепт на разных языках из семейной кулинарной книги, найти научные статьи, видеолекции и учебные пособия по интересующей теме или сгенерировать код для интерактивных карточек, визуализаций и других форматов.

Вайб-кодинг

Разработчики отметили улучшенные возможности Gemini 3 в области агентного и вайб-кодинга — модель обрабатывает сложные промпты и инструкции и делает продукты более автономными. Она набрала 1487 Elo в WebDev Aren, 54,2% в Terminal-Bench 2.0 и 76,2% в SWE-bench Verified.

Корпорация также представила платформу для создания ИИ-агентов Google Antigravity. По словам разработчиков, она превращает цифрового ассистента в активного партнера, способного самостоятельно планировать и выполнять комплексные задачи, одновременно проверяя собственный код.

https://youtu.be/22B5Yu0oVS0?si=w7zcH6-qclhJXlbJ

Сервис интегрирован с моделью редактирования изображений Nano Banana.

https://forklog.com/news/ai/gemini-vyshel-v-topy-po-skachivaniyam-blagodarya-generatoru-izobrazhenij-nano-banana

Gemini 3 возглавила рейтинг Vending-Bench 2. Бенчмарк тестирует способность планировать на длительные сроки.

Gemini 3 Pro демонстрирует эффективное долгосрочное планирование. Источник: Google.

Gemini 3 лучше помогает в повседневных задачах вроде бронирования местных услуг или организации почтового ящика. Подписчики Google AI Ultra могут попробовать агентские возможности в приложении Gemini.

Безопасность

Google заявляет о высокой степени безопасности Gemini 3. По результатам комплексной проверки модель показала снижение склонности к «льстивым» ответам, повышенную устойчивость к атаке типа инъекция промпта и улучшенную защиту от злоупотреблений посредством кибератак.

В ближайшее время планируется выпуск дополнительных моделей из серии Gemini 3.

Напомним, в ноябре Google представила ряд новых решений в сфере агентского ИИ. Среди них: режим глубоких исследований в NotebookLM, «мозг для роботов» SIMA 2 и инструменты для шопинга.

Новости криптомира