Google представила Gemini 3.1 Pro: що змінилося у флагманській моделі ШІ

Час читання: 3 хв.

Google анонсувала Gemini 3.1 Pro, нову версію своєї флагманської моделі ШІ, яка обіцяє поліпшені можливості вирішення проблем і міркувань. Google стверджує, що 3.1 Pro готова до «ваших найскладніших завдань».

Ще один день, ще одна модель ШІ від Google. Google останнім часом дійсно активно випускає нові інструменти на базі ШІ, випустивши Gemini 3 в листопаді. Сьогодні компанія оновлює флагманську модель до версії 3.1. Нова Gemini 3.1 Pro сьогодні виходить (в режимі попереднього перегляду) для розробників і споживачів з обіцянкою поліпшених можливостей вирішення проблем і міркувань.

Минулого тижня Google оголосила про поліпшення свого інструменту Deep Think, і, судячи з усього, «основним інтелектом», що стоїть за цим оновленням, була Gemini 3.1 Pro. Як зазвичай, анонс новітньої моделі Google супроводжується безліччю тестів, які показують в основному скромні поліпшення. У популярному тесті Humanity’s Last Exam, який перевіряє поглиблені знання в конкретних областях, Gemini 3.1 Pro показала рекордні 44,4 відсотка. Gemini 3 Pro набрала 37,5 відсотка, а GPT 5.2 від OpenAI — 34,5 відсотка.

Google також відзначає поліпшення моделі в ARC-AGI-2, який включає нові логічні завдання, які не можна безпосередньо навчити ШІ. Gemini 3 трохи відставала в цій оцінці, досягнувши всього 31,1 відсотка в порівнянні з показниками в 50 і 60 відсотків у конкуруючих моделей. Gemini 3.1 Pro більш ніж удвічі перевершує результат Google, досягнувши високих 77,1 відсотка.

Google часто хвалилася, коли випускала нові моделі, заявляючи, що вони вже посіли перше місце в Arena leaderboard (раніше LM Arena), але цього разу це не так. В області тексту Claude Opus 4.6 випереджає нову Gemini на чотири бали, набравши 1504. В області коду Opus 4.6, Opus 4.5 і GPT 5.2 High трохи випереджають Gemini 3.1 Pro. Варто зазначити, однак, що Arena leaderboard працює на основі уподобань користувачів. Користувачі голосують за найкращі, на їхню думку, результати, що може винагороджувати відповіді, які виглядають правильно, незалежно від того, чи є вони такими.

Щоб продемонструвати поліпшення Gemini 3.1 Pro, Google зосередилася на здатності моделі генерувати графіку та симуляції. Приклади SVG, показані в порівняльному відео вище, дійсно виглядають набагато витонченіше, але це саме ті приклади, які вибрала Google для демонстрації. Великі цифри в тестах і відібрані демонстрації — це добре, але чи відчуєте ви якусь різницю при використанні моделі?

Якщо ви ставите абстрактні питання і очікуєте детальних, нюансованих відповідей, Gemini 3.1 Pro, ймовірно, видасть кращі результати, ніж 3.0. Розробники, які використовують Gemini для створення агентських робочих процесів, швидше за все, побачать поліпшення — Gemini 3.1 Pro майже подвоїла свій результат в бенчмарку APEX-Agents.

Оновлена модель сьогодні доступна в AI Studio та IDE Antigravity в режимі попереднього перегляду. Корпоративні користувачі побачать 3.1 Pro в Vertex AI та Gemini Enterprise. Для звичайних користувачів Gemini 3.1 Pro доступна як в додатку Gemini, так і в NotebookLM. Вартість API для розробників не змінилася (2 долари за введення і 12 доларів за виведення за 1 млн токенів), як і контекстне вікно (1 млн вхідних і 64 тис. вихідних токенів). Якщо тенденція Google збережеться, в найближчому майбутньому, швидше за все, з’явиться оновлення 3.1 для їх більш швидкої і дешевої моделі Flash.

Запис Google представила Gemini 3.1 Pro: що змінилося у флагманській моделі ШІ спершу з’явиться на iTechua – Новини про смартфони, гаджети і різні девайси.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Увійти

Зареєструватися

Скинути пароль

Будь ласка, введіть ваше ім'я користувача або ел. адресу, ви отримаєте лист з посиланням для скидання пароля.