Компания Google представила обновлённую версию своей платформы Gemini 3 Deep Think, основанной на искусствен интеллекте. Этот инструмент предназначен для решения сложных научных и инженерных задач, где данные могут быть неполными или неоднозначными. Однако, несмотря на впечатляющие достижения, система всё ещё сталкивается с серьёзными ограничениями. В этой статье мы рассмотрим возможности и недостатки нового ИИ, а также его практическое применение в научной сфере.
Что представляет собой Google Gemini 3 Deep Think?
Основные характеристики
- Цель: решение сложных научных задач с нечёткими условиями.
- Доступность: доступен для подписчиков Google AI Ultra и через API для исследователей и предприятий.
- Производительность: высокие результаты в тестах, включая бенчмарк ARC-AGI-2 (84,6%) и задачи олимпиадного уровня.
Новые возможности
Обновлённая платформа включает режим Aletheia, который способен проверять гипотезы и признавать свои ограничения. Это делает её более гибкой и реалистичной в применении.
Достижения и успехи
Результаты в тестах
- Тест Humanity’s Last Exam: 48,4% без сторонних инструментов.
- Международная математическая олимпиада 2025: уровень золотой медали.
- Тест CMT-Benchmark: 50,5% в теоретической физике.
Решение задач Эрдёша
ИИ смог решить 13 из 700 нерешённых задач, предложенных математиком Палом Эрдёшем. Однако только 4 из них оказались действительно новыми решениями.
Ограничения и проблемы
Точность решений
- Из 212 предложенных решений лишь 6,5% были содержательно правильными.
- 68,5% решений имели фундаментальные недостатки.
- 31,5% задач были неправильно интерпретированы.
Критика разработчиков
Разработчики признают, что ИИ демонстрирует «склонность неверно понимать вопрос таким образом, чтобы на него было легче ответить». Это указывает на необходимость дальнейшего совершенствования системы.
Перспективы и будущее
Потенциал для науки
Несмотря на ограничения, Gemini 3 Deep Think может стать ценным инструментом для исследователей, особенно в задачах, требующих итеративного анализа и проверки гипотез.
Будущие улучшения
- Повышение точности интерпретации задач.
- Расширение автономных возможностей.
- Интеграция с другими научными платформами.
В заключение, Google Gemini 3 Deep Think — это значительный шаг вперёд, но пока он остаётся скорее помощником, чем полноценной заменой для учёных и инженеров.