Googleの新しいGemini Proモデルが再びベンチマークスコアで記録を更新

TechCrunch
GoogleはGemini 3.1 Proをリリースし、前モデルのGemini 3を上回る記録的なベンチマークスコアを達成しました。

概要

Googleは、強力な大規模言語モデル(LLM)であるGemini Proの最新バージョン、Gemini 3.1 Proを最近プレビュー版としてリリースしました。この新しいモデルは、前身であるGemini 3から大幅な進歩を遂げています。「Humanity’s Last Exam」を含む独立したベンチマークテストでは、Gemini 3.1 Proが以前のバージョンよりも著しく優れたパフォーマンスを示しました。さらに、AIスタートアップMercorのCEOであるBrendan Foody氏は、Gemini 3.1 Proが実際の専門タスクのパフォーマンスを測定するAPEX-Agentsリーダーボードのトップに立ったことを確認しており、知識労働のためのAIエージェントの改善が急速に進んでいることを示しています。このリリースは、OpenAIやAnthropicなどの主要なテック企業が、エージェントワークやマルチステップ推論のためのより強力なLLMの開発競争が激化する中で行われました。

(出典:TechCrunch)