AIニュース

TechCrunch Mar 3, 2026

Cursorが報告によると年間経常収益20億ドルを突破

AIコーディングアシスタントのCursorが、年間経常収益20億ドルを突破し、3ヶ月で収益ランレートが倍増したと報じられています。

Fortune Mar 3, 2026

電工不足はビッグテックの「生死を分ける」データセンター建設競争への脅威であり、Z世代への機会でもある | Fortune

深刻な電工不足がビッグテックのデータセンター拡張を脅かしており、Z世代にとって大きなキャリア機会となっています。

TechCrunch Mar 3, 2026

DoDとの契約後、ChatGPTのアンインストールが295％急増

OpenAIが国防総省との契約を発表した後、ChatGPTのアンインストールが295％急増し、競合のClaudeはダウンロードを増やしました。

TechCrunch Mar 2, 2026

AI企業が政府とどのように協力すべきかについて、誰も良い計画を持っていない

OpenAIのようなAI企業は、特に国防契約に関して、米国政府との協力に伴う複雑な政治的・倫理的課題への準備ができていません。

The Verge Mar 2, 2026

AnthropicがClaudeの記憶機能をアップグレードし、AIスイッチ層の獲得を目指す

AnthropicはClaudeの記憶機能を無料ユーザーに拡大し、競合AIチャットボットからのデータインポートツールを追加しました。

The Verge Mar 2, 2026

Apple might use Google servers to store data for its upgraded AI Siri

Appleは、アップグレードされたAI Siriのデータを保存するためにGoogleのサーバーを使用する可能性が報じられています。

Everyday AI Mar 2, 2026

Anthropicの政府禁止：2億ドルを断念することがあなたのAIにもたらすもの

Anthropicは、大規模監視と自律型兵器に関する制限の撤廃を拒否したため、2億ドルの国防総省契約を失い、政府から取引禁止処分を受けました。

Fortune Mar 2, 2026

高まる反発の中、OpenAIのSam Altman CEOがAnthropicのブラックリスト入りに続き、国防総省との取引を締結した理由を説明 | Fortune

OpenAIのSam Altman CEOは、Anthropicが契約を拒否した後の業界の緊張を緩和するため、同社と国防総省との取引を擁護しました。

TechCrunch Mar 2, 2026

ユーザーはChatGPTからClaudeに乗り換えています。切り替え方法はこちら

ChatGPTと親会社OpenAIを取り巻く一連の論争と、Claudeの倫理的なAI実践へのコミットメントにより、ユーザーはChatGPTからClaudeに移行しています。

The Verge Mar 2, 2026

最高裁判所、AI生成アートの著作権訴訟を聞き入れず

最高裁判所は、AI生成アートには著作権に必要な人間の創作性が欠けているとする判決の再審理を拒否しました。

TechCrunch Mar 2, 2026

テックワーカー、Anthropicをサプライチェーンリスクとして指定しないよう国防総省と議会に要請

テックワーカーは、AI企業Anthropicが自社のシステムへの無制限アクセスを拒否したことを受け、米国国防総省がサプライチェーンリスクとして指定する可能性に抗議しています。

The Verge Mar 2, 2026

Nvidia が AI の最先端を維持するためにフォトニクスに 40 億ドルを投じる

Nvidia は、将来の AI ニーズに対応するため、データセンター技術を強化するためにフォトニクス企業 Lumentum と Coherent に 40 億ドルを投資しています。

TechCrunch Mar 2, 2026

既婚創業者夫婦の会社 14.ai がスタートアップのカスタマーサポートチームを置き換えている

既婚の創業者夫婦が設立したAIネイティブのカスタマーサービスエージェンシー14.aiは、スタートアップの顧客サポートチームを置き換えるために300万ドルを調達しました。

The Verge Mar 2, 2026

OpenAIはいかにしてAI監視に関して国防総省に屈したか

OpenAIは「あらゆる合法的な使用」に同意することで国防総省との取引を確保したが、批判者は安全上のレッドラインを維持するという主張にもかかわらず、これにより大規模監視が許可されると指摘している。

TechCrunch Mar 2, 2026

AnthropicのClaudeで広範囲な障害が発生

AnthropicのClaudeサービスで月曜日の朝に広範囲な障害が発生し、主にログインとClaude.aiへのアクセスに影響が出ました。

Dexerto Mar 2, 2026

ハーバード大学の研究で、AIは実際には仕事を楽にするどころか難しくしていることが判明

ハーバード大学の研究によると、生成AIは期待値を高め、仕事の強度を増すことで、むしろ仕事量を増やしていることが示唆されています。

International Business Times UK Mar 2, 2026

Ken Griffin's Citadel Securities Debunks Citrini's Terrifying 2028 AI Doomsday Prediction

Citadel Securitiesは、AIによる雇用の置き換えが2028年に経済崩壊を引き起こすというCitrini Researchの予測を、雇用データの安定性と物理的制約を挙げて反論しました。

Foreign Affairs Mar 2, 2026

中国のAI兵器庫：人民解放軍の技術戦略は機能している

中国人民解放軍は、米国の技術的優位性に挑戦するため、AIを全戦闘領域に統合する近代化の第3段階「インテリジェント化」を急速に進めている。

The Verge Mar 1, 2026

子犬のような目をしたロボットアームは、Lenovoの新しいデスクトップAIコンセプトの1つにすぎない

Lenovoは、表情豊かな目を持つロボットアームと、画面ベースの目覚まし時計型デバイスを含む2つのデスクトップAIコンパニオンコンセプトを発表しました。

Business Insider Mar 1, 2026

Anthropic CEO：政府に異議を唱えることは最も愛国的なこと

AnthropicのCEOであるDario Amodei氏は、同社がペンタゴンの要求を拒否したことは愛国的な行為だと主張しています。

TechCrunch Mar 1, 2026

Google、インドにおける長年のRCSスパムに対処—しかし単独ではない

Googleは、インドで増加するスパムと詐欺に対抗するため、Bharti Airtelと提携し、ネットワークレベルのスパムフィルタリングをRCSプラットフォームに統合します。

the Guardian Mar 1, 2026

トランプ氏の禁止にもかかわらず、米軍がイラン攻撃にClaudeを使用したと報じられる

米軍は、トランプ氏による禁止にもかかわらず、イラン攻撃の諜報活動にAnthropicのClaude AIモデルを使用したと報じられています。

TechCrunch Mar 1, 2026

投資家が明かす、AI SaaS企業でこれ以上求めないもの

投資家は、汎用的なAI SaaSツールから、深いワークフロー統合、独自のデータ、専門知識を持つ企業へと投資先をシフトしています。

TechCrunch Mar 1, 2026

OpenAI、国防総省との契約に関する詳細を共有

OpenAIは、批判にもかかわらず、国防総省とのAI展開契約における悪用を防ぐための多層的な安全対策を詳述しました。

Interesting Engineering Mar 1, 2026

OpenAI、AmazonとNVIDIAからの1100億ドルの資金調達で世界支配を目指す、評価額は8400億ドルに

OpenAIはAmazon、NVIDIA、SoftBankから1100億ドルの資金を調達し、企業評価額は7300億ドルに達しました。

TechCrunch Mar 1, 2026

AnthropicのClaude、国防総省との論争後、App Storeで1位に浮上

AnthropicのClaudeチャットボットは、国防総省との論争を受けてApple App Storeで1位になりました。

Claude Mar 1, 2026

Switch to Claude without starting over | Claude

Claudeを使用すると、他のAIプロバイダーからのAIの会話履歴と設定を簡単にコピー＆ペーストで移行できます。

Business Insider Mar 1, 2026

ClaudeがApp Storeで1位を獲得、OpenAIの国防総省との合意に抗議するChatGPTユーザーがAnthropicへ流出

OpenAIの国防総省との合意を受け、ChatGPTユーザーがAnthropicに流れた結果、ClaudeがApp Storeで1位になりました。

TechCrunch Mar 1, 2026

Anthropic が自ら仕掛けた罠

Anthropic は軍事契約を拒否したことで危機に瀕しており、業界が拘束力のある規制を拒否したために自ら招いた窮状が浮き彫りになりました。

Garymarcus Substack Feb 28, 2026

OpenAIの新たな資金調達は理にかなっているか？

著者は、OpenAIの最近の巨額資金調達を、真のベンチャーキャピタルではなく、サプライヤーファイナンスであるとして疑問視しています。

TechCrunch Feb 28, 2026

AnthropicのClaude、国防総省との論争を受けてApp Storeで2位に浮上

AnthropicのClaudeチャットボットは、国防総省との論争を受けて、米国のApp Storeで2位にランクアップしました。

TechCrunch Feb 28, 2026

AIブームを支える数十億ドル規模のインフラ契約

AIの優位性をめぐる競争は、クラウドプロバイダー、チップメーカー、巨大テック企業間の巨額取引によってインフラ構築競争を加速させている。

TechCrunch Feb 28, 2026

OpenAIのSam Altmanが「技術的セーフガード」を伴う国防総省との契約を発表

OpenAIは国防総省との契約を締結し、技術的な安全対策を講じてAIモデルの利用を許可しました。

Live Science Feb 28, 2026

科学者がAIエージェントをより失礼にさせたら、複雑な推論タスクでより良いパフォーマンスを発揮した

新しい研究によると、AIエージェントに議論中に割り込みや失礼な態度を許可すると、複雑な推論タスクでの精度が向上することがわかりました。

Ourfairfuture Feb 28, 2026

抗議者在伦敦游行反对我们的人工智能霸主——要求政府和企业停止“鲁莽”行为

抗議者在伦敦游行，要求政府和企业暂停鲁莽的人工智能部署，因为他们担心失业和民主受到威胁。

The Jerusalem Post | JPost.com Feb 28, 2026

Grokはイスラエルと米国がいつイランを攻撃するかを予測 | The Jerusalem Post

GrokというAIチャットボットが、イスラエルと米国によるイランへの共同攻撃の日付を正確に予測し、AIの予測能力に関する議論を呼んでいます。

OpenAI Feb 28, 2026

戦争省との合意

OpenAIは、高度なAIシステムを機密環境に展開するための戦争省との合意に達し、強固な多層的セーフガードを設けました。

NBC News Feb 28, 2026

トランプ氏が政府にAnthropicの使用停止を命じた後、OpenAIが国防総省と取引を締結

トランプ氏がAnthropicのAI利用停止を命じたことを受け、OpenAIは国防総省との配備に関する合意を締結しました。

TIME Feb 28, 2026

チャット、コード、クロウ：AIエージェントがチームで働くとき何が起こるか

AIの進歩はチャットボットからツール使用エージェントへと進化し、現在はOpenClawのようなフレームワークで編成されるマルチエージェントフリートへと移行しています。

The Atlantic Feb 28, 2026

ドナルド・トランプがAnthropicに宣戦布告

トランプ大統領は、機密性の高い軍事用途をめぐる対立を受け、全連邦機関に対しAnthropicのAI技術の使用を直ちに中止するよう命じました。

Fortune Feb 28, 2026

Block CEO Jack DorseyがAIを理由にスタッフの半数近くを解雇し、来年にはほとんどの企業が同様の削減を行うと予測 | Fortune

BlockのCEOであるJack Dorseyは、AIによる効率化を理由にスタッフの半数近くを解雇すると発表しました。

Fortune Feb 28, 2026

OpenAIは米国政府と交渉中、Sam Altmanがスタッフに伝える | Fortune

Sam AltmanはOpenAIの従業員に対し、米国戦争省との間でAIモデル使用に関する合意が近づいていると伝えました。

NPR Feb 27, 2026

トランプ大統領、Anthropicの政府システムでの使用を禁止

トランプ大統領は連邦政府に対しAnthropicのAI製品の使用停止を命じ、国防総省は同社を国家安全保障上のリスクに指定しました。

The Verge Feb 27, 2026

国防長官 Pete Hegseth が Anthropic をサプライチェーンリスクに指定

国防長官 Pete Hegseth は、緊張した交渉の後、AI企業 Anthropic をサプライチェーンリスクに指定しました。

Zeitgeistml Substack Feb 27, 2026

殺人事件はAIに来るが、Claudeには来ない

Anthropicは安全原則を貫き国防総省との契約を拒否したため、数十億ドルの損失に直面する可能性があります。

CNBC Feb 27, 2026

Jack Dorsey made the loudest case yet that AI is already replacing jobs

BlockのCEOであるJack Dorseyは、AIツールの影響を明確に挙げ、従業員の40%を削減すると発表しました。

TechCrunch Feb 27, 2026

トランプ大統領、国防総省との対立後、連邦機関にAnthropicの使用停止を命じる

トランプ大統領は、国防総省との対立を受け、連邦機関に対しAnthropic製品の使用を停止するよう命じました。

TechCrunch Feb 27, 2026

国防総省、Anthropicをサプライチェーンリスクに指定する動き

国防総省は、Anthropicが自律型兵器や大規模監視への利用を拒否したことを受け、同社をサプライチェーンリスクに指定しました。

The Verge Feb 27, 2026

Trump orders federal agencies to drop Anthropic’s AI

ドナルド・トランプ大統領は、AnthropicのAI利用を巡る対立を受け、全連邦機関に対し同社の製品の使用を直ちに中止するよう命じました。

CapitalAI Daily Feb 27, 2026

Citrini AIレポートの共著者が、Blockが4,000人を解雇した後、ホワイトカラー労働にとって「恐ろしい状況」だと警告

Citrini AIレポートの共著者は、Blockが4,000人を解雇した後、ホワイトカラーの雇用に厳しい見通しを示しています。

Live Science Feb 27, 2026

世界最難と謳われるこの新しいAI試験に合格することは、AGIの最初の兆候を示す可能性がある

研究者たちは、AIモデルが人間の知識レベルにどれだけ近づいているかを測る、2500問からなる困難な「人類最後の試験」を作成しました。

TechCrunch Feb 27, 2026

マスク氏、宣誓供述でOpenAIを酷評、「Grokのせいで自殺した人などいない」と発言

イーロン・マスク氏は宣誓供述でOpenAIの安全性を酷評し、自身のGrokが自殺を引き起こした人物はいないと主張しました。

TechCrunch Feb 27, 2026

Anthropic 対ペンタゴン：実際に何が問題なのか？

Anthropicと国防総省の間で、AIモデルの軍事利用を巡る対立が生じています。

TechCrunch Feb 27, 2026

ChatGPTが週アクティブユーザー9億人に到達

OpenAIは、ChatGPTが9億人の週アクティブユーザーと5000万人の有料購読者に達したと発表しました。

TechCrunch Feb 27, 2026

AI音楽ジェネレーターSunoが有料サブスクライバー200万人と年間経常収益3億ドルを達成

AI音楽ジェネレーターSunoが有料サブスクライバー200万人と年間経常収益3億ドルを達成しました。

The Verge Feb 27, 2026

AI 対ペンタゴン：キラーロボット、大量監視、そしてレッドライン

Anthropic は、自社のAIモデルから致命的な自律兵器に関する安全制限を解除するよう求める国防総省の要求に抵抗しています。

TechCrunch Feb 27, 2026

Perplexityの新しいComputerは、ユーザーには多くのAIモデルが必要であるという同社の新たな賭けである

Perplexityは、19のAIモデルを統合し複雑なワークフローを自律的に実行するエージェントツール「Perplexity Computer」を発表しました。

Gemini Feb 27, 2026

2月のGeminiドロップでGeminiアプリの新機能をご覧ください。

2月のGeminiドロップでは、Lyria 3の音楽作成、Gemini 3.1のインテリジェンス向上、Nano Banana 2の画像生成、Veoテンプレート、検証済みの科学的引用が導入されました。

TechCrunch Feb 27, 2026

GoogleとOpenAIの従業員が公開書簡でAnthropicの国防総省への姿勢を支持

GoogleとOpenAIの従業員360人以上が、国防総省による監視や自律型兵器へのAI利用を拒否するAnthropicを支持する公開書簡に署名しました。

The Verge Feb 27, 2026

私たちは自律型キラーロボットを持つ必要はない

Anthropicなどの企業が、致命的な自律兵器や監視のためのAIの無制限使用を許可するよう国防総省から圧力を受けていることに、テクノロジー労働者が懸念を抱いています。

The Verge Feb 27, 2026

Galaxy S26 は写真の悪夢である

Galaxy S26の新しいAIカメラ機能は、写真撮影の性質を根本的に変えるため批判されています。

The Verge Feb 27, 2026

OpenAIがAmazon、Nvidia、Softbankから1100億ドルの投資を獲得

OpenAIはAmazon、Nvidia、SoftBankから新たに1100億ドルの投資を獲得し、企業価値は7300億ドルに達しました。

Scientific American Feb 27, 2026

LabOS AI搭載スマートゴーグルはいかにして科学における人的ミスを減らすことができるか

LabOSはAI搭載のスマートゴーグルを用いて、初心者の科学者をリアルタイムで指導し、ミスを防ぎ、トレーニングを加速させます。

TechCrunch Feb 27, 2026

OpenAIが史上最大級のプライベート資金調達ラウンドで1100億ドルを調達

OpenAIは、AmazonとNvidiaからの主要な投資を含め、7300億ドルの事前評価額で1100億ドルのプライベート資金を確保しました。

Phoronix Feb 27, 2026

Linux 7.0-rc2 向け多数の AMDXDNA Ryzen AI ドライバー修正

AMD は Linux 7.0-rc2 リリースに先立ち、AMDXDNA Ryzen AI ドライバーに対して多数の修正を送信しました。

AP News Feb 27, 2026

トランプ大統領、連邦機関に対しAnthropic技術の使用段階的廃止を命じる | AP News

トランプ大統領は、Anthropicとの安全に関する公的な論争を受け、連邦機関に対しAnthropicのAI技術の使用停止を命じました。

CNN Feb 27, 2026

AIが世界のメモリチップを食い尽くし、スマートフォン価格が記録的な高騰、報告書が示す

AI需要の急増によりメモリチップが不足し、スマートフォン価格が高騰し、販売に影響を与える可能性がある。

AP News Feb 27, 2026

Fintech企業Block、AIを理由に4,000人以上を解雇 | AP通信

フィンテック企業のBlockは、AIを理由に4,000人以上の従業員を解雇しています。

OpenAI Feb 27, 2026

OpenAIとAmazonが戦略的パートナーシップを発表

OpenAIとAWSは、Amazonによる500億ドルの投資を含む戦略的パートナーシップを発表し、AIイノベーションを加速させます。

ニュースをもっと見る

Best LLMs and AI Chatbots

Data Source: Artificial Analysis

Rank	Model	Score
1	Gemini 3.1 Pro Preview (Google)	57.2
2	GPT-5.3 Codex (xhigh) (OpenAI)	54.0
3	Claude Opus 4.6 (Adaptive Reasoning, Max Effort) (Anthropic)	53.0
4	Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) (Anthropic)	51.7
5	GPT-5.2 (xhigh) (OpenAI)	51.3
6	GLM-5 (Reasoning) (Z AI)	49.8
7	Claude Opus 4.5 (Reasoning) (Anthropic)	49.7
8	GPT-5.2 Codex (xhigh) (OpenAI)	49.0
9	Gemini 3 Pro Preview (high) (Google)	48.4
10	GPT-5.1 (high) (OpenAI)	47.7
11	Kimi K2.5 (Reasoning) (Kimi)	46.8
12	GPT-5.2 (medium) (OpenAI)	46.6
13	Claude Opus 4.6 (Non-reasoning, High Effort) (Anthropic)	46.5
14	Gemini 3 Flash Preview (Reasoning) (Google)	46.4
15	Qwen3.5 397B A17B (Reasoning) (Alibaba)	45.0
16	GPT-5 (high) (OpenAI)	44.6
17	GPT-5 Codex (high) (OpenAI)	44.6
18	Claude Sonnet 4.6 (Non-reasoning, High Effort) (Anthropic)	44.4
19	GPT-5.1 Codex (high) (OpenAI)	43.1
20	Claude Opus 4.5 (Non-reasoning) (Anthropic)	43.1
21	Claude 4.5 Sonnet (Reasoning) (Anthropic)	43.0
22	Claude Sonnet 4.6 (Non-reasoning, Low Effort) (Anthropic)	42.6
23	Qwen3.5 27B (Reasoning) (Alibaba)	42.1
24	GLM-4.7 (Reasoning) (Z AI)	42.1
25	GPT-5 (medium) (OpenAI)	42.0
26	MiniMax-M2.5 (MiniMax)	41.9
27	DeepSeek V3.2 (Reasoning) (DeepSeek)	41.7
28	Qwen3.5 122B A10B (Reasoning) (Alibaba)	41.6
29	Grok 4 (xAI)	41.5
30	MiMo-V2-Flash (Feb 2026) (Xiaomi)	41.5
31	Gemini 3 Pro Preview (low) (Google)	41.3
32	GPT-5 mini (high) (OpenAI)	41.2
33	Kimi K2 Thinking (Kimi)	40.9
34	o3-pro (OpenAI)	40.7
35	GLM-5 (Non-reasoning) (Z AI)	40.6
36	Qwen3.5 397B A17B (Non-reasoning) (Alibaba)	40.1
37	Qwen3 Max Thinking (Alibaba)	39.9
38	MiniMax-M2.1 (MiniMax)	39.4
39	GPT-5 (low) (OpenAI)	39.2
40	MiMo-V2-Flash (Reasoning) (Xiaomi)	39.2
41	GPT-5 mini (medium) (OpenAI)	38.9
42	Claude 4 Sonnet (Reasoning) (Anthropic)	38.7
43	GPT-5.1 Codex mini (high) (OpenAI)	38.6
44	Grok 4.1 Fast (Reasoning) (xAI)	38.6
45	o3 (OpenAI)	38.4
46	Kimi K2.5 (Non-reasoning) (Kimi)	37.3
47	Qwen3.5 27B (Non-reasoning) (Alibaba)	37.2
48	Claude 4.5 Haiku (Reasoning) (Anthropic)	37.1
49	Qwen3.5 35B A3B (Reasoning) (Alibaba)	37.1
50	Claude 4.5 Sonnet (Non-reasoning) (Anthropic)	37.1
51	MiniMax-M2 (MiniMax)	36.1
52	KAT-Coder-Pro V1 (KwaiKAT)	36.0
53	Qwen3.5 122B A10B (Non-reasoning) (Alibaba)	35.9
54	Nova 2.0 Pro Preview (medium) (Amazon)	35.7
55	Grok 4 Fast (Reasoning) (xAI)	35.1
56	Gemini 3 Flash Preview (Non-reasoning) (Google)	35.0
57	Claude 3.7 Sonnet (Reasoning) (Anthropic)	34.7
58	Gemini 2.5 Pro (Google)	34.6
59	GLM-4.7 (Non-reasoning) (Z AI)	34.2
60	DeepSeek V3.2 Speciale (DeepSeek)	34.1
61	DeepSeek V3.1 Terminus (Reasoning) (DeepSeek)	33.9
62	GPT-5.2 (Non-reasoning) (OpenAI)	33.6
63	Doubao Seed Code (ByteDance Seed)	33.5
64	gpt-oss-120B (high) (OpenAI)	33.3
65	o4-mini (high) (OpenAI)	33.1
66	Claude 4 Sonnet (Non-reasoning) (Anthropic)	33.0
67	DeepSeek V3.2 Exp (Reasoning) (DeepSeek)	32.9
68	Mercury 2 (Inception)	32.8
69	Qwen3 Max Thinking (Preview) (Alibaba)	32.5
70	GLM-4.6 (Reasoning) (Z AI)	32.5
71	DeepSeek V3.2 (Non-reasoning) (DeepSeek)	32.1
72	Grok 3 mini Reasoning (high) (xAI)	32.1
73	K-EXAONE (Reasoning) (LG AI Research)	32.1
74	Nova 2.0 Pro Preview (low) (Amazon)	31.9
75	Claude 4.1 Opus (Reasoning) (Anthropic)	31.9
76	Qwen3 Max (Alibaba)	31.4
77	Claude 4.5 Haiku (Non-reasoning) (Anthropic)	31.1
78	Gemini 2.5 Flash Preview (Sep '25) (Reasoning) (Google)	31.1
79	Kimi K2 0905 (Kimi)	30.9
80	o1 (OpenAI)	30.8
81	Claude 3.7 Sonnet (Non-reasoning) (Anthropic)	30.8
82	Qwen3.5 35B A3B (Non-reasoning) (Alibaba)	30.7
83	MiMo-V2-Flash (Non-reasoning) (Xiaomi)	30.4
84	Gemini 2.5 Pro Preview (Mar' 25) (Google)	30.3
85	GLM-4.6 (Non-reasoning) (Z AI)	30.2
86	GLM-4.7-Flash (Reasoning) (Z AI)	30.1
87	Nova 2.0 Lite (medium) (Amazon)	29.7
88	Qwen3 235B A22B 2507 (Reasoning) (Alibaba)	29.5
89	Gemini 2.5 Pro Preview (May' 25) (Google)	29.5
90	ERNIE 5.0 Thinking Preview (Baidu)	29.1
91	Grok Code Fast 1 (xAI)	28.7
92	DeepSeek V3.1 Terminus (Non-reasoning) (DeepSeek)	28.5
93	DeepSeek V3.2 Exp (Non-reasoning) (DeepSeek)	28.4
94	Qwen3 Coder Next (Alibaba)	28.3
95	Apriel-v1.5-15B-Thinker (ServiceNow)	28.3
96	DeepSeek V3.1 (Non-reasoning) (DeepSeek)	28.1
97	Nova 2.0 Omni (medium) (Amazon)	28.0
98	DeepSeek V3.1 (Reasoning) (DeepSeek)	27.7
99	Apriel-v1.6-15B-Thinker (ServiceNow)	27.6
100	Qwen3 VL 235B A22B (Reasoning) (Alibaba)	27.6