Home
News
About
English
Español
中文
日本語
AIニュース
English
Español
中文
日本語
Compact View
techputs
Mar 3, 2026
OpenAIのDoDとの契約が反発を招いた後、ChatGPTのアンインストールが295%急増
OpenAIが米国国防総省との提携を発表した後、ChatGPTの1日のアンインストール数が295%急増しました。
TechCrunch
Mar 3, 2026
Cursorが報告によると年間経常収益20億ドルを突破
AIコーディングアシスタントのCursorが、年間経常収益20億ドルを突破し、3ヶ月で収益ランレートが倍増したと報じられています。
Fortune
Mar 3, 2026
電工不足はビッグテックの「生死を分ける」データセンター建設競争への脅威であり、Z世代への機会でもある | Fortune
深刻な電工不足がビッグテックのデータセンター拡張を脅かしており、Z世代にとって大きなキャリア機会となっています。
TechCrunch
Mar 3, 2026
DoDとの契約後、ChatGPTのアンインストールが295%急増
OpenAIが国防総省との契約を発表した後、ChatGPTのアンインストールが295%急増し、競合のClaudeはダウンロードを増やしました。
TechCrunch
Mar 2, 2026
AI企業が政府とどのように協力すべきかについて、誰も良い計画を持っていない
OpenAIのようなAI企業は、特に国防契約に関して、米国政府との協力に伴う複雑な政治的・倫理的課題への準備ができていません。
The Verge
Mar 2, 2026
AnthropicがClaudeの記憶機能をアップグレードし、AIスイッチ層の獲得を目指す
AnthropicはClaudeの記憶機能を無料ユーザーに拡大し、競合AIチャットボットからのデータインポートツールを追加しました。
The Verge
Mar 2, 2026
Apple might use Google servers to store data for its upgraded AI Siri
Appleは、アップグレードされたAI Siriのデータを保存するためにGoogleのサーバーを使用する可能性が報じられています。
Everyday AI
Mar 2, 2026
Anthropicの政府禁止:2億ドルを断念することがあなたのAIにもたらすもの
Anthropicは、大規模監視と自律型兵器に関する制限の撤廃を拒否したため、2億ドルの国防総省契約を失い、政府から取引禁止処分を受けました。
Fortune
Mar 2, 2026
高まる反発の中、OpenAIのSam Altman CEOがAnthropicのブラックリスト入りに続き、国防総省との取引を締結した理由を説明 | Fortune
OpenAIのSam Altman CEOは、Anthropicが契約を拒否した後の業界の緊張を緩和するため、同社と国防総省との取引を擁護しました。
TechCrunch
Mar 2, 2026
ユーザーはChatGPTからClaudeに乗り換えています。切り替え方法はこちら
ChatGPTと親会社OpenAIを取り巻く一連の論争と、Claudeの倫理的なAI実践へのコミットメントにより、ユーザーはChatGPTからClaudeに移行しています。
The Verge
Mar 2, 2026
最高裁判所、AI生成アートの著作権訴訟を聞き入れず
最高裁判所は、AI生成アートには著作権に必要な人間の創作性が欠けているとする判決の再審理を拒否しました。
TechCrunch
Mar 2, 2026
テックワーカー、Anthropicをサプライチェーンリスクとして指定しないよう国防総省と議会に要請
テックワーカーは、AI企業Anthropicが自社のシステムへの無制限アクセスを拒否したことを受け、米国国防総省がサプライチェーンリスクとして指定する可能性に抗議しています。
The Verge
Mar 2, 2026
Nvidia が AI の最先端を維持するためにフォトニクスに 40 億ドルを投じる
Nvidia は、将来の AI ニーズに対応するため、データセンター技術を強化するためにフォトニクス企業 Lumentum と Coherent に 40 億ドルを投資しています。
TechCrunch
Mar 2, 2026
既婚創業者夫婦の会社 14.ai がスタートアップのカスタマーサポートチームを置き換えている
既婚の創業者夫婦が設立したAIネイティブのカスタマーサービスエージェンシー14.aiは、スタートアップの顧客サポートチームを置き換えるために300万ドルを調達しました。
The Verge
Mar 2, 2026
OpenAIはいかにしてAI監視に関して国防総省に屈したか
OpenAIは「あらゆる合法的な使用」に同意することで国防総省との取引を確保したが、批判者は安全上のレッドラインを維持するという主張にもかかわらず、これにより大規模監視が許可されると指摘している。
TechCrunch
Mar 2, 2026
AnthropicのClaudeで広範囲な障害が発生
AnthropicのClaudeサービスで月曜日の朝に広範囲な障害が発生し、主にログインとClaude.aiへのアクセスに影響が出ました。
Dexerto
Mar 2, 2026
ハーバード大学の研究で、AIは実際には仕事を楽にするどころか難しくしていることが判明
ハーバード大学の研究によると、生成AIは期待値を高め、仕事の強度を増すことで、むしろ仕事量を増やしていることが示唆されています。
International Business Times UK
Mar 2, 2026
Ken Griffin's Citadel Securities Debunks Citrini's Terrifying 2028 AI Doomsday Prediction
Citadel Securitiesは、AIによる雇用の置き換えが2028年に経済崩壊を引き起こすというCitrini Researchの予測を、雇用データの安定性と物理的制約を挙げて反論しました。
Foreign Affairs
Mar 2, 2026
中国のAI兵器庫:人民解放軍の技術戦略は機能している
中国人民解放軍は、米国の技術的優位性に挑戦するため、AIを全戦闘領域に統合する近代化の第3段階「インテリジェント化」を急速に進めている。
The Verge
Mar 1, 2026
子犬のような目をしたロボットアームは、Lenovoの新しいデスクトップAIコンセプトの1つにすぎない
Lenovoは、表情豊かな目を持つロボットアームと、画面ベースの目覚まし時計型デバイスを含む2つのデスクトップAIコンパニオンコンセプトを発表しました。
Business Insider
Mar 1, 2026
Anthropic CEO:政府に異議を唱えることは最も愛国的なこと
AnthropicのCEOであるDario Amodei氏は、同社がペンタゴンの要求を拒否したことは愛国的な行為だと主張しています。
TechCrunch
Mar 1, 2026
Google、インドにおける長年のRCSスパムに対処—しかし単独ではない
Googleは、インドで増加するスパムと詐欺に対抗するため、Bharti Airtelと提携し、ネットワークレベルのスパムフィルタリングをRCSプラットフォームに統合します。
the Guardian
Mar 1, 2026
トランプ氏の禁止にもかかわらず、米軍がイラン攻撃にClaudeを使用したと報じられる
米軍は、トランプ氏による禁止にもかかわらず、イラン攻撃の諜報活動にAnthropicのClaude AIモデルを使用したと報じられています。
TechCrunch
Mar 1, 2026
投資家が明かす、AI SaaS企業でこれ以上求めないもの
投資家は、汎用的なAI SaaSツールから、深いワークフロー統合、独自のデータ、専門知識を持つ企業へと投資先をシフトしています。
TechCrunch
Mar 1, 2026
OpenAI、国防総省との契約に関する詳細を共有
OpenAIは、批判にもかかわらず、国防総省とのAI展開契約における悪用を防ぐための多層的な安全対策を詳述しました。
Interesting Engineering
Mar 1, 2026
OpenAI、AmazonとNVIDIAからの1100億ドルの資金調達で世界支配を目指す、評価額は8400億ドルに
OpenAIはAmazon、NVIDIA、SoftBankから1100億ドルの資金を調達し、企業評価額は7300億ドルに達しました。
TechCrunch
Mar 1, 2026
AnthropicのClaude、国防総省との論争後、App Storeで1位に浮上
AnthropicのClaudeチャットボットは、国防総省との論争を受けてApple App Storeで1位になりました。
Claude
Mar 1, 2026
Switch to Claude without starting over | Claude
Claudeを使用すると、他のAIプロバイダーからのAIの会話履歴と設定を簡単にコピー&ペーストで移行できます。
Business Insider
Mar 1, 2026
ClaudeがApp Storeで1位を獲得、OpenAIの国防総省との合意に抗議するChatGPTユーザーがAnthropicへ流出
OpenAIの国防総省との合意を受け、ChatGPTユーザーがAnthropicに流れた結果、ClaudeがApp Storeで1位になりました。
TechCrunch
Mar 1, 2026
Anthropic が自ら仕掛けた罠
Anthropic は軍事契約を拒否したことで危機に瀕しており、業界が拘束力のある規制を拒否したために自ら招いた窮状が浮き彫りになりました。
Garymarcus Substack
Feb 28, 2026
OpenAIの新たな資金調達は理にかなっているか?
著者は、OpenAIの最近の巨額資金調達を、真のベンチャーキャピタルではなく、サプライヤーファイナンスであるとして疑問視しています。
TechCrunch
Feb 28, 2026
AnthropicのClaude、国防総省との論争を受けてApp Storeで2位に浮上
AnthropicのClaudeチャットボットは、国防総省との論争を受けて、米国のApp Storeで2位にランクアップしました。
TechCrunch
Feb 28, 2026
AIブームを支える数十億ドル規模のインフラ契約
AIの優位性をめぐる競争は、クラウドプロバイダー、チップメーカー、巨大テック企業間の巨額取引によってインフラ構築競争を加速させている。
TechCrunch
Feb 28, 2026
OpenAIのSam Altmanが「技術的セーフガード」を伴う国防総省との契約を発表
OpenAIは国防総省との契約を締結し、技術的な安全対策を講じてAIモデルの利用を許可しました。
Live Science
Feb 28, 2026
科学者がAIエージェントをより失礼にさせたら、複雑な推論タスクでより良いパフォーマンスを発揮した
新しい研究によると、AIエージェントに議論中に割り込みや失礼な態度を許可すると、複雑な推論タスクでの精度が向上することがわかりました。
Ourfairfuture
Feb 28, 2026
抗議者在伦敦游行反对我们的人工智能霸主——要求政府和企业停止“鲁莽”行为
抗議者在伦敦游行,要求政府和企业暂停鲁莽的人工智能部署,因为他们担心失业和民主受到威胁。
The Jerusalem Post | JPost.com
Feb 28, 2026
Grokはイスラエルと米国がいつイランを攻撃するかを予測 | The Jerusalem Post
GrokというAIチャットボットが、イスラエルと米国によるイランへの共同攻撃の日付を正確に予測し、AIの予測能力に関する議論を呼んでいます。
OpenAI
Feb 28, 2026
戦争省との合意
OpenAIは、高度なAIシステムを機密環境に展開するための戦争省との合意に達し、強固な多層的セーフガードを設けました。
NBC News
Feb 28, 2026
トランプ氏が政府にAnthropicの使用停止を命じた後、OpenAIが国防総省と取引を締結
トランプ氏がAnthropicのAI利用停止を命じたことを受け、OpenAIは国防総省との配備に関する合意を締結しました。
TIME
Feb 28, 2026
チャット、コード、クロウ:AIエージェントがチームで働くとき何が起こるか
AIの進歩はチャットボットからツール使用エージェントへと進化し、現在はOpenClawのようなフレームワークで編成されるマルチエージェントフリートへと移行しています。
The Atlantic
Feb 28, 2026
ドナルド・トランプがAnthropicに宣戦布告
トランプ大統領は、機密性の高い軍事用途をめぐる対立を受け、全連邦機関に対しAnthropicのAI技術の使用を直ちに中止するよう命じました。
Fortune
Feb 28, 2026
Block CEO Jack DorseyがAIを理由にスタッフの半数近くを解雇し、来年にはほとんどの企業が同様の削減を行うと予測 | Fortune
BlockのCEOであるJack Dorseyは、AIによる効率化を理由にスタッフの半数近くを解雇すると発表しました。
Fortune
Feb 28, 2026
OpenAIは米国政府と交渉中、Sam Altmanがスタッフに伝える | Fortune
Sam AltmanはOpenAIの従業員に対し、米国戦争省との間でAIモデル使用に関する合意が近づいていると伝えました。
NPR
Feb 27, 2026
トランプ大統領、Anthropicの政府システムでの使用を禁止
トランプ大統領は連邦政府に対しAnthropicのAI製品の使用停止を命じ、国防総省は同社を国家安全保障上のリスクに指定しました。
The Verge
Feb 27, 2026
国防長官 Pete Hegseth が Anthropic をサプライチェーンリスクに指定
国防長官 Pete Hegseth は、緊張した交渉の後、AI企業 Anthropic をサプライチェーンリスクに指定しました。
Zeitgeistml Substack
Feb 27, 2026
殺人事件はAIに来るが、Claudeには来ない
Anthropicは安全原則を貫き国防総省との契約を拒否したため、数十億ドルの損失に直面する可能性があります。
CNBC
Feb 27, 2026
Jack Dorsey made the loudest case yet that AI is already replacing jobs
BlockのCEOであるJack Dorseyは、AIツールの影響を明確に挙げ、従業員の40%を削減すると発表しました。
TechCrunch
Feb 27, 2026
トランプ大統領、国防総省との対立後、連邦機関にAnthropicの使用停止を命じる
トランプ大統領は、国防総省との対立を受け、連邦機関に対しAnthropic製品の使用を停止するよう命じました。
TechCrunch
Feb 27, 2026
国防総省、Anthropicをサプライチェーンリスクに指定する動き
国防総省は、Anthropicが自律型兵器や大規模監視への利用を拒否したことを受け、同社をサプライチェーンリスクに指定しました。
The Verge
Feb 27, 2026
Trump orders federal agencies to drop Anthropic’s AI
ドナルド・トランプ大統領は、AnthropicのAI利用を巡る対立を受け、全連邦機関に対し同社の製品の使用を直ちに中止するよう命じました。
CapitalAI Daily
Feb 27, 2026
Citrini AIレポートの共著者が、Blockが4,000人を解雇した後、ホワイトカラー労働にとって「恐ろしい状況」だと警告
Citrini AIレポートの共著者は、Blockが4,000人を解雇した後、ホワイトカラーの雇用に厳しい見通しを示しています。
Live Science
Feb 27, 2026
世界最難と謳われるこの新しいAI試験に合格することは、AGIの最初の兆候を示す可能性がある
研究者たちは、AIモデルが人間の知識レベルにどれだけ近づいているかを測る、2500問からなる困難な「人類最後の試験」を作成しました。
TechCrunch
Feb 27, 2026
マスク氏、宣誓供述でOpenAIを酷評、「Grokのせいで自殺した人などいない」と発言
イーロン・マスク氏は宣誓供述でOpenAIの安全性を酷評し、自身のGrokが自殺を引き起こした人物はいないと主張しました。
TechCrunch
Feb 27, 2026
Anthropic 対 ペンタゴン:実際に何が問題なのか?
Anthropicと国防総省の間で、AIモデルの軍事利用を巡る対立が生じています。
TechCrunch
Feb 27, 2026
ChatGPTが週アクティブユーザー9億人に到達
OpenAIは、ChatGPTが9億人の週アクティブユーザーと5000万人の有料購読者に達したと発表しました。
TechCrunch
Feb 27, 2026
AI音楽ジェネレーターSunoが有料サブスクライバー200万人と年間経常収益3億ドルを達成
AI音楽ジェネレーターSunoが有料サブスクライバー200万人と年間経常収益3億ドルを達成しました。
The Verge
Feb 27, 2026
AI 対 ペンタゴン:キラーロボット、大量監視、そしてレッドライン
Anthropic は、自社のAIモデルから致命的な自律兵器に関する安全制限を解除するよう求める国防総省の要求に抵抗しています。
TechCrunch
Feb 27, 2026
Perplexityの新しいComputerは、ユーザーには多くのAIモデルが必要であるという同社の新たな賭けである
Perplexityは、19のAIモデルを統合し複雑なワークフローを自律的に実行するエージェントツール「Perplexity Computer」を発表しました。
Gemini
Feb 27, 2026
2月のGeminiドロップでGeminiアプリの新機能をご覧ください。
2月のGeminiドロップでは、Lyria 3の音楽作成、Gemini 3.1のインテリジェンス向上、Nano Banana 2の画像生成、Veoテンプレート、検証済みの科学的引用が導入されました。
TechCrunch
Feb 27, 2026
GoogleとOpenAIの従業員が公開書簡でAnthropicの国防総省への姿勢を支持
GoogleとOpenAIの従業員360人以上が、国防総省による監視や自律型兵器へのAI利用を拒否するAnthropicを支持する公開書簡に署名しました。
The Verge
Feb 27, 2026
私たちは自律型キラーロボットを持つ必要はない
Anthropicなどの企業が、致命的な自律兵器や監視のためのAIの無制限使用を許可するよう国防総省から圧力を受けていることに、テクノロジー労働者が懸念を抱いています。
The Verge
Feb 27, 2026
Galaxy S26 は写真の悪夢である
Galaxy S26の新しいAIカメラ機能は、写真撮影の性質を根本的に変えるため批判されています。
The Verge
Feb 27, 2026
OpenAIがAmazon、Nvidia、Softbankから1100億ドルの投資を獲得
OpenAIはAmazon、Nvidia、SoftBankから新たに1100億ドルの投資を獲得し、企業価値は7300億ドルに達しました。
Scientific American
Feb 27, 2026
LabOS AI搭載スマートゴーグルはいかにして科学における人的ミスを減らすことができるか
LabOSはAI搭載のスマートゴーグルを用いて、初心者の科学者をリアルタイムで指導し、ミスを防ぎ、トレーニングを加速させます。
TechCrunch
Feb 27, 2026
OpenAIが史上最大級のプライベート資金調達ラウンドで1100億ドルを調達
OpenAIは、AmazonとNvidiaからの主要な投資を含め、7300億ドルの事前評価額で1100億ドルのプライベート資金を確保しました。
Phoronix
Feb 27, 2026
Linux 7.0-rc2 向け多数の AMDXDNA Ryzen AI ドライバー修正
AMD は Linux 7.0-rc2 リリースに先立ち、AMDXDNA Ryzen AI ドライバーに対して多数の修正を送信しました。
AP News
Feb 27, 2026
トランプ大統領、連邦機関に対しAnthropic技術の使用段階的廃止を命じる | AP News
トランプ大統領は、Anthropicとの安全に関する公的な論争を受け、連邦機関に対しAnthropicのAI技術の使用停止を命じました。
CNN
Feb 27, 2026
AIが世界のメモリチップを食い尽くし、スマートフォン価格が記録的な高騰、報告書が示す
AI需要の急増によりメモリチップが不足し、スマートフォン価格が高騰し、販売に影響を与える可能性がある。
AP News
Feb 27, 2026
Fintech企業Block、AIを理由に4,000人以上を解雇 | AP通信
フィンテック企業のBlockは、AIを理由に4,000人以上の従業員を解雇しています。
OpenAI
Feb 27, 2026
OpenAIとAmazonが戦略的パートナーシップを発表
OpenAIとAWSは、Amazonによる500億ドルの投資を含む戦略的パートナーシップを発表し、AIイノベーションを加速させます。
ニュースをもっと見る
Best LLMs and AI Chatbots
Data Source:
Artificial Analysis
Rank
Model
Score
1
Gemini 3.1 Pro Preview
(Google)
57.2
2
GPT-5.3 Codex (xhigh)
(OpenAI)
54.0
3
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
53.0
4
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
51.7
5
GPT-5.2 (xhigh)
(OpenAI)
51.3
6
GLM-5 (Reasoning)
(Z AI)
49.8
7
Claude Opus 4.5 (Reasoning)
(Anthropic)
49.7
8
GPT-5.2 Codex (xhigh)
(OpenAI)
49.0
9
Gemini 3 Pro Preview (high)
(Google)
48.4
10
GPT-5.1 (high)
(OpenAI)
47.7
11
Kimi K2.5 (Reasoning)
(Kimi)
46.8
12
GPT-5.2 (medium)
(OpenAI)
46.6
13
Claude Opus 4.6 (Non-reasoning, High Effort)
(Anthropic)
46.5
14
Gemini 3 Flash Preview (Reasoning)
(Google)
46.4
15
Qwen3.5 397B A17B (Reasoning)
(Alibaba)
45.0
16
GPT-5 (high)
(OpenAI)
44.6
17
GPT-5 Codex (high)
(OpenAI)
44.6
18
Claude Sonnet 4.6 (Non-reasoning, High Effort)
(Anthropic)
44.4
19
GPT-5.1 Codex (high)
(OpenAI)
43.1
20
Claude Opus 4.5 (Non-reasoning)
(Anthropic)
43.1
21
Claude 4.5 Sonnet (Reasoning)
(Anthropic)
43.0
22
Claude Sonnet 4.6 (Non-reasoning, Low Effort)
(Anthropic)
42.6
23
Qwen3.5 27B (Reasoning)
(Alibaba)
42.1
24
GLM-4.7 (Reasoning)
(Z AI)
42.1
25
GPT-5 (medium)
(OpenAI)
42.0
26
MiniMax-M2.5
(MiniMax)
41.9
27
DeepSeek V3.2 (Reasoning)
(DeepSeek)
41.7
28
Qwen3.5 122B A10B (Reasoning)
(Alibaba)
41.6
29
Grok 4
(xAI)
41.5
30
MiMo-V2-Flash (Feb 2026)
(Xiaomi)
41.5
31
Gemini 3 Pro Preview (low)
(Google)
41.3
32
GPT-5 mini (high)
(OpenAI)
41.2
33
Kimi K2 Thinking
(Kimi)
40.9
34
o3-pro
(OpenAI)
40.7
35
GLM-5 (Non-reasoning)
(Z AI)
40.6
36
Qwen3.5 397B A17B (Non-reasoning)
(Alibaba)
40.1
37
Qwen3 Max Thinking
(Alibaba)
39.9
38
MiniMax-M2.1
(MiniMax)
39.4
39
GPT-5 (low)
(OpenAI)
39.2
40
MiMo-V2-Flash (Reasoning)
(Xiaomi)
39.2
41
GPT-5 mini (medium)
(OpenAI)
38.9
42
Claude 4 Sonnet (Reasoning)
(Anthropic)
38.7
43
GPT-5.1 Codex mini (high)
(OpenAI)
38.6
44
Grok 4.1 Fast (Reasoning)
(xAI)
38.6
45
o3
(OpenAI)
38.4
46
Kimi K2.5 (Non-reasoning)
(Kimi)
37.3
47
Qwen3.5 27B (Non-reasoning)
(Alibaba)
37.2
48
Claude 4.5 Haiku (Reasoning)
(Anthropic)
37.1
49
Qwen3.5 35B A3B (Reasoning)
(Alibaba)
37.1
50
Claude 4.5 Sonnet (Non-reasoning)
(Anthropic)
37.1
51
MiniMax-M2
(MiniMax)
36.1
52
KAT-Coder-Pro V1
(KwaiKAT)
36.0
53
Qwen3.5 122B A10B (Non-reasoning)
(Alibaba)
35.9
54
Nova 2.0 Pro Preview (medium)
(Amazon)
35.7
55
Grok 4 Fast (Reasoning)
(xAI)
35.1
56
Gemini 3 Flash Preview (Non-reasoning)
(Google)
35.0
57
Claude 3.7 Sonnet (Reasoning)
(Anthropic)
34.7
58
Gemini 2.5 Pro
(Google)
34.6
59
GLM-4.7 (Non-reasoning)
(Z AI)
34.2
60
DeepSeek V3.2 Speciale
(DeepSeek)
34.1
61
DeepSeek V3.1 Terminus (Reasoning)
(DeepSeek)
33.9
62
GPT-5.2 (Non-reasoning)
(OpenAI)
33.6
63
Doubao Seed Code
(ByteDance Seed)
33.5
64
gpt-oss-120B (high)
(OpenAI)
33.3
65
o4-mini (high)
(OpenAI)
33.1
66
Claude 4 Sonnet (Non-reasoning)
(Anthropic)
33.0
67
DeepSeek V3.2 Exp (Reasoning)
(DeepSeek)
32.9
68
Mercury 2
(Inception)
32.8
69
Qwen3 Max Thinking (Preview)
(Alibaba)
32.5
70
GLM-4.6 (Reasoning)
(Z AI)
32.5
71
DeepSeek V3.2 (Non-reasoning)
(DeepSeek)
32.1
72
Grok 3 mini Reasoning (high)
(xAI)
32.1
73
K-EXAONE (Reasoning)
(LG AI Research)
32.1
74
Nova 2.0 Pro Preview (low)
(Amazon)
31.9
75
Claude 4.1 Opus (Reasoning)
(Anthropic)
31.9
76
Qwen3 Max
(Alibaba)
31.4
77
Claude 4.5 Haiku (Non-reasoning)
(Anthropic)
31.1
78
Gemini 2.5 Flash Preview (Sep '25) (Reasoning)
(Google)
31.1
79
Kimi K2 0905
(Kimi)
30.9
80
o1
(OpenAI)
30.8
81
Claude 3.7 Sonnet (Non-reasoning)
(Anthropic)
30.8
82
Qwen3.5 35B A3B (Non-reasoning)
(Alibaba)
30.7
83
MiMo-V2-Flash (Non-reasoning)
(Xiaomi)
30.4
84
Gemini 2.5 Pro Preview (Mar' 25)
(Google)
30.3
85
GLM-4.6 (Non-reasoning)
(Z AI)
30.2
86
GLM-4.7-Flash (Reasoning)
(Z AI)
30.1
87
Nova 2.0 Lite (medium)
(Amazon)
29.7
88
Qwen3 235B A22B 2507 (Reasoning)
(Alibaba)
29.5
89
Gemini 2.5 Pro Preview (May' 25)
(Google)
29.5
90
ERNIE 5.0 Thinking Preview
(Baidu)
29.1
91
Grok Code Fast 1
(xAI)
28.7
92
DeepSeek V3.1 Terminus (Non-reasoning)
(DeepSeek)
28.5
93
DeepSeek V3.2 Exp (Non-reasoning)
(DeepSeek)
28.4
94
Qwen3 Coder Next
(Alibaba)
28.3
95
Apriel-v1.5-15B-Thinker
(ServiceNow)
28.3
96
DeepSeek V3.1 (Non-reasoning)
(DeepSeek)
28.1
97
Nova 2.0 Omni (medium)
(Amazon)
28.0
98
DeepSeek V3.1 (Reasoning)
(DeepSeek)
27.7
99
Apriel-v1.6-15B-Thinker
(ServiceNow)
27.6
100
Qwen3 VL 235B A22B (Reasoning)
(Alibaba)
27.6