Home
News
About
English
Español
中文
日本語
AIニュース
English
Español
中文
日本語
Compact View
Gizmodo
Apr 30, 2026
Anthropicが次回の資金調達ラウンドでOpenAIの評価額を上回る計画との報道
Anthropicは、OpenAIの最近の評価額8520億ドルを上回る資金調達ラウンドを検討していると報じられました。
TechCrunch
Apr 30, 2026
Amazonのクラウド事業が急成長、同時に設備投資も急増
Amazonのクラウド事業はAI需要により28%増収となりましたが、インフラ投資の拡大が一時的にフリーキャッシュフローを圧迫しています。
TechCrunch
Apr 30, 2026
情報筋:Anthropicが9000億ドルの評価額で500億ドルの資金調達ラウンドを検討中
Anthropicは投資家からの強い需要を受け、最大9000億ドルの評価額で500億ドルの資金調達を行う可能性があります。
The Verge
Apr 30, 2026
イーロン・マスクが法廷で直面する最大の敵はイーロン・マスクである
イーロン・マスクは法廷での反対尋問において、非協力的な態度や矛盾した証言を繰り返したことで、自身の信憑性を大きく損なった。
TechCrunch
Apr 29, 2026
証言台に立つ Elon Musk は、自身のツイートから逃れることはできない
Elon Musk は OpenAI に対する訴訟で証言台に立ち、SNS 上での矛盾した発言について厳しく追及されました。
TechCrunch
Apr 29, 2026
Metaは依然としてAR/VRに巨額の資金を投じている
MetaのReality Labs部門は四半期ごとに約40億ドルの損失を出し続けており、同時にAI開発への投資も大幅に拡大しています。
TechCrunch
Apr 29, 2026
Satya Nadella、「新しい OpenAI 契約を『活用』する準備はできている」と発言
マイクロソフトの Satya Nadella CEO は、改定された OpenAI との提携契約のもと、同社のAIモデルを最大限に活用する意向を示しました。
TechCrunch
Apr 29, 2026
MicrosoftはCopilotの有料ユーザーが2000万人を超え、実際に活用されていると発表
MicrosoftはCopilotの有料企業向けシートが2000万に達し、高いエンゲージメントを獲得していると発表しました。
TechCrunch
Apr 29, 2026
Google Cloudの収益が200億ドルを突破、ただし成長はキャパシティによって制限されたと言及
Google CloudはAI需要の急増により四半期収益が200億ドルを超えましたが、インフラの供給能力が成長のボトルネックとなっています。
TechCrunch
Apr 29, 2026
Google、第1四半期に2500万件のサブスクリプションを獲得。YouTubeとGoogle Oneが牽引
Alphabetは第1四半期に2500万件の有料サブスクリプションを新規獲得し、総数が3億5000万件に達したと発表しました。
The Verge
Apr 29, 2026
Google 検索クエリ、前四半期に「過去最高」を記録
Alphabet は 2026 年第 1 四半期の Google 検索クエリが過去最高を記録し、AI サブスクリプションも好調だったと発表しました。
LinkedIn
Apr 29, 2026
IBM、シカゴ拠点で750名のAIおよび量子関連職を計画
IBMはイリノイ大学アーバナ・シャンペーン校との提携を拡大し、AIおよび量子スーパーコンピューティングの研究を推進します。
TechCrunch
Apr 29, 2026
Parallel Web Systemsが前回の大型資金調達から5カ月で評価額20億ドルに到達
Parag Agrawal氏率いるAIスタートアップのParallel Web Systemsが、1億ドルの資金調達を経て評価額20億ドルに達しました。
The Verge
Apr 29, 2026
マスク対アルトマン裁判でこれまでに明らかになったすべての証拠
マスク対アルトマン裁判の証拠は、OpenAIの初期の内部コミュニケーション、ガバナンスへの懸念、そして設立理念を明らかにしています。
The Verge
Apr 29, 2026
UbuntuのAI計画、Linuxユーザーが「キルスイッチ」を求める事態に
Ubuntuユーザーは今後のAI統合に懸念を抱いており、Canonicalはこれらの機能が任意かつ削除可能であることを明らかにしました。
TechCrunch
Apr 29, 2026
Google Photos、AIを活用して映画『Clueless』の象徴的なクローゼットを現実にする
Google Photosは、映画『Clueless』にインスパイアされたAI搭載のデジタルクローゼット機能を発表しました。
TechCrunch
Apr 29, 2026
Google TV にさらなる Gemini 機能が追加へ
Googleは、Google TVデバイスに新しい生成AIツールとYouTube Shortsフィードを導入します。
Phoronix
Apr 29, 2026
Linuxのsched_ext、AIによるコードレビュー増加を受けて多数のバグ修正を実施
MetaのChris Mason氏によるAIを活用したコードレビューにより、Linuxのsched_ext機能で多くのバグ修正が行われました。
The Verge
Apr 29, 2026
Google Photosが手持ちの服を試着できるAI機能をリリース
Google Photosは、手持ちの服を組み合わせてバーチャル試着ができるAI衣類管理機能を導入します。
Gemini
Apr 29, 2026
Gemini で簡単にファイルを作成できるようになりました。
Gemini で PDF や Office ドキュメントなどの各種ファイルを、チャットから直接生成・ダウンロードできるようになりました。
Gemini
Apr 29, 2026
Google TV で作成、検索、ストリーミングを楽しむ新しい方法
Google TV が AI を活用したクリエイティブツール、写真検索機能、およびショート動画専用フィードを追加し、よりパーソナライズされた体験を提供します。
OpenAI
Apr 29, 2026
インテリジェンス時代のコンピューティング・インフラを構築する
OpenAIは、AIへの高まる需要に対応するため、「Stargate」イニシアチブを通じて大規模なコンピューティング・インフラの構築を加速させています。
The Verge
Apr 29, 2026
タンブラーリッジの家族、容疑者のChatGPT活動を警察に通知しなかったとしてOpenAIを提訴
タンブラーリッジ銃乱射事件の被害者家族が、容疑者のChatGPT活動を報告しなかったとしてOpenAIとサム・アルトマンを訴えています。
The Verge
Apr 29, 2026
ChatGPTのダウンロードが鈍化、OpenAIのIPOに問題が生じる可能性
ChatGPTのユーザー増加が鈍化し、アンインストールが増加、Claudeなどの競合に後れを取っており、OpenAIのIPO計画に影響を与える可能性がある。
The Verge
Apr 29, 2026
ラリーのリスク事業
オラクルは、推論による利益を目指し、OpenAIとの3000億ドルの契約を通じて、AIへの大規模でリスクの高い賭けを行っています。
TechCrunch
Apr 29, 2026
Firestorm Labsが8200万ドルを調達、ドローン工場を現場へ展開
防衛スタートアップのFirestorm Labsは、コンテナ型3Dプリントドローン工場を軍の最前線へ配備するため8200万ドルを調達しました。
TechCrunch
Apr 29, 2026
Shapes:人間とAIを同じグループチャットに招き入れるアプリが登場
Shapesは800万ドルの資金調達を実施した、AIキャラクターをグループチャットに統合して人間同士の交流を促進するソーシャルアプリです。
The Verge
Apr 29, 2026
Taylor SwiftのディープフェイクがTikTokで詐欺を拡散している
詐欺師たちがTaylor SwiftやRihannaなどのAI生成ディープフェイクを悪用し、TikTokで偽の報酬プログラムを宣伝しています。
The Verge
Apr 29, 2026
中国、百度の混乱を受けてロボットタクシーの新規ライセンスを凍結
百度のロボットタクシーが武漢で交通渋滞を引き起こしたことを受け、中国は自動運転車の新規ライセンス発行を停止しました。
The Verge
Apr 29, 2026
GitHubは6時間以内に重大な脆弱性を急いで修正した
GitHubは、Wiz ResearchがAIを用いて発見した重大なリモートコード実行の脆弱性を6時間以内に迅速に修正しました。
TechCrunch
Apr 29, 2026
Coby Adcock氏のScout AI、戦争に向けたモデル訓練のため1億ドルを調達。ブートキャンプを訪問した。
Scout AIは、自律走行車両やドローン戦闘システム向けの軍事用AIモデルを開発するため1億ドルを調達しました。
The Verge
Apr 29, 2026
ゼネラルモーターズが400万台の自動車にGeminiを追加
ゼネラルモーターズは、400万台の車両にGoogleのGemini AIを導入し、従来のGoogleアシスタントをより直感的なAIへ刷新します。
Fortune
Apr 29, 2026
「計算コストは従業員のコストをはるかに上回る」:Nvidia幹部、現在はAIの方が人間を雇うより高コストだと語る | Fortune
Nvidiaの幹部Bryan Catanzaro氏は、現状ではAIの計算コストが人間の労働コストを大きく上回っていると指摘しています。
Interesting Engineering
Apr 29, 2026
Snapchat、会話のような体験を促すAIエージェントを用いたチャット広告を導入
Snapchatは、チャット内でAIエージェントを通じてブランドがユーザーと対話できる「AI Sponsored Snaps」を開始しました。
OpenAI
Apr 29, 2026
インテリジェンス時代のサイバーセキュリティ
OpenAIは、AIを活用したサイバー防御を民主化し、進化する脅威に対して国家安全保障を強化するための5つの柱からなる行動計画を発表しました。
TechCrunch
Apr 29, 2026
OpenAIの裁判で、Muskはかつての友情を再検証する
Elon Muskは、OpenAIの共同設立はAIの安全性を巡るLarry Pageとの対立がきっかけだったと証言した。
The Verge
Apr 28, 2026
Elon Musk appeared more petty than prepared
Elon Musk は OpenAI に対する訴訟の証言において、核心的な法的議論よりも自身の誇示や個人的な不満に終始し、準備不足な印象を与えた。
Novara Press
Apr 28, 2026
AIがタブを切り替える必要がなくなった日 — Claudeがあなたのソフトウェアの中に - Novarapress
Anthropicは、Model Context Protocolを活用し、主要なクリエイティブツールにClaudeを直接統合することで、専門的なワークフローを強化しました。
The Verge
Apr 28, 2026
イーロン・マスク、すべては人類を救うためだと陪審員に語る
イーロン・マスクは法廷で、自らの事業は気候変動やAIといった人類の生存リスクから人類を守るための慈善活動であると主張しました。
The Verge
Apr 28, 2026
Taylor SwiftがAI模倣者に対する法的措置を強化
Taylor Swiftは、自身の音声や画像をAIによる無断利用から守るため、新たな商標登録を目指しています。
TechCrunch
Apr 28, 2026
Amazon はすでに AWS で新しい OpenAI 製品を提供しています
AWS は現在、OpenAI の最新モデル、Codex、および新しいエージェントサービスを提供しており、協力関係の深化を示しています。
The Verge
Apr 28, 2026
Elon Musk takes the stand in high-profile trial against OpenAI
Elon Musk が OpenAI に対する注目の裁判で証言を開始し、Sam Altman らが企業の設立理念に違反したと主張しました。
TechCrunch
Apr 28, 2026
Amazonが製品ページでAIを活用した音声Q&A体験を開始
Amazonは、ユーザーが製品について質問し、AIによる会話形式の音声回答を受け取れる新機能を開始しました。
TechCrunch
Apr 28, 2026
Anthropicの拒否を受け、Googleは国防総省のAIアクセス権を拡大
Anthropicが条件を拒否したことを受け、Googleは米国防総省に対し、機密ネットワークでのAI利用を許可しました。
Phoronix
Apr 28, 2026
AMDXDNAドライバー、Ryzen AIマルチユーザー公平性のためのハードウェアスケジューラー時間量子を準備
AMDのドライバーが、Ryzen AI NPUの公平なリソースアクセスを確保するためにハードウェアスケジューラー時間量子を追加します。
The Verge
Apr 28, 2026
ClaudeがPhotoshop、Blender、Abletonに直接プラグイン可能に
Anthropicは、ClaudeをPhotoshop、Blender、Abletonなどのクリエイティブソフトと統合し、ワークフローを効率化する新しいコネクタをリリースしました。
TechCrunch
Apr 28, 2026
LovableがiOSおよびAndroid向けに「vibe coding」アプリをリリース
Lovableは、音声やテキストの指示でアプリ開発ができるAI搭載の「vibe coding」アプリをiOSおよびAndroid向けに公開しました。
Anthropic
Apr 28, 2026
Claude for Creative Work
Anthropicは、Claudeを主要なクリエイティブソフトウェアと統合するコネクタを発表し、制作効率と創造性の向上を支援します。
The Verge
Apr 28, 2026
マスク氏とアルトマン氏が法廷へ
イーロン・マスク氏とOpenAIの裁判が始まり、情報公開とマスク氏の敗訴の可能性が予想される。
TechCrunch
Apr 28, 2026
YouTubeは、ガイド付きの回答を表示するAI搭載検索機能をテストしています
YouTubeは、Premium加入者向けに「Ask YouTube」というAI搭載検索機能をテストしており、段階的な回答を提供します。
TechCrunch
Apr 28, 2026
BCIスタートアップNeurable、「マインドリーディング」技術をコンシューマー向けウェアラブルにライセンス提供へ
BCIスタートアップのNeurableは、非侵襲的な「マインドリーディング」技術をヘッドフォンや帽子などのコンシューマー向けウェアラブルにライセンス提供しています。
TechCrunch
Apr 28, 2026
Red Hat の OpenClaw メンテナーがエンタープライズ向け Claw デプロイメントを大幅に安全化
Red Hat のエンジニア Sally O’Malley が、企業環境での OpenClaw AI エージェントの安全なデプロイと管理のための Tank OS をリリースしました。
TechCrunch
Apr 28, 2026
Otterの新機能により、ユーザーは企業向けツール全体を検索可能に
Otterは企業向け検索機能を導入し、GmailやSalesforceなどの連携アプリのデータを横断的に検索できるようになりました。
Anthropic
Apr 28, 2026
戦争省との現状について
Anthropicは、戦争省によるサプライチェーン・リスク指定に対して法的措置を講じる一方、軍への支援を継続すると表明しました。
The Verge
Apr 28, 2026
Googleと国防総省、AIの「あらゆる合法的」利用に関する合意に達したと報じられる
Googleが、国防総省が自社のAIモデルを「あらゆる合法的目的」で利用することを認める機密契約を締結したと報じられました。
The Verge
Apr 28, 2026
キラー・スクリプトキッドの襲来
AIの進化がアマチュアハッカーの能力を底上げし、脆弱性発見を自動化することで、組織はセキュリティ戦略の根本的な見直しを迫られています。
The Verge
Apr 28, 2026
Musk 対 Altman 訴訟の陪審員選定:「人々は彼を好んでいない」
Elon Musk と Sam Altman の裁判における陪審員選定では、Musk に対する世間の強い反感が陪審員の公平性に影響を与える懸念が浮き彫りとなりました。
The Verge
Apr 28, 2026
Google、YouTube向けAIチャットボット検索をテスト中
Googleは、米国の一部のPremiumユーザー向けに、AIを活用したYouTubeの対話型検索機能をテストしています。
The Verge
Apr 27, 2026
CanonicalがUbuntu LinuxにおけるAI計画を発表
Canonicalは2026年を通じてUbuntu LinuxにAI機能を統合し、モデルの透明性とローカル推論を重視する方針を発表しました。
The Verge
Apr 27, 2026
Google社員、Sundar Pichaiに機密軍事AIの使用拒否を求める
600人以上のGoogle社員が、Sundar Pichaiに対し、機密軍事AIの使用を拒否するよう求めた。
TechCrunch
Apr 27, 2026
OpenAI、500億ドルのAmazon取引を巡るMicrosoftとの法的危機を解消
OpenAIとMicrosoftは提携を見直し、OpenAIのAmazonとの巨額契約を巡る法的リスクを解消しました。
TechCrunch
Apr 27, 2026
DeepMind の David Silver が、人間のデータなしで学習する AI を構築するために 11 億ドルを調達しました
David Silver 氏の Ineffable Intelligence は、人間のデータなしで学習する AI を構築するために 11 億ドルを調達しました。
The Verge
Apr 27, 2026
マイクロソフトと OpenAI の有名な AGI 契約は終了
マイクロソフトと OpenAI は AGI 条項を廃止し、収益分配とクラウドパートナーシップを変更しました。
TechCrunch
Apr 27, 2026
SkyeのiPhone向けAIホーム画面アプリ、ローンチ前に投資家の支持を獲得
SkyeのiPhone向けAIホーム画面アプリは、ローンチ前に358万ドル以上のシード前資金を調達しました。
The Verge
Apr 27, 2026
Elon Musk と Sam Altman による OpenAI の未来を巡る法廷闘争
Elon Musk が OpenAI を提訴し、Sam Altman と Greg Brockman が利益を優先するために非営利の使命を捨てたと主張しています。
The Verge
Apr 27, 2026
Canva、AIツールが「Palestine」をデザイン内で置き換えた件で謝罪
CanvaのAIツール「Magic Layers」がデザイン内の「Palestine」という単語を誤って置き換えたため、同社は謝罪し、修正を行いました。
TechCrunch
Apr 27, 2026
中国、数ヶ月にわたる調査の末Metaの20億ドルのManus買収を拒否
中国国家発展改革委員会(NDRC)は、MetaによるAIスタートアップManusの20億ドル規模の買収を阻止し、取引の解消を命じました。
TechCrunch
Apr 27, 2026
OpenAIはアプリをAIエージェントに置き換えるスマートフォンを開発中か
アナリストのMing-Chi Kuo氏によると、OpenAIは従来のアプリをAIエージェントに置き換えるスマートフォンを開発しており、2028年の量産を目指しているとのことです。
Gemini
Apr 27, 2026
Google と Kaggle の新しい AI Agents Vibe コーディングコースに参加しよう
Google と Kaggle は、自然言語ベースの AI エージェント開発を学ぶための無料の AI Agents Intensive コースを 2026 年 6 月に開催します。
The Verge
Apr 27, 2026
AIデザインの車が形になりつつある
AIは3Dモデリングと空力シミュレーションを加速し、開発時間を大幅に短縮することで自動車デザインに革命をもたらしています。
ニュースをもっと見る
Best LLMs and AI Chatbots
Data Source:
Artificial Analysis
Rank
Model
Score
1
GPT-5.5 (xhigh)
(OpenAI)
60.2
2
GPT-5.5 (high)
(OpenAI)
58.9
3
Claude Opus 4.7 (Adaptive Reasoning, Max Effort)
(Anthropic)
57.3
4
Gemini 3.1 Pro Preview
(Google)
57.2
5
GPT-5.4 (xhigh)
(OpenAI)
56.8
6
GPT-5.5 (medium)
(OpenAI)
56.7
7
Kimi K2.6
(Kimi)
53.9
8
MiMo-V2.5-Pro
(Xiaomi)
53.8
9
GPT-5.3 Codex (xhigh)
(OpenAI)
53.6
10
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
53.0
11
Muse Spark
(Meta)
52.1
12
Claude Opus 4.7 (Non-reasoning, High Effort)
(Anthropic)
51.8
13
Qwen3.6 Max Preview
(Alibaba)
51.8
14
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)
(Anthropic)
51.7
15
DeepSeek V4 Pro (Reasoning, Max Effort)
(DeepSeek)
51.5
16
GLM-5.1 (Reasoning)
(Z AI)
51.4
17
GPT-5.2 (xhigh)
(OpenAI)
51.3
18
GPT-5.5 (low)
(OpenAI)
50.8
19
Qwen3.6 Plus
(Alibaba)
50.0
20
DeepSeek V4 Pro (Reasoning, High Effort)
(DeepSeek)
49.8
21
GLM-5 (Reasoning)
(Z AI)
49.8
22
Claude Opus 4.5 (Reasoning)
(Anthropic)
49.7
23
MiniMax-M2.7
(MiniMax)
49.6
24
Grok 4.20 0309 v2 (Reasoning)
(xAI)
49.3
25
MiMo-V2-Pro
(Xiaomi)
49.2
26
MiMo-V2.5
(Xiaomi)
49.0
27
GPT-5.2 Codex (xhigh)
(OpenAI)
49.0
28
GPT-5.4 mini (xhigh)
(OpenAI)
48.9
29
Grok 4.20 0309 (Reasoning)
(xAI)
48.5
30
Gemini 3 Pro Preview (high)
(Google)
48.4
31
GPT-5.4 (low)
(OpenAI)
47.9
32
GPT-5.1 (high)
(OpenAI)
47.7
33
GLM-5-Turbo
(Z AI)
46.8
34
Kimi K2.5 (Reasoning)
(Kimi)
46.8
35
GPT-5.2 (medium)
(OpenAI)
46.6
36
DeepSeek V4 Flash (Reasoning, Max Effort)
(DeepSeek)
46.5
37
Claude Opus 4.6 (Non-reasoning, High Effort)
(Anthropic)
46.5
38
Gemini 3 Flash Preview (Reasoning)
(Google)
46.4
39
Qwen3.6 27B (Reasoning)
(Alibaba)
45.8
40
Qwen3.5 397B A17B (Reasoning)
(Alibaba)
45.0
41
DeepSeek V4 Flash (Reasoning, High Effort)
(DeepSeek)
44.9
42
MiMo-V2-Omni-0327
(Xiaomi)
44.9
43
GPT-5 (high)
(OpenAI)
44.6
44
GPT-5 Codex (high)
(OpenAI)
44.6
45
Claude Sonnet 4.6 (Non-reasoning, High Effort)
(Anthropic)
44.4
46
GPT-5.4 nano (xhigh)
(OpenAI)
44.0
47
KAT Coder Pro V2
(KwaiKAT)
43.8
48
GLM-5.1 (Non-reasoning)
(Z AI)
43.8
49
Qwen3.6 35B A3B (Reasoning)
(Alibaba)
43.5
50
MiMo-V2-Omni
(Xiaomi)
43.4
51
GPT-5.1 Codex (high)
(OpenAI)
43.1
52
Claude Opus 4.5 (Non-reasoning)
(Anthropic)
43.1
53
Kimi K2.6 (Non-reasoning)
(Kimi)
43.0
54
Claude 4.5 Sonnet (Reasoning)
(Anthropic)
43.0
55
GLM 5V Turbo (Reasoning)
(Z AI)
42.9
56
Claude Sonnet 4.6 (Non-reasoning, Low Effort)
(Anthropic)
42.6
57
GLM-4.7 (Reasoning)
(Z AI)
42.1
58
Qwen3.5 27B (Reasoning)
(Alibaba)
42.1
59
GPT-5 (medium)
(OpenAI)
42.0
60
Claude 4.1 Opus (Reasoning)
(Anthropic)
42.0
61
Hy3-preview (Reasoning)
(Tencent)
41.9
62
MiniMax-M2.5
(MiniMax)
41.9
63
DeepSeek V3.2 (Reasoning)
(DeepSeek)
41.7
64
Qwen3.5 122B A10B (Reasoning)
(Alibaba)
41.6
65
MiMo-V2-Flash (Feb 2026)
(Xiaomi)
41.5
66
Grok 4
(xAI)
41.5
67
Gemini 3 Pro Preview (low)
(Google)
41.3
68
GPT-5 mini (high)
(OpenAI)
41.2
69
GPT-5.5 (Non-reasoning)
(OpenAI)
40.9
70
Kimi K2 Thinking
(Kimi)
40.9
71
o3-pro
(OpenAI)
40.7
72
GLM-5 (Non-reasoning)
(Z AI)
40.6
73
Qwen3.5 397B A17B (Non-reasoning)
(Alibaba)
40.1
74
Qwen3 Max Thinking
(Alibaba)
39.9
75
MiniMax-M2.1
(MiniMax)
39.4
76
DeepSeek V4 Pro (Non-reasoning)
(DeepSeek)
39.3
77
Gemma 4 31B (Reasoning)
(Google)
39.2
78
GPT-5 (low)
(OpenAI)
39.2
79
MiMo-V2-Flash (Reasoning)
(Xiaomi)
39.2
80
Claude 4 Opus (Reasoning)
(Anthropic)
39.0
81
GPT-5 mini (medium)
(OpenAI)
38.9
82
Claude 4 Sonnet (Reasoning)
(Anthropic)
38.7
83
Grok 4.1 Fast (Reasoning)
(xAI)
38.6
84
Qwen3.5 Omni Plus
(Alibaba)
38.6
85
GPT-5.1 Codex mini (high)
(OpenAI)
38.6
86
Step 3.5 Flash 2603
(StepFun)
38.5
87
o3
(OpenAI)
38.4
88
GPT-5.4 nano (medium)
(OpenAI)
38.1
89
Step 3.5 Flash
(StepFun)
37.8
90
GPT-5.4 mini (medium)
(OpenAI)
37.7
91
Kimi K2.5 (Non-reasoning)
(Kimi)
37.3
92
Qwen3.5 27B (Non-reasoning)
(Alibaba)
37.2
93
Claude 4.5 Haiku (Reasoning)
(Anthropic)
37.1
94
Qwen3.6 27B (Non-reasoning)
(Alibaba)
37.1
95
Claude 4.5 Sonnet (Non-reasoning)
(Anthropic)
37.1
96
Qwen3.5 35B A3B (Reasoning)
(Alibaba)
37.1
97
DeepSeek V4 Flash (Non-reasoning)
(DeepSeek)
36.5
98
MiniMax-M2
(MiniMax)
36.1
99
NVIDIA Nemotron 3 Super 120B A12B (Reasoning)
(NVIDIA)
36.0
100
KAT-Coder-Pro V1
(KwaiKAT)
36.0