AI-Ladder
Arena 快照、模型價格與來源證據正在整理
06/03/2026

獨立模型評測、來源溯源與成本脈絡

用基準情報選擇 AI 模型

AI-Ladder 將模型能力、價格、上下文長度、置信區間與來源時間戳放在同一個決策介面,讓排名成為可檢查的證據,而不是黑箱總分。

Live panel

能力排名

高分模型與置信區間並排檢查。

1502
Claude Opus 4.6
1500
Claude Opus 4.7
1498
Claude Opus 4.6
1492
Claude Opus 4.7
1489
Muse Spark
1488
Gemini 3.1 Pro
1486
gemini 3 pro
Live panel

成本脈絡

每百萬 token 平均成本,越低越好。

0.1
Muse Spark
0.2
Gemini 3.5 Flash
3.1
Gemini 3.1 Pro
3.1
gemini 3 pro
10
gpt 5.5 high
10
gpt 5.4 high
45
Claude Opus 4.7
Live panel

覆蓋範圍

跨文字、程式、視覺、文件與生成類別。

10
Text
37
Code
0
Vision
0
Doc
0
Image
0
Video

跨基準比較

不要只看單一總分。AI-Ladder 把 preference、capability 與 product context 拆開呈現。

查看排行榜

模型選型短名單

把兩到四個候選模型放進對比沙盒,用價格與上下文限制校正排名解讀。

開始對比

來源透明度

每個公開分數都應該能追到來源、版本、時間與 caveat,避免不透明綜合指標。

閱讀方法

能力與成本對照圖

將文本、代碼和視覺排行榜的歸一化基準分數與平均 Token 成本進行關聯對照分析。

首頁集合結合價值前沿、頂尖能力與 Kimi / DeepSeek / Xiaomi / Qwen 等供應商代表模型
正在載入分析圖表...

模型能力演進趨勢

主要模型家族的歷史平均 ELO 評估變更趨勢。

正在載入能力數據...