斯坦福报告:中美AI模型性能持平 可信基建成关键 2026-04-23 | 分类:AI大模型 | 浏览:164 斯坦福2026 AI Index报告显示,中美头部大模型在MMLU、GPQA和LiveBench三项主流基准上的性能指标已无统计学差距,中国模型在MMLU上略高,GPQA中Top 3模型并列,LiveBench测试也显示双方高度重合。这种趋同源于算力投入、语料工程及后训练策略的系统性对齐。随着性能追平,可信基因此成为新...