关闭

百易AI博客

当前位置:与“可信基建”相关的标签

斯坦福报告:中美AI模型性能持平 可信基建成关键

斯坦福报告:中美AI模型性能持平 可信基建成关键
斯坦福2026 AI Index报告显示,中美头部大模型在MMLU、GPQA和LiveBench三项主流基准上的性能指标已无统计学差距,中国模型在MMLU上略高,GPQA中Top 3模型并列,LiveBench测试也显示双方高度重合。这种趋同源于算力投入、语料工程及后训练策略的系统性对齐。随着性能追平,可信基因此成为新...