你的位置:开云体育(中国)官方网站 > 开云盘口 > 开云体育 中语大模子测评出炉: 豆包踏进环球第一梯队 小米MiMo上榜

快科技3月30日音书,中语大模子基准测评SuperCLUE发布2026年3月最新效果,22款国表里主流模子参与角逐。
字节杰出旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,顺利踏进环球第一梯队;小米集团的MiMo-V2系列两款模子均凯旋上榜。
本次测评笼罩数学推理、科学推理、代码生成等六大中枢任务,全面查考模子空洞才智。外洋闭源模子依旧占据总分前线,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。
豆包则紧随后来,总分仅与GPT-5.4出入0.95分,竣事全标的追逐,在智能体任务磋磨维度更是反超部分外洋模子,开云体育踏进环球前五。
小米这次有两款模子入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模子前线,在数学推理任务中获取84.03分的亮眼得益;开源版块MiMo-V2-Flash虽以49.97分排行靠后,但在代码生成等细分场景中进展出一定后劲。
测评还涌现,国产模子合座进展亮眼,开源赛谈尤为杰出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模子包揽开源榜前三,大幅来源外洋同类模子。
开云体育