国产大模型突破百万亿参数，多项基准测试超越GPT-5

人工智能领域再次迎来重磅消息。国内某头部AI公司6月10日正式发布新一代大语言模型，其参数规模突破百万亿级别，在多项权威基准测试中超越GPT-5，标志着国产大模型在技术能力上实现了质的飞跃。

百万亿参数是什么概念？此前全球最大的公开大模型参数规模在万亿级别，百万亿意味着新模型的规模是此前顶级模型的数十倍。海量参数带来的直接收益是模型在推理能力知识广度多模态理解等方面的全面提升。

在权威的MMLU学科知识测试中，新模型得分高达98.5%，超过GPT-5的97.2%。在GSM8K数学推理测试中，正确率达到99.1%。在HumanEval代码生成测试中，通过率首次突破95%大关。在中文理解方面，新模型在C-Eval中文综合评测中接近满分。

更令人关注的是，该模型在长文本理解逻辑推理创造性写作等方面表现出远超同侪的能力。模型能够处理长达百万级别的上下文窗口，对复杂推理任务的准确率大幅提升。在科学论文理解专利分析等专业领域也展现出专家级水平。

在训练技术方面，研发团队采用了新型MoE混合专家架构和稀疏激活技术，使得百万亿参数规模的模型在推理时仅激活约5%的参数，大幅降低了计算成本。团队还开发了高效的多级训练流水线，使得超大规模模型的训练成为可能。

该模型目前已在小范围内开放测试，预计下半年将通过API形式向开发者开放。业内认为这一突破将加速国内AI应用的发展，但也需要在安全可控伦理规范等方面持续完善。

业内人士认为，这一趋势将在下半年持续深化。