近日,腾讯混元发布并开源重建后的首款大模型Hy3 preview。这是28岁首席AI科学家姚顺雨加入腾讯4个月后交出的第一份答卷,也是混元从底层推倒重建3个多月后的首个成果。
一、底层大重构
腾讯将预训练、强化学习、基础设施等底层框架全部推倒重建。对大厂而言,重建训练框架意味着推翻原有路径、承担短期性能倒退风险,但这是腾讯在大模型赛道追赶前行者必须承受的阵痛。
二、模型核心参数
Hy3 preview采用快慢思考融合的混合专家(MoE)架构,总参数295B,激活参数21B,最大支持256K上下文长度。官方定位为"混元重建后训练的第一个模型"及"混元迄今最智能的模型"。
三、性能表现
腾讯对于Hy3 preview的介绍非常克制,称"取得了具有竞争力的结果"。实测显示,部分基准进入第一梯队,处于智谱GLM4.7与GLM5.0之间、Kimi K2与K2.5之间;个别指标超过K2.5。与2025年1月的自己相比,BrowseComp成绩提升近40%。
四、产品侧实测数据
在CodeBuddy、WorkBuddy等腾讯开发工具上,首token延迟降低54%,端到端时长降低47%,成功率提升至99.99%以上;腾讯内部工程师盲评胜率达55%-56%。
五、开源与价格
模型权重和代码已在GitHub、Hugging Face等平台开源。腾讯云TokenHub API调用价格:输入端最低1.2元/百万tokens,输出端最低4元/百万tokens,个人开发者套餐28元/月起。
六、产品接入情况
已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线;微信公众号、和平精英、腾讯新闻、微信读书等陆续上线。支持接入OpenClaw、OpenCode、KiloCode等开源智能体产品。
姚顺雨表示,Hy3 preview只是重建第一步,团队正继续扩大预训练和强化学习规模,更大尺寸模型已在训练中,将通过与腾讯产品的深度Co-Design持续提升真实场景表现。
