您現(xiàn)在的位置是:呼來喝去網(wǎng) > 百科
腾讯混元开源首款混合推WhatsApp%E3%80%90+86%2015855158769%E3%80%91egyptian%20revival%20tea%20set理MoE模型,性能优异,激活参数仅13B
呼來喝去網(wǎng)2025-12-21 00:45:05【百科】8人已圍觀
簡介 6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。这意味着,开发者可以用更低门 WhatsApp%E3%80%90+86%2015855158769%E3%80%91egyptian%20revival%20tea%20set
? 6月27日,腾讯推理腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,混元混合活参总参数80B,开源WhatsApp%E3%80%90+86%2015855158769%E3%80%91egyptian%20revival%20tea%20set激活参数仅13B,首款数仅效果比肩同等架构领先开源模型,型性但是异激推理速度更快,性价比更高。腾讯推理这意味着,混元混合活参开发者可以用更低门槛的开源方式获得更好的模型能力。
??即日起,首款数仅模型已经在 Github 和 Huggingface 等开源社区上线,型性同时模型API也在腾讯云官网正式上线,异激支持快速接入部署。腾讯推理
??这是混元混合活参WhatsApp%E3%80%90+86%2015855158769%E3%80%91egyptian%20revival%20tea%20set业界首个13B级别的MoE开源混合推理模型,基于先进的开源模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分
??对于时下热门的大模型Agent能力,腾讯混元建设了一套多Agent数据合成框架,接入了MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升了Hunyuan-A13B的效果。
??在长文方面,Hunyuan-A13B支持256K原生上下文窗口,在多个长文数据集中取得了优异的成绩。
?
??在實際使用場景中,Hunyuan-A13B模型可以根據(jù)需要選擇思考模式,快思考模式提供簡潔、高效的輸出,適合追求速度和最小計算開銷的簡單任務(wù);慢思考涉及更深、更全面的推理步驟,如反思和回溯。這種融合推理模式優(yōu)化了計算資源分配,使用戶能夠通過加think/no_think切換思考模式,在效率和特定任務(wù)準(zhǔn)確性之間取得平衡。

??Hunyuan-A13B模型對個人開發(fā)者較為友好,在嚴(yán)格條件下,只需要1張中低端GPU卡即可部署。目前,Hunyuan-A13B已經(jīng)融入開源主流推理框架生態(tài),無損支持多種量化格式,在相同輸入輸出規(guī)模上,整體吞吐是前沿開源模型的2倍以上。
??Hunyuan-A13B 集合了騰訊混元在模型預(yù)訓(xùn)練、后訓(xùn)練等多個環(huán)節(jié)的創(chuàng)新技術(shù),這些技術(shù)共同增強了其推理性能、靈活性和推理效率。
??預(yù)訓(xùn)練環(huán)節(jié),Hunyuan-A13B 訓(xùn)練了20T tokens的語料,覆蓋了多個領(lǐng)域。高質(zhì)量的語料顯著提升了模型通用能力。此外,在模型架構(gòu)上,騰訊混元團隊通過系統(tǒng)性分析,建模與驗證,構(gòu)建了適用于 MoE 架構(gòu)的 Scaling Law 聯(lián)合公式。這一發(fā)現(xiàn)完善了MoE 架構(gòu)的 Scaling Law 理論體系,并為 MoE 架構(gòu)設(shè)計提供了可量化的工程化指導(dǎo),也極大的提升了模型預(yù)訓(xùn)練的效果。
??后訓(xùn)練環(huán)節(jié),Hunyuan-A13B采用了多階段的訓(xùn)練方式,提升了模型的推理能力,同時兼顧了模型創(chuàng)作、理解、Agent等通用能力。

图:Hunyuan-A13B后训练四个步骤
?
??為更好的提升大語言模型能力,騰訊混元也開源了兩個新的數(shù)據(jù)集,以填補行業(yè)內(nèi)相關(guān)評估標(biāo)準(zhǔn)的空白。其中,ArtifactsBench用于彌合大語言模型代碼生成評估中的視覺與交互鴻溝,構(gòu)建了一個包含 1825個任務(wù)的新基準(zhǔn),涵蓋了從網(wǎng)頁開發(fā)、數(shù)據(jù)可視化到交互式游戲等九大領(lǐng)域,并按難度分級以全面評估模型的能力;C3-Bench針對Agent場景模型面臨的三個關(guān)鍵挑戰(zhàn):規(guī)劃復(fù)雜的工具關(guān)系、處理關(guān)鍵的隱藏信息以及動態(tài)路徑?jīng)Q策,設(shè)計了1024條測試數(shù)據(jù),以發(fā)現(xiàn)模型能力的不足。
?
??Hunyuan-A13B模型是騰訊內(nèi)部應(yīng)用和調(diào)用量最大的大語言模型之一,有超過 400+ 業(yè)務(wù)用于精調(diào)或者直接調(diào)用,日均請求超1.3億。本次進行升級更新并對外開源 ,是繼混元large后混元大語言模型推出的又一重要開源模型,參數(shù)更小,但是性能和效果實現(xiàn)了大幅的提升。接下來,騰訊混元也將推出更多尺寸、更多特色的模型,將更多實踐技術(shù)與社區(qū)共享,促進大模型開源生態(tài)的繁榮。
?
? 騰訊混元堅定擁抱開源,持續(xù)推進多尺寸、多場景的全系模型開源,旗下圖像、視頻、3D、文本等多種模態(tài)基礎(chǔ)模型已全面開源。未來,混元計劃推出多尺寸混合推理模型,從0.5B到32B的dense模型,以及激活13B的MoE模型,適配企業(yè)與端側(cè)不同需求,混元圖像、視頻、3D等多模態(tài)基礎(chǔ)模型及配套插件模型也將持續(xù)開源。
?

?
?
附项目相关链接
?
l? 體驗入口:https://hunyuan.tencent.com/
l? API地址:https://cloud.tencent.com/product/tclm
l? Github :https://github.com/Tencent-Hunyuan
l? HuggingFace:https://huggingface.co/tencent
l? C3-Bench:https://github.com/Tencent-Hunyuan/C3-Benchmark?
l? ArtifactsBench:https://github.com/Tencent-Hunyuan/ArtifactsBenchmark
?
很贊哦!(7)
熱門文章
站長推薦
友情鏈接
- 36岁AMH低在北京做试管婴儿要花多少钱?哪里可以做?
- 成熟卵子存活时间并不确定,12
- 新生儿营养不足红细胞偏低,调理方法为3种
- 内地全天候监测辐射环境
- 欧足联重拳!水晶宫欧联资格被剥夺,降格欧协联
- 天空:亨德森将加盟布伦特福德,他们认为他能带来经验和实力
- 托马斯性侵案当事女性:未满18岁,2021年向阿森纳同步指控遭无视
- 蓝军名宿:强手如林的情况下进决赛很惊喜,若击败巴黎就更不得了
- 天空:亨德森将加盟布伦特福德,他们认为他能带来经验和实力
- 孕妇和肝癌患者均会出现!甲胎蛋白偏高由这6个原因导致
- 酋长球场现“阿尔特塔下课”标语!阿森纳球迷怒了,引援成导火索
- 做试管婴儿检查出HPV阳性,如果不治疗会怎样
- 维迪奇:曼联想要改变,必须引入愿意负责、敢说真话的人
- 欧足联官方:水晶宫无法参加欧联杯,将参加欧协联
- 米兰恼火!加价购提升成本却仍难满足,22岁小将儿毛梦还能实现么
- 看试管案例知成功率!关于泰国威它尼医院这些要先了解
- 伯恩利主帅:沃克绝对喜欢我们这里的挑战
- 生孩子这件事为什么不能拖?拖成“高龄产妇”想生都难
- 米兰恼火!加价购提升成本却仍难满足,22岁小将儿毛梦还能实现么
- 纠正婴儿对眼先别着急,眼科医生教你3招鉴别法
- 载人航天:逐梦空间站时代,“神十二”箭在弦上
- 新生儿营养不足红细胞偏低,调理方法为3种
- “一”到“十二”峥嵘岁月,一图回顾中国“神舟”飞天梦
- 石家庄做试管婴儿一次费用是多少钱?各大医院成功率看这里
- 载人航天:逐梦空间站时代,“神十二”箭在弦上
- 托马斯性侵案当事女性:未满18岁,2021年向阿森纳同步指控遭无视
- 国内试管婴儿成功率相差乌克兰10个百分点
- 巴贝尔:维尔茨是今夏最佳引援,大家都认为他会去拜仁曼城或皇马
- 国内试管婴儿成功率相差乌克兰10个百分点
- 伯恩利主帅帕克谈前队友沃克加盟:他有动力面对下一个挑战
- 轨道建设/“神箭”在弦待发 太空漫游压轴
- 从闪电签约到停滞不前!曼联被英超对手甩开,转会窗口已落后太多
- 生孩子这件事为什么不能拖?拖成“高龄产妇”想生都难
- 名记:尽管被指控非法接触,热刺仍有信心以6000万镑签下怀特
- 外媒:利兹联引进日本国脚守田英正受阻,转会可能难以达成
- 记者:28岁法国前锋马特塔希望加盟AC米兰,正在向水晶宫施压
- 哺乳期叶酸摄入量并非0.8毫克,用量过多只有坏处
- 地中海贫血没得治吗?来了解下这些地贫的治疗方法
- 巴贝尔:维尔茨是今夏最佳引援,大家都认为他会去拜仁曼城或皇马
- 宫颈扩张术后防治再粘连,这个护理关键点不能忽略
- 喜茶英国首店今日开业,出海第二站进军欧美市场
- 博道基金杨梦:没有“躺赢”的策略量化的生命力在于持续进化 环球聚焦
- 《时间旅者:重生曙光》迎来重要里程碑 销量突破50万
- 高端烘焙品牌Dikka宣告倒闭!烘焙赛道要变天了?
- ST泰禾股票被深交所终止上市,将于8月4日摘牌
- 进口家居品牌集成店JulyLion 全国首店将于杭州万象城开业
- 『策展型商业』资料征集|破维升级,策展商业新探索
- 手机气囊支架品牌“泡泡骚PopSockets”中国首店于上海K11开业
- 开业率预计达98% 金华之心银泰百货入驻品牌全曝光
- 福州东二环泰禾广场近12万方商业将被拍卖,起拍价27.87亿







