Hybrid-Mamba-Transformer共1篇

腾讯混元T1正式发布,自研深度思考模型提升推理效率-个人笔记

腾讯混元T1正式发布,自研深度思考模型提升推理效率

近日,腾讯正式发布了 混元T1正式版,该模型基于腾讯 3 月初推出的新一代快思考模型 Turbo S,并采用 Hybrid-Mamba-Transformer 融合架构,实现更高效的推理能力。据悉,这也是业界首次在超大规...
人民的骆驼的头像-个人笔记赞助大会员人民的骆驼3个月前
0460