腾讯在3月21日深夜对外公布,自研的深度思考模型混元T1正式版已全新上线。此前,该公司在3月初曾推出快思考模型混元Turbo S,而此次的混元T1正是以Turbo S为核心基础进一步研发而成。
据腾讯方面透露,混元T1的最大特色在于其卓越的响应速度和超长文本处理能力。该模型能够实现首字秒回,输出速度最高可达每秒80个tokens,效率令人瞩目。此外,混元T1在处理超长文档时表现尤为突出,能够有效避免上下文信息丢失以及长距离依赖问题的困扰。
值得一提的是,混元T1采用了混合Mamba架构,这是工业界首次将该架构无损应用于超大型推理模型。这种创新设计不仅大幅降低了训练和推理的成本,还通过针对长序列处理的专项优化,进一步提升了解码效率,使其性能在业内处于领先地位。
目前,混元T1已正式登陆腾讯云官网,供用户体验和购买。定价方面,输入费用为每百万tokens 1元人民币(约合0.18新元),输出费用则为每百万tokens 4元人民币。