阿里巴巴开源通义千问Qwen3:性能超越全球顶尖模型
4月29日凌晨,中国科技领军企业阿里巴巴正式推出并开源新一代人工智能模型——通义千问Qwen3系列。这一消息得到了包括第一财经、澎湃新闻及路透社在内的多家媒体的关注和报道。
据介绍,Qwen3系列是国内首个采用混合推理技术的模型家族,创新地将‘快速响应’与‘深入分析’能力融合于一体。对于简单的用户需求,该模型能够在低算力环境下实现即时答复;而面对复杂的任务,则能通过多步骤推理进行深度处理,同时有效降低算力资源的消耗。
在此次发布的模型中,旗舰版本Qwen3-235B-A22B的参数规模达到235B,仅为DeepSeek-R1的三分之一。尽管参数量较少,其成本显著降低,性能却全面超越了DeepSeek-R1及OpenAI-o1等国际领先模型,成为行业新标杆。
值得一提的是,阿里巴巴在人工智能领域的探索并非首次。今年1月,公司曾推出通义千问旗舰版Qwen2.5-Max,并在指令模型性能测试中展现出对DeepSeek-V3等竞品的全面优势。此外,今年3月,阿里还发布了一款支持多模态处理能力的Qwen系列新模型,可同时处理文本、图像、音频及视频内容,并且能够直接在手机和笔记本电脑等设备上运行,极大提升了用户体验。
与此同时,中国另一互联网巨头百度也在AI领域持续发力,近期推出了文心一言4.5 Turbo和X1 Turbo两款全新模型,支持文字、视频等多类型数据的综合处理能力,显示出国内企业在人工智能技术上的加速追赶与创新。
评论