X

DeepSeek R1发布:中国AI崛起引发全球关注

2025年1月20日,正值美国总统特朗普就职之际,一家鲜为人知的中国人工智能初创企业“深度求索”(DeepSeek)推出了一款开源推理模型R1。其性能接近全球AI领军者OpenAI的o1模型,这一举动在国际AI领域掀起波澜,促使全球重新评估中国在人工智能技术中的地位和潜力。

所谓推理模型,是指拥有逻辑推理能力的大语言模型。这类模型能够应对复杂的任务场景,通过多步推理提供解决方案,并且在后期训练或在线推理过程中,通过增加资源投入显著提升表现。因此,推理模型被认为是未来大语言模型发展的重要趋势。

据网络安全企业卡巴斯基(Kaspersky)人工智能技术研究中心的团队经理图什卡诺夫(Vladislav Tushkanov)介绍,推理模型的概念最早由OpenAI于去年12月推出的o1模型引发。然而,o1模型为闭源且仅限于付费用户使用。相比之下,DeepSeek R1不仅对用户免费开放,还公开了其推理逻辑和思维过程,因此迅速成为业界焦点,引发广泛讨论。