1月27日星期一,中国人工智能初创企业深度求索(DeepSeek)的惊人表现震撼了全球科技与金融市场。当天,华尔街股市遭遇重挫,科技股大幅下挫,尤其是芯片巨头英伟达(Nvidia)股价暴跌17%,收于118.58美元,市值一夜之间蒸发近6000亿美元(约合8072亿新元)。纳斯达克综合指数也下跌3.07%,显示市场对人工智能领域过度投资的担忧情绪迅速升温。
投资者开始质疑人工智能行业的泡沫化风险,对巨额资本投入的回报率产生怀疑。DeepSeek的出现,不仅在技术层面挑战了西方科技巨头,也动摇了市场对人工智能发展路径的信心。
低成本高性能:DeepSeek的技术突破
DeepSeek之所以引发如此大的反响,关键在于其以极低成本打造出媲美OpenAI ChatGPT的人工智能模型。据公开信息,DeepSeek仅投入约560万美元便完成了模型开发。而相比之下,美国人工智能公司Anthropic的CEO达里奥·阿莫代(Dario Amodei)曾表示,类似模型的构建成本通常在1亿至10亿美元之间。美国各大科技巨头每年更是投入数百亿美元用于人工智能基础设施建设。如此巨大的成本差距,让业界对传统高投入模式产生了深刻反思。
从对冲基金到AI先锋:DeepSeek的起源
DeepSeek的创始人梁文锋原本是中国量化对冲基金High-Flyer的掌舵人。该基金成立于2015年,曾是中国首支募集资金超1000亿元人民币(约185.56亿新元)的对冲基金,尽管近年来规模缩减至约80亿美元(约107.54亿新元)。梁文锋拥有计算机科学硕士学位,多年来通过储备图形处理器(GPU)并开发Fire-Flyer超级计算机,用于金融数据分析。2023年,他决定将资源转向创建DeepSeek,专注于人工智能模型开发。
两年前,梁文锋带着1万块英伟达H100芯片和一支充满激情的年轻团队投身这一领域。如今,DeepSeek已成为行业焦点。1月20日,公司发布了一款免费开源的人工智能模型DeepSeek-R1,不仅在硅谷引发热议,更在多项数学和推理测试中超越了OpenAI o1等顶尖模型,以能力、成本和开放性全面挑战西方巨头。
中美科技博弈中的“黑天鹅”
在中美科技冷战的背景下,美国自2022年10月起对中国实施高端芯片出口管制,极大限制了中国科技企业在人工智能领域的硬件获取能力。DeepSeek也承认,尽管初期储备了1万块英伟达H100芯片,但仍需更多资源与OpenAI等竞争对手抗衡。面对限制,公司通过优化模型架构、改进芯片通信方案、减少内存占用等一系列工程创新,成功开发出高效模型。这些技术虽非全新,但结合运用后效果显著。
值得一提的是,DeepSeek选择将创新成果免费开源,迅速赢得了全球人工智能研究社区的认可。硅谷风险投资家马克·安德森(Marc Andreessen)在社交平台X上称DeepSeek-R1为“最令人印象深刻的突破之一”。
背后的动机:科学好奇而非利润驱动
梁文锋曾向中国媒体坦言,创立DeepSeek并非出于商业利益,而是源于对科学的好奇心。他表示,基础科学研究投资回报率低,若从商业角度看,这一项目并不值得投入。但正是这份纯粹的探索精神,让DeepSeek成为中国为数不多不依赖百度、阿里或字节跳动等科技巨头融资的领先AI企业,展现出独特的独立性。
对市场与政策的影响
DeepSeek的成功不仅颠覆了人工智能对高端芯片的依赖认知,也对美国的出口管制政策构成挑战。它的崛起表明,中国企业在硬件受限的情况下,仍能通过技术创新实现突破。这无疑加剧了华尔街的不安情绪,尤其是对英伟达、超微(AMD)、博通(Broadcom)等芯片巨头的未来预期产生疑问。这些公司的高市值依赖于人工智能驱动的增长预期,但DeepSeek的低成本模式可能迫使美国科技企业重新审视巨额资本支出的合理性。
与此同时,DeepSeek的出现或将促使美国科技巨头进一步依赖高端芯片资源,以维持竞争优势。这可能反而巩固英伟达等公司的市场地位。从更广视角看,中美科技竞争格局正在发生微妙变化,未来美国是否会加速如Stargate数据中心等项目的推进,甚至吸引更多巨头投资,仍是值得关注的焦点。