DeepSeek为何威胁美国AI巨头？成本与性能解析

近年来，中国企业在人工智能领域的突破令人瞩目，其中深度求索（DeepSeek）推出的生成式AI产品引发了全球关注。这款AI模型以极低的运营成本，展现出与西方顶级AI模型如ChatGPT相当的强大性能，令美国AI行业感受到前所未有的竞争压力。

DeepSeek的核心产品——V3大型语言模型，拥有高达6850亿个参数，远超Meta旗下Llama 3.1的4050亿参数，其规模之大需要专业硬件支持。据人工智能编码平台Aider的测试数据，DeepSeek的性能仅稍逊于OpenAI的o1模型，实力不容小觑。更令人震惊的是，根据Melius Research的独立研究，DeepSeek生成信息的成本仅为ChatGPT的十分之一，显示出其在训练效率和资源利用上的显著优势。

在技术层面，DeepSeek通过算法优化和创新的学习策略，降低了传统AI模型对庞大数据量和高算力的依赖。文件显示，DeepSeek仅使用了约2048块英伟达H800芯片，而西方主流AI模型则动用了1.6万块专用芯片。值得一提的是，H800芯片是针对中国市场的特供版本，部分性能受到限制，并因2022年及2023年10月的美国对华出口管制而进一步受限。尽管如此，DeepSeek仍凭借高效技术实现了惊人成果。

然而，DeepSeek并非毫无短板。受到中国国内审查政策的影响，其模型在某些敏感话题上的表现受到限制。例如，《经济学人》在测试中发现，当提及台湾相关内容时，DeepSeek会中断回答并删除之前的内容，建议用户更换话题。与此同时，美国AI企业在某些领域仍保持领先，例如谷歌的研究项目让聊天机器人Gemini与浏览器互动，探索AI代理与互联网结合的可能性；OpenAI的聊天机器人不仅能编写代码，还能协助运行代码，并正在研发堪比人类专家水平的“博士级超级代理”技术。

DeepSeek的成功离不开其创始人梁文峰的独特视角。梁文峰1985年出生于广东湛江，2010年获得信息与通信工程硕士学位，曾先后创立杭州雅克比投资管理和杭州幻方科技，专注于数学与AI驱动的量化投资。2023年，他创立DeepSeek，正式进军通用人工智能领域。梁文峰强调，他的团队由一群缺乏经验的年轻人组成，但他相信摆脱经验束缚才能激发创新。中国媒体也指出，梁文峰在团队管理和研发策略上的独到之处，是DeepSeek崛起的重要原因。