• 12月19日 星期五

DeepSeek为何威胁美国AI巨头?成本与性能解析

近年来,中国企业在人工智能领域的突破令人瞩目,其中深度求索(DeepSeek)推出的生成式AI产品引发了全球关注。这款AI模型以极低的运营成本,展现出与西方顶级AI模型如ChatGPT相当的强大性能,令美国AI行业感受到前所未有的竞争压力。

DeepSeek的核心产品——V3大型语言模型,拥有高达6850亿个参数,远超Meta旗下Llama 3.1的4050亿参数,其规模之大需要专业硬件支持。据人工智能编码平台Aider的测试数据,DeepSeek的性能仅稍逊于OpenAI的o1模型,实力不容小觑。更令人震惊的是,根据Melius Research的独立研究,DeepSeek生成信息的成本仅为ChatGPT的十分之一,显示出其在训练效率和资源利用上的显著优势。

在技术层面,DeepSeek通过算法优化和创新的学习策略,降低了传统AI模型对庞大数据量和高算力的依赖。文件显示,DeepSeek仅使用了约2048块英伟达H800芯片,而西方主流AI模型则动用了1.6万块专用芯片。值得一提的是,H800芯片是针对中国市场的特供版本,部分性能受到限制,并因2022年及2023年10月的美国对华出口管制而进一步受限。尽管如此,DeepSeek仍凭借高效技术实现了惊人成果。

然而,DeepSeek并非毫无短板。受到中国国内审查政策的影响,其模型在某些敏感话题上的表现受到限制。例如,《经济学人》在测试中发现,当提及台湾相关内容时,DeepSeek会中断回答并删除之前的内容,建议用户更换话题。与此同时,美国AI企业在某些领域仍保持领先,例如谷歌的研究项目让聊天机器人Gemini与浏览器互动,探索AI代理与互联网结合的可能性;OpenAI的聊天机器人不仅能编写代码,还能协助运行代码,并正在研发堪比人类专家水平的“博士级超级代理”技术。

DeepSeek的成功离不开其创始人梁文峰的独特视角。梁文峰1985年出生于广东湛江,2010年获得信息与通信工程硕士学位,曾先后创立杭州雅克比投资管理和杭州幻方科技,专注于数学与AI驱动的量化投资。2023年,他创立DeepSeek,正式进军通用人工智能领域。梁文峰强调,他的团队由一群缺乏经验的年轻人组成,但他相信摆脱经验束缚才能激发创新。中国媒体也指出,梁文峰在团队管理和研发策略上的独到之处,是DeepSeek崛起的重要原因。

上一篇新闻

美国两机相撞坠河事故:无人生还可能性大

下一篇新闻

春晚机器人失误是故意设计?宇树科技揭秘彩蛋

评论

订阅每日新闻

订阅每日新闻以免错过最新最热门的新加坡新闻。