DeepSeek硬件投入或超5亿,AI界新贵能否领跑通用智能赛道?

   时间:2025-02-01 09:27 来源:ITBEAR作者:朱天宇

在科技界掀起波澜的最新动态中,中国的DeepSeek成为本周焦点,其背后的巨额投入——600万美元的训练费用,成为了业内人士和华尔街关注的焦点。这一数字揭示了人工智能领域竞争之激烈,同时也引发了对相关成本的深入探讨。

DeepSeek在最新论文中不仅公布了这一费用,还明确警示,该数字仅限于模型的官方训练成本,并未涵盖先前的架构、算法或数据研究,以及消融实验的相关开销。这一透明化的做法,无疑为外界了解人工智能模型的真实成本提供了宝贵窗口。

值得注意的是,DeepSeek的AI Assistant在本周早些时候成功超越OpenAI的ChatGPT,成为美国苹果应用商店下载量最多的免费应用。这一成就不仅彰显了DeepSeek的技术实力,也反映出市场对高质量人工智能应用的强烈需求。

然而,在全球科技股市场,芯片制造商英伟达和博通却遭遇了市值的大幅缩水,周一总市值蒸发高达8000亿美元。这一市场动荡,无疑为人工智能领域的投资者们敲响了警钟。

半导体研究和咨询公司SemiAnalysis发布的一份新报告,为DeepSeek的高额开支提供了更多背景信息。据估计,DeepSeek的硬件支出在公司历史上已远超5亿美元,且研发成本和总拥有成本同样高昂。报告中指出,为模型生成训练所需的合成数据,需要巨大的计算能力作为支撑。

报告还提到,Anthropic的Claude 3.5 Sonnet训练成本也高达数千万美元,并从亚马逊和谷歌筹集了数十亿美元资金。这一案例进一步说明了运营这些模型和公司的巨大资金需求。

尽管DeepSeek的论文中并未包含对其计算成本的详细估计,但SemiAnalysis的分析师们仍对其独特之处给予了高度评价。他们认为,DeepSeek率先实现了这种成本和能力水平的结合,其R1模型表现出色,且迅速赶上推理前沿,令人印象深刻。

本周,专家和分析师们对DeepSeek模型的质量赞不绝口,并指出,在美国三年内三次限制对华芯片出口的背景下,该模型的诞生尤为令人瞩目。这不仅引发了美国可能在全球人工智能市场上落后于其主要对手的担忧,也凸显了人工智能领域竞争的激烈程度。

伯恩斯坦分析师在一份报告中指出,DeepSeek的崛起引发了广泛的讨论和热议,其影响范围从“真的很有趣”到“人工智能基础设施综合体的丧钟”不等。这一评价无疑揭示了DeepSeek在人工智能领域所引起的巨大反响。

DeepSeek成立于2023年,由专注于人工智能的量化对冲基金High-Flyer的联合创始人梁文峰创立。该初创公司专注于大型语言模型和通用人工智能(AGI)的研究,旨在实现人工智能在广泛任务上等同于或超越人类智力的目标。杰富瑞分析师表示,DeepSeek至今仍由High-Flyer全资拥有并获得资助。

本月初,DeepSeek发布了可与OpenAI的GPT-4相媲美的R1模型,并宣布其开源。这意味着任何AI开发人员都可以使用该模型,进一步推动了人工智能技术的普及和发展。OpenAI首席执行官Sam Altman虽然公开称赞了DeepSeek的模型,但也指出有证据表明DeepSeek不正当收集了OpenAI的数据来构建其产品。

然而,在周四由OpenAI举办的一场活动中,Altman再次肯定了DeepSeek的成就。他表示:“DeepSeek显然是一个很棒的模型,这提醒我们竞争的水平以及人工智能获胜的必要性。”同时,他也强调了对推理和开源的兴趣水平正在不断提升。

 
 
更多>同类内容
全站最新
热门内容