DeepSeek推翻两座大山低成本训练引发行业巨变

来源：网络 作者：声远热闻

阅读：1161

发布时间：2025-01-28 13:11:58

评论：0

[摘要] DeepSeek的压力最终传递到了黄仁勋身上。英伟达美股股价盘前暴跌近11%，市值缩水超过3500亿美元。资本市场开始怀疑，当相对较少的算力也能实现与OpenAI相媲美的模型性能时，高端算力芯片是否正面临新的泡沫。这种担忧情绪进一步推高了DeepSeek的热度。短短一周内，DeepSeek应用在美区和中国区App Store免费榜上均位列第一，这是首次有AI助手类产品超越ChatGPT登顶美区Ap

DeepSeek的压力最终传递到了黄仁勋身上。英伟达美股股价盘前暴跌近11%，市值缩水超过3500亿美元。资本市场开始怀疑，当相对较少的算力也能实现与OpenAI相媲美的模型性能时，高端算力芯片是否正面临新的泡沫。

这种担忧情绪进一步推高了DeepSeek的热度。短短一周内，DeepSeek应用在美区和中国区App Store免费榜上均位列第一，这是首次有AI助手类产品超越ChatGPT登顶美区App Store。由于用户激增，DeepSeek在两天内接连出现服务宕机现象，官方解释称这可能与服务维护和请求限制有关。

新模型DeepSeek R1是引发这场全球用户大讨论的直接原因。R1不仅开源，还免费供全球用户无限调用，打破了大厂间的资本比拼游戏。相比OpenAI在模型上的闭源及付费使用限制，DeepSeek用不到OpenAI十分之一的资源就做出了性能堪比o1的R1。

Meta担心即将发布的Llama 4在性能上可能无法赶上DeepSeek R1。OpenAI CEO奥特曼也感受到了压力，通过发布首个智能体Operator抢热度，并透露即将上线的o3-mini新消息。

DeepSeek R1在数学、代码、自然语言推理等任务上的性能可与OpenAI o1模型正式版媲美。其创新训练方法如R1-Zero路线，直接将强化学习应用于基础模型，无需依赖监督微调和已标注数据。这种方法提高了训练效率，减少了对人工干预的依赖。

关键词：