山东 切换城市

请选择您所在的城市:

    热门
    城市

    DeepSeek推翻两座大山 低成本训练引发行业巨变

    来源:网络   作者:声远热闻

       阅读:1161

       发布时间:2025-01-28 13:11:58

       评论:0

    [摘要] DeepSeek的压力最终传递到了黄仁勋身上。英伟达美股股价盘前暴跌近11%,市值缩水超过3500亿美元。资本市场开始怀疑,当相对较少的算力也能实现与OpenAI相媲美的模型性能时,高端算力芯片是否正面临新的泡沫。这种担忧情绪进一步推高了DeepSeek的热度。短短一周内,DeepSeek应用在美区和中国区App Store免费榜上均位列第一,这是首次有AI助手类产品超越ChatGPT登顶美区Ap


    DeepSeek的压力最终传递到了黄仁勋身上。英伟达美股股价盘前暴跌近11%,市值缩水超过3500亿美元。资本市场开始怀疑,当相对较少的算力也能实现与OpenAI相媲美的模型性能时,高端算力芯片是否正面临新的泡沫。

    这种担忧情绪进一步推高了DeepSeek的热度。短短一周内,DeepSeek应用在美区和中国区App Store免费榜上均位列第一,这是首次有AI助手类产品超越ChatGPT登顶美区App Store。由于用户激增,DeepSeek在两天内接连出现服务宕机现象,官方解释称这可能与服务维护和请求限制有关。

    新模型DeepSeek R1是引发这场全球用户大讨论的直接原因。R1不仅开源,还免费供全球用户无限调用,打破了大厂间的资本比拼游戏。相比OpenAI在模型上的闭源及付费使用限制,DeepSeek用不到OpenAI十分之一的资源就做出了性能堪比o1的R1。

    Meta担心即将发布的Llama 4在性能上可能无法赶上DeepSeek R1。OpenAI CEO奥特曼也感受到了压力,通过发布首个智能体Operator抢热度,并透露即将上线的o3-mini新消息。

    DeepSeek R1在数学、代码、自然语言推理等任务上的性能可与OpenAI o1模型正式版媲美。其创新训练方法如R1-Zero路线,直接将强化学习应用于基础模型,无需依赖监督微调和已标注数据。这种方法提高了训练效率,减少了对人工干预的依赖。

    关键词:

    精彩评论文明上网理性发言,请遵守评论服务协议

    共0条评论
    加载更多

    在线投稿