DeepSeek在《自然》杂志公布论文 R1模型成本创新低

来源：网络 作者：声远热闻

阅读：2741

发布时间：2025-09-20 13:37:57

评论：0

[摘要] AI初创公司DeepSeek的论文最近登上了《自然》杂志。该公司表示，其强大的AI模型R1的成功并不依赖于模仿其他大型语言模型生成的示例进行训练。这一声明随着R1模型同行评审版本的发布而公布。论文详细介绍了DeepSeek如何增强标准的大型语言模型以应对推理任务，并首次揭示了训练R1的成本为29.4万美元。这不包括公司在开发基础LLM上花费的大约600万美元，但总成本仍然远低于竞争对手模型所花费的

AI初创公司DeepSeek的论文最近登上了《自然》杂志。该公司表示，其强大的AI模型R1的成功并不依赖于模仿其他大型语言模型生成的示例进行训练。这一声明随着R1模型同行评审版本的发布而公布。

论文详细介绍了DeepSeek如何增强标准的大型语言模型以应对推理任务，并首次揭示了训练R1的成本为29.4万美元。这不包括公司在开发基础LLM上花费的大约600万美元，但总成本仍然远低于竞争对手模型所花费的数千万美元。R1主要使用英伟达的H800芯片进行训练。

R1被认为是第一个经过同行评审过程的主要大型语言模型。Hugging Face的机器学习工程师刘易斯·图恩斯特尔审阅了该论文后表示，这是一个非常受欢迎的先例，因为公开分享这一过程有助于评估这些系统是否构成风险。

自1月份发布以来，DeepSeek因其与世界领先的AI应用相比具有明显竞争优势且成本低廉而备受赞誉和关注。据Sensor Tower数据，DeepSeek推出的应用在最初的18天内获得了1600万次下载，几乎是OpenAI的ChatGPT首次发布时900万次下载量的两倍。

公开资料显示，DeepSeek成立于2023年7月，由知名量化资管巨头幻方量化创立，专注于开发先进的大语言模型和技术。幻方量化的掌门人梁文锋是DeepSeek的创始人。

关键词：

精彩评论文明上网理性发言，请遵守评论服务协议

共0条评论

全部评论
热度时间

加载更多

在线投稿

相关阅读

精彩图片

新帖速递

DeepSeek在《自然》杂志公布论文 R1模型成本创新低

精彩评论文明上网理性发言，请遵守评论服务协议

在线投稿

友情链接