【欧洲时报网】中国人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大语言模型DeepSeek-V3.1正式发布。
它就像一个拥有两种工作模式的超级大脑
香港中通社报道,据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。
DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。
此外,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。当天,DeepSeek官方公众号在其文章置顶留言里说,UE8M0FP8是针对即将发布的下一代中国产芯片设计。
官方数据显示,与DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间内给出答案,且经过思维链压缩训练,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。
昙花一现还是AI产业转捩点?
2025年初,DeepSeek推出其大模型DeepSeek-R1,一夜之间席卷全球科技市场。半年过去,DeepSeek的热度急速下降,是否只是昙花一现?
回顾DeepSeek“横空出世”之初,其应用程式短短数日内登顶美国苹果App Store榜首,让美国硅谷为之震颤。DeepSeek-R1最令人震撼的是其“低成本、高效率”的技术路线。相较于OpenAI投入数十亿美元训练GPT-4,DeepSeek仅以560万美元的开发成本,在多项基准测试中达到甚至超越GPT-4的性能。这一突破直接挑战了AI产业长期依赖的“规模定律”——即模型性能与算力投入呈指数级正相关的假设。
分析认为,DeepSeek的成功关键在于其创新的混合专家模型架构、动态稀疏训练技术,以及优化的数据清洗方法。这些技术让DeepSeek在资源受限的情况下,仍能实现高效推理,并大幅降低运算成本。这不仅打破了“AI必须依赖巨额算力”的迷思,更为全球AI开发者提供了一条新的技术路径。
DeepSeek的成功迫使硅谷重新思考AI的发展方向。过去,OpenAI、谷歌等巨头依赖大规模数据中心与顶级晶片,但DeepSeek证明,更聪明的工程设计可以大幅降低AI的开发门槛。
DeepSeek的崛起一度冲击英伟达股价,使其市值单日蒸发6000亿美元,但半年后,英伟达市值已反弹并创新高。然而,DeepSeek的低成本模式仍促使企业重新评估AI基础设施投资,部分公司开始探索更节能的AI晶片方案。
英国广播公司(BBC)发文称,DeepSeek这款突破性应用如今虽然淡出新闻头条,不再是美国科技圈热议的话题,但它并未消失。文章提出灵魂一问:DeepSeek震撼市场之后,是否改变了整个AI产业?
文章认为,DeepSeek的问世是中美AI竞争的转折点。
值得注意的是,自今年初DeepSeek发布高性能开源大模型以来,阿里巴巴、腾讯、百度、华为等中国科技巨头在AI技术研发、行业应用及生态布局上均迎来爆发期,并显着加码AI投资和布局。阿里、百度等今年以来更频频升级大型语言模型版本,据报华为8月12日将发布AI推理领域突破性技术成果。报道指,这项成果或能降低中国AI推理对高频宽记忆体技术的依赖,提升、完善中国AI大模型推理性能和生态关键部分。DeepSeek虽然淡出了公众的视线,但其技术正在接入各种应用平台,进入应用层面。
在上月访华并首次参加中国国际供应链促进博览会的英伟达首席执行官黄仁勋,更点名大赞中国AI模型属“世界级”,例如DeepSeek、阿里巴巴、腾讯、百度等开发的AI模型,中国的开源AI已成为全球进步的催化剂。他感叹“中国供应链是一个奇迹”,而AI正在革新供应链。
2025年《财富》中国科技50强:华为、DeepSeek、宁德时代位居前三
美国《财富》杂志中文网21日公布2025年“《财富》中国科技50强”榜单,其中华为投资控股有限公司、DeepSeek(深度求索)、宁德时代新能源科技股份有限公司位列该榜单前三。
中新社报道,除上述三家公司,登上“《财富》中国科技50强”榜单前十的依次为,中国种子集团有限公司、阿里巴巴集团控股有限公司、腾讯科技(深圳)有限公司、比亚迪股份有限公司、北京字节跳动科技有限公司、杭州宇树科技股份有限公司、大疆创新。在该榜单中,联想集团有限公司位列第12位,顺丰科技有限公司位列第17位。
关于DeepSeek,该榜单评价称,DeepSeek是中国最具代表性的人工智能大模型产品。其自主研发的DeepSeek-R1大模型,在MMLU(大规模多任务语言理解)基准测试中的得分达到88.5。DeepSeek在全球开源大模型下载量排名中稳居前10位。截至2025年6月,DeepSeek月活跃用户达到1.63亿,位居全球人工智能生成内容应用首位。
该杂志称,在技术迭代与市场需求的交汇中,中国公司们正在以强大的执行力推动科技落地,并表示,“它们的成功不仅在于具体的技术和产品,更在于它们代表的创新精神和全球化视野”。在大模型领域,它们避开空泛的概念炒作;它们通过优化关节灵活性与续航能力,让机器替代人类进入高危、高强度作业场景;它们研发更高效、清洁的能源,让人类与自然更和谐相处。
(编辑:李朔)
