返回数字报首页 > 2025年02月06  星期 > A05版-时事·世相 > 正文
 [字号   ]   
爆火的DeepSeek你用了没?

2月2日至4日,腾讯云、百度智能云、阿里云等先后接入DeepSeek相关大模型,而大厂在春节假期为深度求索公司加班,只是DeepSeek爆火的一个证据。英伟达市值蒸发创纪录、DeepSeek卡顿、榜单第一……与深度求索直接间接相关的新闻,在春节期间不断刷新。DeepSeek是什么?为何震惊世界?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型和相关技术。2024年底,DeepSeek发布了新一代大语言模型 V3。2025年1月20日,DeepSeek发布其最新开源模型 R1,再次引发全球人工智能领域关注。R1模型在技术上实现了重要突破——用纯深度学习的方法让 AI自发涌现出推理能力。

■据《华商报》

DeepSeek是什么?

DeepSeek是一款由中国的深度求索人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。

与 OpenAI开发的 ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了 GPT-o1级别的表现,引发海外 AI圈的广泛讨论。

据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且成本不到600万美元,堪称“小力出奇迹”。

DeepSeek代表了 AI的未来方向——更懂人话,更会思考,它不仅“脑子快”,还擅长“个性化发挥”,为你做到“全方面考虑”,被网友称为“全能型 AI助手”。

据了解,深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

DeepSeek的产品不仅在技术上表现出色,在市场上也获得了巨大成功。1月27日和28日,DeepSeek在中国区和美国区苹果AppStore免费榜均位列首位,超越了包括ChatGPT在内的多个知名AI产品。

获阿里百度华为腾讯支持 DeepSeek再扩“朋友圈”

阿里云、百度智能云2月3日发文宣布,正式接入 DeepSeek-V3、DeepSeek-R1模型。加之华为云、腾讯云,目前国内四大云巨头都已正式支持 DeepSeek。此前,海外的亚马逊 AWS、微软 Azure等云巨头也已官宣支持。

多家国产芯片厂商也在积极响应。天数智芯、摩尔线程2月4日接连发文宣布支持 DeepSeek模型。GiteeAI联合沐曦2月2日首发全套DeepSeek-R1千问蒸馏模型,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。

业内人士认为,DeepSeek以创新的技术路线吸引了全球科技巨头和优秀独角兽企业的关注和支持,说明国产科技在开放创新的开源环境里具备强大的竞争力,中国本土科技企业的价值理应被重估。

DeepSeek将推动AI实现“平民化”

随着 DeepSeek掀起新一轮 AI热潮,不少普通人会问,未来我们的生活是否会因此而改变?

正如苹果 iPhone的发明被认为是一项颠覆性的技术,因为它彻底影响了人们的生活方式,让千千万万人享受到了技术的红利。在一些业内人士看来,DeepSeek将推动 AI实现“平民化”,而建立在开源的 AI系统之上,更多的开发者能够开发出有用的AI应用场景,从而让AI走入普通人的生活。AI开源初创公司 Hug-gingFace联合创始人、首席科学家 Thomas⁃Wolf在日前的公开活动上谈论到DeepSeek时表示,人工智能的下一步将是“应用”。“大家都在谈论性能强大的 AI大模型,但需要强调的是,AI在应用端还有非常长的‘长尾效应’,AI系统的开源将促进这种‘长尾效应’的发挥。很多模型已经开源并且向用户免费提供。”他说道,“下一步将是如何在这些模型之上建立应用,让模型在应用层面变得有用,从而能完成现实中的任务,让每个人能在生活中受益。”

他还表示,很多时候人们并不需要一个能够解决最前沿数学问题的大模型。“大部分的现实场景应用不需要那么高级别的智商,这些应用是很容易建立起来的。”他说道。

业内人士表示,DeepSeek规模较小的模型将助推 AI模型更广泛部署,降低人们使用 AI的门槛。

DeepSeek为何让美国“紧张”

原因一:高性价比

冲击美国大模型垄断地位

DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。

原因二:模式创新

引发美国高新技术人员恐慌

在喂养学习数据这一大模型重要环节上,OpenAI选择了“人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。

而 DeepSeek相比于“砸资源”选择了另外一种方式。利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力实现了成本的降低和模型性能提升。而这引发了不少美国企业技术人员的恐慌,他们担心自己被质疑技术能力和创新性从而失去工作。

原因三:进步显著

国产大模型正在厚积薄发

根据中国工业互联网研究院推出的《人工智能大模型年度发展趋势报告》,与国际顶尖大模型能力相比,2024年国内大模型的能力进步显著。从2023年第四季度到2025年第一季度的测评显示,国内外大模型能力差距缩小了将近75%。可以看出,DeepSeek的出现是中国国内大模型整体发展的阶段性成果体现。

□链接

遭暗中阻击 2天内网络攻击烈度暴增百倍

据媒体报道,1月30日凌晨,即农历大年初二,奇安信 XLab实验室监测发现,针对 DeepSeek(深度求索)线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。XLab实验室观察到,至少有2个僵尸网络参与攻击,共发起了两波次攻击。

据央视报道,当地时间2月3日,在美国纽约联合国总部,中国常驻联合国代表傅聪举行记者会。当被问到中国人工智能企业深度求索(DeepSeek)发布的模型及中美人工智能合作问题时,傅聪表示:“从华为到 TikTok,再到 DeepSeek,美国还想禁多少?”“永远不要低估中国科研人员的聪明才智。DeepSeek引发全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效,这是全世界、特别是美国需要学习的一课。”

中国明星产品屡遭暗中阻击

DeepSeek推出 R1模型后不久,就凭借其性价比、开源及推理能力的提升等方面获得了广泛关注。

DeepSeek的成功不仅引发了硅谷的震动,更让华尔街感到紧张。就在1月28日,美国芯片巨头英伟达一夜市值蒸发5900亿美元,合4.3万亿人民币,纳斯达克综合指数跌3.07%,台积电、博通公司、超微半导体等科技股也遭遇集体暴跌。美国总统特朗普表示,DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利”。美国众议院首席行政事务官向国会办公室发出通知,警告国会办公室不要使用中国的人工智能应用 DeepSeek(深度求索)的服务。

每次中国优秀的明星产品或企业崛起之时,总会遭到一些境外不法势力的暗中阻击。上一次是《黑神话:悟空》全球上线后,遭遇了海外60个僵尸网络大规模攻击。

本期推荐新闻
关于我们网站团队 - 广告业务 -  网站地图在线投稿 - 合作伙伴
秦楚网(10yan.com) 版权所有 未经同意不得复制或镜像
主管:中共十堰市委宣传部 主办:十堰日报社 
编辑部:0719-8118833 广告部:0719-8118988 技术部:0719-8616541 
推荐显示设置:1024像素*768像素