DeepSeek冒起 彭博:美拟严限售华晶片(图)

发布 : 2025-1-31  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈

商务部长提名人卢特尼克


中国人工智能公司DeepSeek(深度求索)的人工智能(AI)模型本月初在海外发布后,至本周一成为苹果iOS下载次数最高的免费应用程式。DeepSeek宣称只用相较百分之五成本,开发效能足以媲美美国最先进的AI模型,但美国OpenAI日前称DeepSeek可能盗用了其模型数据。事件在美国引起国安疑虑,当局急研策略应对。继美国海军要求人员禁用DeepSeek后,彭博社等美英传媒昨(30日)引述消息报道,特朗普政府正考虑扩大对华晶片销售限制至Nvidia现供中国可用于发展AI的H20晶片。获特朗普提名出任商务部长的卢特尼克亦指控中国及DeepSeek「窃取美国技术」,强调须非常严格地执行晶片出口管制。

《纽约时报》周三引述OpenAI的声明称,知道中国组织「正积极利用方法,包括被称为『蒸馏』(distillation)的方法,去复制先进的美国AI模型……我们注意到并正在审查DeepSeek可能不当提取我们模型的[象,将在掌握更多信息后公布相关情况。」

在机器学习领域,「蒸馏」指通过使用大型、预训练模型的输出来训练另一通常较小模型,使其展现出类似能力。这种技术在机器学习领域常见,通常用于公司希望在资源有限的设备(如手机)上部署模型的情况。

「白宫AI和加密货币沙皇」萨克斯周二在霍士新闻访问中称,有「大量证据」显示DeepSeek从OpenAI的模型「蒸馏」知识,形容有关做法有如「盗窃」,惟他未作详细解释。DeepSeek则未即时回应。

《纽时》表示,OpenAI的服务条款有注明禁止任何人利用旗下系统数据,研发可对该公司作市场竞争的技术。

「美AI领先中国只剩3至6个月」

DeepSeek在官网上称,旗下最强AI模型DeepSeek-R1在后训练阶段大规模使用强化学习技术,在数学、程式码、自然语言推理等效能堪与OpenAI o1正式版「比肩」,萨克斯日前也表示,美国于AI方面领先中国的程度只剩3至6个月。DeepSeek宣称只花了557万美元(约4345万港元)完成R1的训练,成本为OpenAI旗下GPT-4o约5%,该公司去年亦曾称只用了约2000枚次级Nvidia晶片训练R1和v3模型,但真实性受质疑。美国时任拜登政府限制对中国出口Nvidia最先进型号晶片后,Nvidia转供性能较次的H800和H20晶片。

特朗普日前形容,DeepSeek的突然冒起对美国「敲响警钟」。彭博社昨率先引述知情人士报道,特朗普政府官员正研拟加强限制Nvidia晶片销售往中国,主要聚焦于扩大禁售范围至H20晶片,消息强调相关讨论仍处于初步阶段。

预告对华科技限制「非常强硬」

卢特尼克周三则在参议院确认其商务部长提名的听证会上表示,不相信DeepSeek模型是「光明正大」地开发出来,并批评中国「只顾自己,并寻求损害美国利益」;称DeepSeek的成功仰赖Meta的开源平台,以及囤积大量Nvidia晶片,指必须结束有关情况,他表示:「如他们要与我们竞争,那就让他们竞争,但别再用我们的工具来跟我们竞争。」卢特尼克又指,如果成为商务部长,在对华晶片等科技限制方面立场将「非常强硬」。

(彭博社/路透社/纽约时报/国会山报/CNBC/财富)