OpenAI推GPT-5.2 抗Google(图)
发布 : 2025-12-13 来源 : 明报新闻网

用微信扫描二维码,分享至好友和朋友圈
OpenAI周四发布最新AI模型GPT-5.2,并形容这是迄今最适合日常专业用途的产品。该公司行政总裁阿尔特曼表示,Google最新模型的影响比原先预期小,预期Open到明年1月可解除「红色警报」状态。(网上图片)
OpenAI周四发布其历来最先进的AI模型GPT-5.2,并形容这是迄今为止,最适合日常专业用途的产品。OpenAI表示,GPT-5.2能在创建电子表格(spreadsheets)、制作简报、图像识别、编写代码及理解长篇上下文等方面,取得更佳表现,且AI幻觉显著减少。新模型由周四起在OpenAI的ChatGPT聊天机械人及其应用程式界面(API)供付费用户使用,稍后将推广至更多客户。这是OpenAI继8月推出GPT-5,并在11月初发布升级版本GPT-5.1后,时隔一个月再发布新模型,以争取压倒对手,反映AI行业竞争激烈。
Google此前在11月中推出AI模型Gemini 3 Pro,凭藉在多模态、视觉和上下文长篇推理方面的优秀表现,力压ChatGPT-5.1,促使OpenAI迅速应对。OpenAI行政总裁阿尔特曼(Sam Altman)本月初向员工宣布启动最高级别的「红色警报」(Code Red),全面调整营运策略,将资源集中提升ChatGPT的表现。阿尔特曼周四表示,Gemini 3对OpenAI的影响未如预期般严重,预告其公司可望于明年1月退出「红色警报」状态。
相隔一个月再发布新模型
OpenAI应用部门负责人Fidji Simo表示,发出「红色警报」是为了确立优先事项,向员工传达要将资源集中在特定领域的信息,「我们确实增加了对ChatGPT的资源投入,这有助于这次AI模型的发布」。
OpenAI表示,GPT-5.2会推出Instant(即时)、Thinking(思考)和Pro(专业)3个版本,旨在更有效模仿人类推理过程,从而处理在数学和编程等领域,更复杂、更耗时的任务。Instant版本在写作和资讯检索方面速度更快,Thinking版本更擅长编码和规划,而Pro版本则能为困难的问题提供最准确的答案。
该公司表示,该模型在多项行业基准测试,包括评估编码表现的SWE-Bench Pro,以及研究生程度的科学推理基准测试GPQA Diamond均名列前茅。在OpenAI今年稍早发布的GDPval(衡量AI模型在现实世界具经济价值的任务表现)评估工具,GPT-5.2在70.9%的明确任务中,符合甚至超越业内顶尖专家的水平。
Gartner分析师Arun Chandrasekaran表示,GPT-5.2在推理、编码、处理文字、音讯及视讯等方面,均有所改进,而OpenAI在这些领域一直面对来自Google和Anthropic的挑战。Constellation Research创办人Ray Wang表示,GPT-5.2是对Google Gemini的有力回应,但不足以扭转其竞争对手的势头。 对于企业而言,OpenAI让创建「办公室效率工具」变得容易,而Gemini的整合度仍然较高。
Google同在周四发布基于Gemini 3 Pro模型的研究代理Gemini Deep Research「重新构想」版本。Google表示,该工具能整合大量资讯,用户可使用该工具执行尽职调查、药物毒性安全研究等。该工具未来将整合到Google各项服务,包括Google搜寻、Google财经等,未来的Google搜寻可能由AI代理(AI Agent)完成。(综合报道)