明声报(多伦多版) mingshengbao.com

ChatGPT升级可语音对话辨影像(图)

发布 : 2023-9-27 来源 : 明报新闻网

用微信扫描二维码，分享至好友和朋友圈

据OpenAI网站公布的例子示意图，ChatGPT新增「看、听、说」功能，例如使用者拍下一张单车照片，询问如何降低单车座椅的高度，ChatGPT就会给予详细的调整步骤。（网上图片）

发明人工智能（AI）聊天机械人ChatGPT的美国初创企业OpenAI周一（25日）宣布推出备受期待的ChatGPT更新版，一直以来仅限于输入文字提示的ChatGPT新版本变得「能看、听、说」，使用者可以与ChatGPT直接对话沟通，亦能够向它输入影像。ChatGPT跳出纯文字框架，被视为该程式一大突破。

OpenAI在官网发表文章称，新版ChatGPT新增用户与AI语音对话功能，它甚至能「展示」出双方谈论的内容，「语音和影像为大家提供更多在生活中使用ChatGPT的方式」。文中提到的例子包括，「在旅行时拍下一张名胜照片，然后即时讨论当中有趣的地方」，又或拍下雪柜内部的照片就可取得食谱建议，或是拍下孩子的数学作业相片就能帮忙找出答案等。在输入相片时，用户可以输入语音或文字提出问题，甚至可以利用程式的绘画功能协助点出想查询的重点。OpenAI称，ChatGPT在辨认人类样貌上未必准确，加上私隐原因，因此新版ChatGPT被限制了分析人类外貌和直接评头品足的能力，亦无法说出某相片内人物的资料。

忧骗徒生成语音暂限付费者用

新功能暂只供付费用户使用。OpenAI表示语音和影像功能将在未来两周向ChatGPT Plus和Enterprise用户推出，「之后很快」进一步开放。OpenAI解释暂时不全面推出的原因，指新功能让用户于几秒内生成出逼真的语音，有可能带来风险，包括有不法之徒用作诈骗。

自从ChatGPT去年底推出以来，多家AI公司展开AI聊天机械人竞赛。Google的同类产品Gemini预计在短期内推出，据报已有数家公司进行测试。网购巨擘亚马逊周一亦宣布，将投资40亿美元（约312亿港元）到AI初创企业Anthropic，为公司的生成式AI业务提供支援。

（法新社/纽约时报/卫报/The Verge）

国际

热点文章