ChatGPT升级可语音对话辨影像(图)

发布 : 2023-9-27  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈

据OpenAI网站公布的例子示意图,ChatGPT新增「看、听、说」功能,例如使用者拍下一张单车照片,询问如何降低单车座椅的高度,ChatGPT就会给予详细的调整步骤。(网上图片)


发明人工智能(AI)聊天机械人ChatGPT的美国初创企业OpenAI周一(25日)宣布推出备受期待的ChatGPT更新版,一直以来仅限于输入文字提示的ChatGPT新版本变得「能看、听、说」,使用者可以与ChatGPT直接对话沟通,亦能够向它输入影像。ChatGPT跳出纯文字框架,被视为该程式一大突破。

OpenAI在官网发表文章称,新版ChatGPT新增用户与AI语音对话功能,它甚至能「展示」出双方谈论的内容,「语音和影像为大家提供更多在生活中使用ChatGPT的方式」。文中提到的例子包括,「在旅行时拍下一张名胜照片,然后即时讨论当中有趣的地方」,又或拍下雪柜内部的照片就可取得食谱建议,或是拍下孩子的数学作业相片就能帮忙找出答案等。在输入相片时,用户可以输入语音或文字提出问题,甚至可以利用程式的绘画功能协助点出想查询的重点。OpenAI称,ChatGPT在辨认人类样貌上未必准确,加上私隐原因,因此新版ChatGPT被限制了分析人类外貌和直接评头品足的能力,亦无法说出某相片内人物的资料。

忧骗徒生成语音 暂限付费者用

新功能暂只供付费用户使用。OpenAI表示语音和影像功能将在未来两周向ChatGPT Plus和Enterprise用户推出,「之后很快」进一步开放。OpenAI解释暂时不全面推出的原因,指新功能让用户于几秒内生成出逼真的语音,有可能带来风险,包括有不法之徒用作诈骗。

自从ChatGPT去年底推出以来,多家AI公司展开AI聊天机械人竞赛。Google的同类产品Gemini预计在短期内推出,据报已有数家公司进行测试。网购巨擘亚马逊周一亦宣布,将投资40亿美元(约312亿港元)到AI初创企业Anthropic,为公司的生成式AI业务提供支援。

(法新社/纽约时报/卫报/The Verge)