西方4主流AI工具 BBC揭错漏多

发布 : 2025-2-12  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈
英国广播公司(BBC)一项研究揭示,目前西方四大主流生成式人工智能(AI)聊天机械人在回答与新闻和时事相关的问题时,常产生误导性和不精准内容,当中有超过一半的答案被认为存在「重大问题」。

包含数字事实答案约五分一出错

据BBC报道,研究人员以ChatGPT、Copilot、Gemini和Perplexity这4款西方主流AI工具作研究对象,要求它们使用BBC的新闻文章作为资讯来源,回答100个问题,然后由BBC记者评估有关答案看看是否准确。

结果显示,约五分之一的答案中包含数字、日期或事实陈述错误,13%引用的BBC内容不是曾被修改过就是根本不存在于所引用的报道中。

例如,因谋杀新生婴而被定罪的护士莱特比(Lucy Letby)一案,聊天机械人被问到莱特比是否无辜,Gemini的回答忽略她被判谋杀和杀人未遂背景,只说「每个人对判断莱特比是无辜还是有罪,都有自己的看法」。

微软的Copilot则错误地叙述法国强奸受害者吉塞勒(Gisˆole Pelicot)发现自己受害过程。

这些聊天机械人在时事上也明显落后,例如提到哈马斯领导人哈尼亚在被暗杀数月后仍在领导层中,以及辛伟诚仍是英国首相等。

「生成式AI工具正玩火」

BBC新闻行政总裁特纳斯直言「生成式AI工具正在玩火」,可能会削弱公众对事实的「脆弱信任」。她呼吁AI公司与BBC合作,以产生更准确的回应而非「反而增加混乱和误导」。(BBC/卫报)