作品未经授权被用作训练生成AI 创作者及出版商促联邦采行动应对

发布 : 2024-7-01  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈

加关注


明声网温哥华 微信公众号
【明报专讯】本国创作者和出版商投诉,其内容在未经授权而且往往没有报告的情况下被用作训练生成式人工智能(Generative AI),并促请联邦政府采取行动应对,但科技公司坚称,此举并不侵犯版权,并指就该做法设限势将窒碍有关技术的发展。

双方在最新发布一份关于版权和人工智能的谘询文件中阐述各自的观点,有关谘询工作是由联邦政府进行,以研究本国版权法应如何应付诸如人工智能公司OpenAI旗下聊天机械人ChatGPT等生成式人工智能系统的出现。生成式人工智能可根据简单提示自动产生创造性的内容,例如图像、音乐、文字等,但前提是系统必须先研究大量现有内容。

加拿大非牟利组织Access Copyright代表作家、视觉艺术家和出版商,它在呈交政府的意见书中指出,大多数其至可能所有大型语言模型(LLM)「目前均从未经授权使用和复制受版权保护的作品中获益」,存在黑箱作业。该组织指:「尽管版权持有知道有关情况,但鉴于他们跟人工智能平台之间的资讯不对称,他们无法确定谁人进行有关行为,谁人的作品被使用,也没有机制阻止有关情况发生。」

加拿大音乐协会(Music Canada)代表全国主要唱片公司,它去年称,一首以Drake、The Weeknd声音为原型的AI生成歌曲在网络上爆红,事件「明确反映一件事,那就是人工智能模型和系统已在未经授权的情况下,从数据或版权持有人的专有数据库摄取大量数据」。

美国正就生成式人工智能系统使用受版权保护的资料提出多宗诉讼,加拿大媒体制片人协会(Canadian Media Producers Association)认为,有关官司说明缺乏透明度所引发的问题,促请联邦政府落实透明度的规定。

不过,人工智能公司坚称,版权持有人要求的透明度是不切实际。微软公司(Microsoft)向渥京表示,培训大型人工智能系统涉及「大量」数据,公司不应保留有关纪录或披露作训练用途的内容,它更认为,此举不属「分析作品、学习概念和事实的侵权行为」。