
香港科技大学首席副校长郭毅可表示,中心非常注意在任佾x???下保护知识产权,举例由人工智能生成的唱歌影片,不会采用任何人的头像,而是由AI合成产生。
【明报专讯】由政府资助的InnoHK香港生成式人工智能研发中心(HKGAI)于2025年2月25日公布研发出HKGAI V1大模型。该系统基于大型语言模型DeepSeek作「全参数微调」并持续训练而成,属全国首例。
■填充题
本港研发的HKGAI V1大模型,系统支持两文三语且基于本地【1._______】 训练,可衍生聊天机械人、文章撰写、录音转换文字、法律文书撰写、作曲、影片生成等多个功能,受其支援的文书辅助应用程式「港文通」,已于70多个政府部门应用。
香港科技大学首席副校长、HKGAI主任郭毅可表示,首要做到政府内部广泛且稳定应用,在有足够承载力的前提下,目标2025年内开放予公众使用。
创新科技及工业局长孙东称,ChatGPT 2023年起引发全球关注,却不对港开放,政府遂组织本地专家教授、科研团队召开多次座谈会,探讨在港开辟【2._______】发展,最终成立HKGAI,由科大联同另外4间大学参与。孙东称,研发中心不到一年,先开发出首个生成式AI文书辅助应用程式「港文通」;2025年初DeepSeek??u出,研发团队迅速将DeepSeek的底座模型架构与HKGAI模型的【3._______】功能结合,「充分体现『一国两制』的价值观」,??u出HKGAI V1大模型。
AI模型需大量资料及数据训练,郭毅可称,训练资料包括由政府提供的【4._______】 、图书馆数据、本土文化资料、专业术语、特定领域的专业知识。模型突破之一是涵盖图片资料,郭形容「一张图顶万句话」,图片资讯量高,若梳理好图片之间关连,可令模型对表格、图像的??u理水平更好。郭透露,面对算力不足,有赖政府提供数码港超算中心的运算力。
郭毅可称,模型建基于统计学,一定会有错误,为确保准确率高,该系统除运用可靠知识库及撷取外来网页资讯,亦有【5._______】 校对,加强??u理能力,例如参考首两个网页后,会比对第三个网页资讯印证。
■知识增益
政府倡扩版权例豁免范围
人工智能(AI)发展衍生版权问题,政府拟修订《版权条例》配合。香港科技大学首席副校长兼HKGAI主任郭毅可称,各国就AI版权问题有不同处理方向,他认为重要的是保障数据合法使用,现时HKGAI所用数据,大量都获授权应用。郭毅可说,训练模型用的数据属「非常有争议的问题」,相信香港法律专家正不断探讨,期望达到「既保障不侵权,又保证不妨碍机器学习」的规管框架。
AI发展衍生版权问题
政府于2024年7月8日启动为期两个月的公众谘询,旨在修订《版权条例》以适应AI技术的快速发展,谘询内容包括AI生成作品的版权保护、侵权责任、引入特定版权豁免等问题。
政府提议引入特定版权豁免,以涵盖非商业及商业性质的电脑数据分析和处理,容许为开采文本及数据、开发和训练AI模型的过程取用版权作品,例如文字、图像、数据等。商务及经济发展局发言人解释,需在版权拥有人和公众利益之间取得平衡,政策太紧将难以??u动AI发展。
(本网发表的文章若提出批评,旨在指出相关制度、政策或措施存在错误或缺点,目的是促使矫正或消除这些错误或缺点,循合法途径予以改善,绝无意图煽动他人对政府或其他社群产生憎恨、不满或敌意。)
[公民学堂 第095期]