不靠人类自学3天 新版AI击败AlphaGo(图)

发布 : 2017-10-20  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈

加关注


明声网温哥华 微信公众号

哈萨比斯(图)表示Zero的能力显示AI发展迈出一大步,将来或可协助人类的科研工作。(法新社)


Google旗下的人工智能研究公司DeepMind宣布,他们开发出的人工智能(AI)程式AlphaGo最新版本Zero,可以毋须人类教导就可「由零开始」自学围棋,3天就能战胜旧版本AlphaGo。研究员称,Zero不再受人类所限,能自创知识,标志著迈向通用AI的重要里程碑。

旧版本AI需透过学习逾10万个围棋高手对局才能超越顶尖棋手,但最新版的AlphaGo Zero,则只要开发员输入围棋基本规则和空白棋盘数据就能自学。

开发员利用新形式「强化学习」模式设计Zero,并结合寻找下一步棋的模拟搜索和神经网络,以决定胜算最高的棋步。

AlphaGo Zero熟习逾千年棋法

Zero凭自我对局数以百万次,从最初随机在棋盘上放棋子,至后来发现致胜策略。Zero经过3天自我对局后,已能打败在2015年击败韩国棋手李世石的旧版AlphaGO,且对局100次未失一局。经过40日练习后,Zero与今年5月击败过世界第一的中国棋手柯洁的新版AlphaGo对局,胜率已超过90%。DeepMind行政总裁哈萨比斯(Demis Hassabis)称,Zero发现棋手逾千年来发展出的棋法,甚至研究出更好棋法。

AlphaGo首席研究员西尔弗(David Silver)称,Zero不用人类输入大量数据,不再受人类知识所限,可以自行创造知识。现时的AI只是为个别目的而研发出来,只负责单一用途,例如翻译语言、脸部辨识等。但「通用AI」可以应用于不同种类工作,理论上可解决不同问题。哈萨比斯称,Zero的设计并非只在下棋,修改程式可以应用到其他范畴,例如Zero目前亦正研究蛋白质摺叠(proteins fold)原理。

AI突破是否将会在所有范畴取代人类?英国谢菲尔德大学电脑神经科学教授瓦西拉奇(Eleni Vasilaki)虽然对Zero的成果感到惊喜,但指AI不容易做到一些人们轻易完成的事,例如走路、跑步和踢球。

哈萨比斯亦承认,Zero只胜任于电脑可完整模拟的任务,驾驶汽车则难以做到。他预测未来10年,AI或可协助人类发现新药物、新物质,研究量子化学和粒子物理等,以医学和科研专家的身分跟人类共事。他说:「我们感到很兴奋,因为我们即使距离开发全面的AI仍有很长距离,现在它应该可以对一些真实问题带来显著改变。」。

(BBC/The Verge/卫报/金融时报)