AlphaGo新版自学3天完胜旧版 40天摸通三千年围棋心得

20171019
东网电视
更多新闻短片
AlphaGo Zero自学围棋。(互联网图片)
高处未算高,曾经把人类顶尖围棋棋士打得落花流水的人工智能程式AlphaGo更上层楼,进化版本AlphaGo Zero在学会基本围棋的玩法后,竟可无师自通花3天时间“左右互搏”,透过自己与自己下棋摸索,就完胜旧版本的AlphaGo,其后更创出自成一格的刁钻下法,被形容为“用40天时间就自学了人类累积了3000年的知识”。
Google旗下的子公司DeepMind开发出来的AlphaGo,连世界排名第一的中国九段棋士柯洁也是它的手下败将,它之所以所向披靡,全因有高手指点,由多名围棋好手教过它数百万手棋的下法,加上能够预计自己的胜算,再调整策略之故。但进化版本AlphaGo Zero,开发人员只教了它围棋的基本玩法,在没有其他指导下,然后它就花3天时间自我摸索,透过自己与自己下棋,从数百万手棋中找出最佳的对弈方法。
AlphaGo Zero其后与它的“前辈”、曾经赢过人类顶尖棋士的AlphaGo对弈,结果以100比0的局数完胜。研究人员更指出,AlphaGo Zero其后更在40天之内,就自我发掘出围棋的要旨,自创新的策略,开发出自己的妙着,显现出它具有真正的创意,成为围棋这个3000年历史游戏的高手,是以形容它“自学了人类数千年才累积得来的知识”。
DeepMind的行政总裁哈萨比斯指出,AlphaGo Zero之所以如此强大,正正因为它不囿于人类的知识所限。他指出,若果AlphaGo Zero的能力可用于医治顽疾,或者可在数周内就找出人类要花数百年才研究得出的治疗方法。DeepMind现已把AlphaGo Zero用于研究复杂的蛋白质折叠,并预期在不久将来就会有新的发现。蛋白质折叠错误可以造成许多不治之症,包括早老性痴呆症、柏金逊症、囊肿性纤维化等,蛋白质折叠的研究一旦有所突破,或可为病患带来新希望。