原標(biāo)題:新“阿爾法狗”自學(xué)三天擊敗“前輩”
據(jù)新華社電 人工智能“阿爾法圍棋(AlphaGo)”新版本“從零開(kāi)始”學(xué)習(xí)圍棋,僅用3天就擊敗其前輩版本,成為新的王者。
在新一期英國(guó)《自然》雜志上,英國(guó)“深度思維”公司將“阿爾法圍棋”的發(fā)展分為四個(gè)階段:第一個(gè)版本是“阿爾法圍棋-樊”,它在2015年戰(zhàn)勝歐洲圍棋冠軍樊麾,標(biāo)志著人工智能首次戰(zhàn)勝人類(lèi)職業(yè)棋手;第二個(gè)版本是“阿爾法圍棋-李”,它在2016年戰(zhàn)勝曾多次奪得世界冠軍的韓國(guó)棋手李世石,標(biāo)志著人工智能戰(zhàn)勝人類(lèi)頂級(jí)棋手;第三個(gè)版本是“阿爾法圍棋-大師”,在今年戰(zhàn)勝現(xiàn)在世界排名第一的柯潔,并在與多位有世界冠軍頭銜的人類(lèi)棋手“群戰(zhàn)”中完勝。
但是,這些版本在剛開(kāi)始學(xué)習(xí)圍棋時(shí),都要依靠人類(lèi)知識(shí),即先教它們一些人類(lèi)摸索出的基本下法,然后再開(kāi)始自己學(xué)習(xí)。第四個(gè)版本,即最新的“阿爾法圍棋-零”擺脫了這個(gè)限制,研究人員沒(méi)有給它除棋盤(pán)和棋子之外的任何輸入,它完全是“從零開(kāi)始”,自己與自己對(duì)弈,通過(guò)更為優(yōu)秀的算法,取得飛速進(jìn)步。開(kāi)始學(xué)習(xí)圍棋3天后,“阿爾法圍棋-零”就以100比0的成績(jī)戰(zhàn)勝了“阿爾法圍棋-李”;40天后,它又戰(zhàn)勝了“阿爾法圍棋-大師”。
研究人員認(rèn)為,“阿爾法圍棋”的進(jìn)步標(biāo)志著人工智能的巨大突破,意味著人工智能可以更好地進(jìn)入對(duì)它來(lái)說(shuō)本是一片空白的領(lǐng)域。