독학으로 몇시간 만에 세계 최강 소프트웨어 능가
서로 다른 게임에 사용 가능한 첫 범용AI로 '눈길'
논문에 따르면 개량 알파고 제로에 장기와 체스의 기본 규칙만 가르친 후 자기 스스로 대전을 되풀이하도록 했다. 기존의 인공지능은 인간이 오랜 역사를 거치면서 고안한 '정석'과 프로 기사의 기보를 학습하는 방식으로 강해졌지만, 이번에는 기존 데이터를 전혀 제공하지 않았다.
올해 세계 컴퓨터 장기선수권대회에서 우승한 장기 소프트웨어 '엘모'와 지난해 체스 세계대회를 제패한 '스톡피시', 바둑의 '알파고'와 실력을 비교한 결과 개량 '알파고 제로'가 장기는 2시간 만에, 체스는 4시간 만에, 바둑은 8시간 학습한 시점에서 각각 기존 최강 소프트웨어를 능가하는 실력에 도달한 것으로 나타났다.
각 소프트웨어와의 100회 대전 성적은 장기가 90승 8패 2 무승부, 체스는 28승 무패 72 무승부, 바둑은 60승 40패였다.
인공지능이 불과 몇 시간 만에 독학으로 장기·체스·바둑에서 모두 세계 최강자가 되는 3관왕에 오른 것이다. 서로 다른 게임에 사용할 수 있는 최강자급의 범용 AI도 개량 알파고 제로가 처음이다.
홍정민 기자
jmhong04@naver.com