스타크래프트2 대전서 '프로게이머' 꺾은 인공지능

이상우 | 기사입력 2019/01/27 [16:36]

스타크래프트2 대전서 '프로게이머' 꺾은 인공지능

이상우 | 입력 : 2019/01/27 [16:36]

인공지능(AI)이 인간 선수와 실시간 전략 게임 '스타크래프트2' 대결에서 승리했다. 알파벳의 인공지능 회사 마인드딥(DeepMind)는 1월 24일(현지시간) 프로게이머와 진행된 스타크래프2 대결 결과를 공개했다. 

'알파스타(AlphaStar)'라는 이름의 인공지능이 그레고이 코민츠(Mana)와 다리오 뷘시(TLO) 등 2명의 프로게이머와 11차례 대결을 펼쳐 10승 1패의 일방적 승리를 거뒀다. 머신러닝으로 게임을 배운 인공지능이 지난해 국제 대회에서 13위, 44위에 오른 프로게이머조차 생소한 전략을 펼치며 완벽한 승리를 거뒀다는 게 딥마인드의 설명이다. 딱 한 번의 승리를 기록한 코만츠는 "지금까지 스타크래프트에서 싸운 어떤 상대와도 달랐다."고 놀라움을 표했다. 코민츠는 맵 전체를 바라보고 대결을 펼친 앞선 대전과 달리, 시야를 인간 수준으로 제한한 경기에서 이겼다.




이번 알파스타의 승리는 예상을 벗어난 진일보다. 분명한 것은 머신러닝은 충분한 데이터와 컴퓨터 처리능력만 있으면 한정된 미션은 아무리 복잡하더라도 해결할 수 있다는 사실이다.


스타크래프트 같은 실시간 전략 게임은 체스, 바둑보다 수학적으로 훨씬 복잡하다. 바둑은 경우의 수가 10의 170제곱이다. 반면 스타크래프트는 최소 10의 270제곱이다. 스타크래프트에서 유닛을 만들고 작업을 수행하는 데 많은 선택의 과정이 요구된다. 게다가 싸우는 상대방의 움직임이 보이지 않는 상황에서 결정을 내려야 한다. 딥마인드는 이 같은 과제를 구글이 자체 개발한 인공지능 전용 칩 'Tensor Processing Unit(TPU)'을 이용해 극복했다.

알파스타는 TPU를 활용한 게임에서 어떤 작전이 승리로 연결되는가를 터득했다. 딥마인드는 이미 공개된 인간 선수들의 경기를 50만 번 보여주고 인간의 전략을 흉내 내는 방식으로 알파스타를 훈련시켰다. 특히 알파스타를 여러 버전으로 나눈 후 서로 일주일간 대전하며 학습하게 했다. 이는 인간 기준으로 하루 24시간 게임을 한다고 가정할 때 무려 200년에 해당하는 방대한 수준이다.
  • 도배방지 이미지

비지니스 많이 본 기사