알파고의 승리, 그리고 인공지능의 현재
상태바
알파고의 승리, 그리고 인공지능의 현재
  • by 이상우
‘인간계’를 대표하는 천재 바둑 기사 이세돌 9단이 구글 딥마인드가 개발한 인공지능 ‘알파고’와의 역사적인 첫 대국에서 불계패했다. 자기학습을 통해 빠르게 진화한 인공지능에 인간이 무릎을 꿇은 것이다. 바둑을 잘 모르는 나는 물론 이 대국을 지켜본 바둑 전문가들은 얼빠진 표정이다. 인공지능이 예상보다 빠르게 성장하면서 인간의 삶에 깊숙이 파고들 것이라는 불쾌감 같은 것이 묻어 있다.

‘초지능(super intelligence)’을 쓴 영국 옥스퍼드대의 AI 전문가 ‘닉 보스트롬’은 지능을 가진 컴퓨터가 정말 인류의 종말을 앞당길 수 있다고 강조한다. 그러면서 구글 알파고의 힘을 과소평가하는 것은 아니지만, 그것이 반드시 큰 도약을 의미하는 것은 아니라고 주장한다. 몇 년 동안 심층학습과 강화학습 같은 인공지능 기술의 꾸준한 발전의 결과라는 얘기다. 이번 알파고의 승리는 인공지능이 얼마나 진보했는지 그리고 어디로 가는지를 잠시 멈춰 서서 생각해보는 좋은 기회다. 





 

딥마인드, 알파고




딥마인드는 체스 천재소년 ‘데미스 하사비스’가 2010년 창업한 영국 벤처기업이다. 심층학습과 강화학습을 기초로 스스로 광범위하게 학습하는 인공지능에 몰두한 하사비스 CEO는 이것을 응용해 ’퐁’ ‘브레이크 아웃’ 같은 고전 비디오 게임을 플레이하는 시스템 알파고를 개발한다. 알파고는 프로 게이머를 뛰어넘을뿐더러 인간이 결코 하지 않거나 할 수 없는 기발한 방식으로 게임을 공략한다. 이것이 구글이 4억 달러에 딥마인드를 인수한 가장 큰 이유다. 알파고는 1월 27일 대중 앞에 모습을 드러낸다. 과학 저널 ‘네이처’는 딥마인드 알파고가 지난해 10월 판 후이(유럽 바둑 챔피언)과 벌인 공식 대결에서 5차례 모두 이겼다는 소식을 표지논문을 통해 소개했다. 

그동안 바둑은 인공지능에게 가장 어려운 도전 과제 중 하나였다. 바둑의 착수 패턴이 무한대에 가까워서다. 체스가 10의 120승, 일본의 보드 게임 쇼기는 10의 220승인데 반해 바둑은 10의 360승의 엄청난 패턴이 존재한다. 이 무한대에 가까운 바둑의 착수 패턴을 알파고는 이미지 인식 기술을 통한 심층 학습함으로써 판 후이에 이어 이세돌 9단에 승리하는 수준까지 진화했다. 하사비스 CEO는 알파고가 돌의 위치를 계산하는 ‘정책망’으로 탐색의 범위를 좁히고, 승률을 계산하는 ‘가치망’으로 탐색의 깊이를 좁힌다고 말한다. 계산해야 하는 경우의 수를 획기적으로 줄임으로써 인간 고유의 능력으로 여겨진 직관력을 모방한다는 것이다. 16만판에 이르는 방대한 바둑 기보 빅데이터를 밤낮을 가리지 않고 실전 같은 훈련(?)을 한 덕분이다. 




구글이 알파고에 바둑을 가르친(?) 이유 또한 ‘바둑의 복잡성’에 있다. 컴퓨터가 처음 공략한 게임은 1952년 틱택토다. 그리고 1997년 불가능할 것이라던 체스 대결에서 IBM의 인공지능 체스 프로그램 ‘딥블루’가 인간 체스왕 '카스파로프'를 꺾었다. IBM은 또 대화형 인공지능 프로그램 ‘왓슨’ 개발하고 2011년 미국 유명 TV 퀴즈쇼 ‘제퍼디’에 출전해 역사상 처음으로 인간과 퀴즈 대결을 벌였다. 왓슨은 제퍼디에서 상금을 가장 많이 받은 사람과 74회 연속 우승을 기록한 사람 둘을 상대로 초반부터 승기를 잡으며 마지막까지 선두 자리를 놓치지 않았다. 그러면서 인공지능은 착수의 방대함에서 난공불락의 영역이었던 바둑까지 공략한다. 알파고는 최첨단 컴퓨터 바둑 프로그램과 토너먼트 대결에서 499승 1패를 기록해 ‘바둑 프로그램의 갑(甲)’으로 등극했다.

알파고는 컴퓨터 여러 대를 연결한 일종의 네트워크 컴퓨터다. 총 1202개의 CPU와 170개의 그래픽 카드로 구성된 12층의 신경망이 70만여 회에 이르는 바둑 대국을 치르며 스스로 학습했다. 한국 기원에 다니진 않았지만, 딥러닝 알고리즘을 통해 일종의 ‘독학’을 한 셈이다. 간단하게 이야기하면 이렇다. 앞서 언급했듯이 알파고는 ‘정책망’과 ‘가치망’이라는 2개의 신경망을 가지고 있다. 정책망은 방대한 바둑 대국을 통해 익힌 직관력으로 다음번 돌을 놓을 만한 경우의 수를 제시한다. 다음은 가치망 차례다. 수많은 경우의 수에서 현재 가장 적합한 하나의 착수를 선택한다. 바둑 프로 기사들이 수많은 대국을 통해 성장한다면, 알파고는 정책망에 3000만 개의 위치 정보를 입력하는 반복 훈련을 통해 그 정확도를 57%까지 끌어올렸다. 알파고 전에는 44%였다. 


 

만약 우주가 거대한 바둑이라면


이세돌 9단과 첫 대국에서 알파고의 승리로 영국 SF 작가 아서 C. 클라크가 1964년 발표한 ’2001 스페이스 오디세이’가 문득 뇌리를 스친다. 오늘날 시점에서 보더라도 절로 소름이 돋는 구석이 많아서다.



이 작품의 등장인물로 가장 유명한 존재는 인공지능을 지닌 컴퓨터 ’HAL’이다. 이 작품의 재미는 HAL이 인공지능뿐 아니라 감정을 지닌 일종의 ‘생물’이 되면서부터 시작된다. 토성 탐사 우주선이 여행하는 도중 우주선 주 컴퓨터인 HAL은 “멀쩡한 장치를 고장이 났다”며 우주인들이 우주선 밖에서 수리하도록 내보내 우주 속에 그들을 방치하고 죽게 만든다. 결국 미쳐버린 HAL의 광기를 목격한 주인공 데이비드 보먼은 HAL을 정지시키기 위해서 HAL의 중앙 전상망에 침입해 생각하는 부문의 패널을 빼버렸고, HAL은 자신을 만든 찬드라 박사가 입력한 초기 정보를 토해내다 죽게(정지하게) 된다.

앞서 말한 AI전문가인 닉 보스트롬은 "인공지능은 원자폭탄보다 위험할 수 있다. 이는 인간이 악용할 수 있는 가능성보다 인간이 전혀 통제할 수 없을 가능성 때문"이라고 주장했다. 기계가 인류보다 똑똑해진 후 인간의 제어를 완전히 벗어날 경우를 대비하여 기계의 가치체계, 동기부여 시스템이 인간이 올바르다고 생각하는 것과 일치하도록 설계해야 한다는 것이다. HAL처럼 알파고 또한 인간이 준 데이터에서 학습할 뿐만 아니라 스스로 배우고 있다. 즉, 자신만의 데이터를 만들어 낸다. 테슬라 모터스 창업자 엘론 머스크가 인공지능이 인간을 능가하고 인간의 통제에서 벗어날 가능성에 우려를 표명한 것도 같은 맥락에서 이해할 수 있다. 

하지만 현재 알파고로는 엘론 머스크가 걱정하는 상황은 극히 희박하다. 매우 복잡한 게임을 공략하기 위해 인공지능을 사용한 것에 불과하다. 사실 알파고는 진짜 인간의 지능에 훨씬 못 미친다. 인간의 능력을 뛰어넘는 인공 지능을 의미하는 초지능 즉, ‘슈퍼 인텔리전스’와는 거리가 멀다. 하지만 인공지능과 관련해 경고가 계속 나오는 이유는 바둑을 이해한다면, 아마도 더 많은 것을 이해하는 것이 가능하기 때문일 것이다. 어느샌가 이런 경고가 현실화되는 경계선을 돌파할지도 모른다는 얘기다. 알파고와 이세돌 9단의 대국은 이런 우려가 우리 생각보다 빨리 진행되고 있다는 상징일 수 있다. 재미로만 이번 대국을 바라볼 수 없는 이유다. 각설하고, 두 번째 대국에서 이세돌 9단의 승리를 빈다.

  [리뷰전문 유튜브 채널 더기어TV]
이 기사를 공유합니다
ABOUT AUTHOR

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
COMMENT 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.