전체기사 최신뉴스 GAM
KYD 디데이

[세돌-한돌/구글-NHN] 한돌 실력은? 알파고 근접했지만

기사입력 : 2019년12월17일 15:29

최종수정 : 2019년12월17일 15:29

알파고 성장 경로 답습...'알파제로' 수준까지 접근
데이터 양과 질에서 구글과 차이 뚜렷

[편집자] '바둑판의 풍운아' 이세돌 9단이 현역에서 물러납니다.  상대의 의표를 찔러 난전을 즐겼던 승부사. 평범을 거부했기에 인공지능(AI)을 극복한 세계 유일의 기사. 은퇴 이벤트도 이목을 집중시킵니다. AI와 의 재대결. 구글 '알파고'와 대결후 3년9개월만입니다. 국내 기술진이 만든 '한돌'과 세 판을 둡니다. 종합뉴스통신 뉴스핌이 '세돌과 한돌의 대결'을 두 가지 측면에서 조명합니다. 인간과 AI의 두뇌싸움이란 측면과 알파고(구글)와 한돌(NHN)의 AI기술 대결입니다.  

[서울=뉴스핌] 김지완 기자 = 이세돌 9단 은퇴대국 상대 인공지능(AI) '한돌' 실력은 알파고 최종버전 '알파제로'에 근접한 것으로 나타났다. 다만 구글 알파고와 NHN 한돌 사이를 구분짓는 확실한 '격차'가 존재한다는 게 전문가들의 평가다.

한돌은 10개월간의 개발 기간을 거쳐 지난 2017년 12월 '한돌' 버전 1.0을 출시했다. 이후 두 번의 판올림을 거치며 3.0버전까지 출시됐다.

출시 1주년을 맞은 지난해 12월 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단과 국내 바둑 랭킹 1위 신진서 9단과의 대국에서 연이어 승리를 거뒀다. 올해 8월 중국 산둥성에서 열린 '2019 중신증권배 세계 인공지능(AI) 바둑대회'에선 3위를 달성했다.

<사진=이형석 사진기자>

◆ 한돌, 알파고 성장 경로 그대로 답습...'알파제로' 수준 근접

한돌은 알파고 성장 경로를 그대로 따랐다. 이창율 NHN 게임AI팀장은 "한돌 1.0은 인간 기보를 사용해서 기력을 끌어올렸고, 2.0부턴 사람 기보 없이 자가 대국만으로 기력을 향상시켰다"며 "3.0에선 자가 대국 속도를 좀 더 빠르게 할 수 있도록 평가 과정을 없앴다"고 밝혔다.

그는 "그 결과 한돌 1.0은 프로기사를 상대로 60%의 승률을 보였다"며 "한돌 2.0은 1.0에 비해 90%의 승률로 개선됐다. 버전 3.0은 2.0에 대해 80~90% 승률을 기록했다"고 설명했다.

알파고 제로(Zero) 역시 인간의 기보에 의존하는 지도학습 없이, 바둑 규칙만으로 스스로 학습하며 기력을 끌어올렸다. 학습 36시간 만에 알파고 리(Lee)의 수준을 능가했다. 72시간 만에 알파고 리와 대국에서 100승에 이를 때까지 패배가 없었다. 40일 후 알파고 마스터와 대국에선 100전 89승 11패를 기록했다.

이에 한돌이 알파고 최종버전 '알파제로(Alpha Zero)' 수준에 근접했다는 분석이다. 

알파제로는 점점 강해지는 자신과의 게임을 반복하면서 스스로 빅데이터를 구축하는 단계에 올라섰다. 알파고는 '판(Fan)' → '리(Lee)' → '마스터(Master)' → '제로(Zero)' → '알파제로(Alpha Zero)' 순으로 발전했다. 이세돌 9단과 승부를 겨뤘던 버전은 '알파고 리'.

이스트소프트 AI연구소의 수석연구원은 "알파고 각 버전의 기술이 공개되고, 이를 바탕으로 개발된 여러 바둑 인공지능들의 경쟁을 통해 기술이 발전하고 있다"며 "한돌은 최강으로 알려진 알파고 제로와 알파 제로에서 사용한 머신러닝 기술을 적용했다. 우리 인공지능 수준은 미국과 중국에는 다소 뒤지지만 사용하는 기술은 격차가 크지 않다"고 진단했다.

NHN 측은 딥러닝의 보편적 방식인 '하이퍼파라미터(Hyperparameter, 직접 세팅하는 값)'를 사용해 동시 학습을 진행했다고 전했다. 아울러 학습 속도를 높일 수 있는 최신 트렌드의 다양한 학습법을 많이 적용했다고 밝혔다.

이창율 NHN 게임AI팀장은 "알파고는 프로기사 9단하고만 대국을 했고, 은퇴를 해서 정확한 기력을 모른다"면서도 "하지만 논문을 기준으로 봤을 때, 한돌은 '알파고 리'는 넘어섰고, 알파고 제로나 알파제로 사이로 본다"고 평가했다. 

구글 알파고는 2017년 10월 네이처에 '인간 지식 없이 바둑을 마스터하기', 지난해 12월 사이언스에 '자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘'을 각각 게재했다.

◆ 몬테카를로 기술 적용에선 알파고만큼 성과 못내..."데이터 차이만큼 실력차이 날 것"

다만 구글과 NHN 사이에 넘볼 수 없는 차이, '격차'는 존재한다.

한돌에도 알파고에서 쓰였던 '몬테카를로 트리 탐색(Monte Carlo tree search, MCTS)' 기술이 그대로 적용됐지만, 성과에선 차이를 보였다. MCTS는 상대방과 한번씩 번갈아 가면서 두는 바둑에서 실시간으로 자신과 상대의 가장 좋은 수를 시뮬레이션하면서 최적의 수를 찾는 방법이다.

이창율 팀장은 "알파고는 MCTS에 자가대국으로 만든 기보를 더해 다음 수에 대한 예측과 승리 확률을 높였다"면서 "우리도 MCTS를 놓고, 딥러닝/UCB(Upper Confidence Bound, AI 강화학습 방법 중 하나) 등의 알고리즘들을 실험 해봤지만, 성능이 그렇게 좋아지진 않았다"고 말했다.

그는 "다만 한돌엔 여러 사람이 의논해 좋은 수를 내는 것과 비슷한 '앙상블 추론(Ensemble Inference)'과 통계를 이용한 시뮬레이션으론 어느 정도 성능 개선이 나타났다"고 설명했다.

인공지능 성능을 판가름 짓는 데이터 양과 질에서도 구글에 비해 NHN은 한 수 아래란 평가다. 

소프트웨어업체 인공지능을 담당중인 한 개발자는 "인공지능은 학습에 필요한 데이터와 장비의 규모가 성능을 좌우한다"면서 "한돌이 규모의 경제가 있는 미국·중국만큼 성능을 끌어올리는데 어려움이 있었을 것"이라고 분석했다.

또 다른 인공지능 개발자는 "알파고 알파제로 수준의 데이터를 한돌은 확보하지 못했다"며 "데이터 질적 수준과 양에서 구글과 NHN 차이는 뚜렷하다. 그 차이만큼 알파고와 한돌의 실력 차이가 존재할 것"이라고 평가했다.

 

swiss2pac@newspim.com

[뉴스핌 베스트 기사]

사진
[단독] 李정부 국정 5개년 책자 나왔다 [서울=뉴스핌] 윤채영 지혜진 기자 = 이재명 정부의 국정운영 5개년 계획이 담긴 책자가 발간된 것으로 20일 확인됐다. 이날 뉴스핌이 확보한 '이재명 정부 국정운영 5개년 계획(안)' 책자에는 123대 국정과제에 대한 주요 내용과 구체적인 입법 방향 등이 담겼다. [서울=뉴스핌] 이재명 대통령이 13일 서울 종로구 청와대 영빈관에서 열린 국정기획위원회 국민보고대회에서 발언하고 있다. [사진=대통령실] 2025.08.13 photo@newspim.com 국정기획위원회가 지난 13일 1호 과제로 발표한 개헌에는 대통령 권력 구조 개편도 포함됐다. ▲4년 연임제 및 결선투표제 도입 ▲감사원 국회소속 이관 ▲대통령 거부권 제한 ▲비상명령 및 계엄 선포 시 국회 통제권 강화 ▲국무총리 국회 추천제 도입 ▲중립성 요구 기관장 임명 시 국회 동의 의무화를 추진하겠다고 명시했다. 또 5·18 광주 민주화운동 정신 등 헌법 전문 수록과 검찰 영장 청구권 독점 폐지, 안전권 등 기본권 강화 및 확대, 지방자치와 균형발전을 위한 논의기구 신설, 행정수도 명문화 등이 개헌 과제로 포함됐다. 개헌을 위한 국민투표법 개정도 추진된다. 헌법불합치 결정을 받은 재외국민 투표 관련 규정을 개정해 국민투표법 위헌을 해소하겠다는 계획이다. 개헌 찬반 투표는 2026년 지방선거나 2028년 국회의원 선거 때 실시하겠다고 명시했다. [서울=뉴스핌] 뉴스핌이 확보한 이재명 정부 국정운영 5개년 계획(안) 책자. 2025.8.20 ycy1486@newspim.com 이번 책자에는 국정기획위가 지난 13일 대국민보고대회에서 공개한 123대 국정과제보다 훨씬 세부적인 내용이 담겼다. 당초 국정위는 이날 국정운영 5개년 계획도 공개하려 했다가, 돌연 비공개 결정을 내렸다. 비공개 결정에는 이재명 대통령의 의중이 강하게 작용한 것으로 알려졌다. 국정위 소속으로 활동했던 한 위원은 뉴스핌과 통화에서 "갑자기 보안을 강조하면서 내부 자료는 절대 공개하지 말라고 했다"며 "이유는 모른다"고 전했다.  ycy1486@newspim.com 2025-08-20 15:55
사진
美, 인텔 이어 삼성도 지분 내놔라? [서울=뉴스핌] 최원진 기자= 도널드 트럼프 미국 행정부가 반도체법(CHIPS Act)상 보조금을 활용해 인텔 지분 확보를 추진 중인 가운데, 삼성전자와 대만 TSMC 등 다른 반도체 기업에도 같은 방식을 적용하는 방안을 검토 중이라고 로이터 통신이 두 명의 소식통을 인용해 19일(현지시간) 보도했다. 보도에 따르면 하워드 러트닉 상무부 장관은 삼성전자, 마이크론, TSMC 등 미국 내 공장 건설과 투자를 진행 중인 반도체 기업들을 상대로, 조 바이든 전임 행정부 시절 약속된 정부 보조금 제공과 맞바꿔 지분을 확보하는 방안을 모색하고 있다. 현실화하면 글로벌 반도체 업계에 파장이 불가피하다. 미국 정부에 지분을 넘기고 싶지 않다면 보조금을 포기해야 할 수 있는데 이 경우 기업들의 순익 전망과 투자 계획도 차질을 빚을 수 있다. 미국의 산업정책이 정권에 따라 오락가락한다는 업계의 불만과 비난 또한 커질 수 있지만 트럼프 행정부의 성격상 귀담아 들을 가능성은 높지 않다. 러트닉 장관은 CNBC 인터뷰에서 "트럼프 대통령은 미국이 거래에서 실질적 이익을 얻어야 한다고 본다"며 "왜 1천억 달러 규모의 기업에 돈을 줘야 하는가. 우리는 약속한 보조금을 지급하되, 그 대가로 지분을 받아 미국 납세자들에게 혜택을 돌릴 것"이라고 말했다. 트럼프 행정부가 인텔 지분 10%를 확보할 경우 최대 주주가 될 수 있지만, 러트닉 장관은 "경영권에 개입하지는 않을 것"이라고 선을 그었다. 그럼에도 불구하고 이러한 조치는 전례가 없는 것이며, "이는 대기업에 대한 미국의 영향력 확대라는 새로운 시대를 열게 될 것"이란 진단이다.  로이터는 "마이크론은 인텔에 이어 반도체법 보조금을 가장 많이 받는 미국 기업이며, 삼성전자와 TSMC 역시 주요 수혜 대상"이라며 "이번 검토는 미국 정부가 반도체 산업에 대한 직접적 영향력을 확대하려는 움직임"이라고 분석했다. 올해 6월에도 비슷한 조치가 있었는데, 트럼프 정부는 일본제철의 U.S.스틸 인수 승인 조건으로 '황금주(golden share)'를 확보해 주요 경영 결정에 거부권을 행사할 수 있게 됐다. 삼성전자 미국 텍사스주 테일러 공장 건설 현장. [사진=삼성전자] wonjc6@newspim.com   2025-08-20 08:31
안다쇼핑
Top으로 이동