전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

[세돌-한돌/구글-NHN] 한돌 실력은? 알파고 근접했지만

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

알파고 성장 경로 답습...'알파제로' 수준까지 접근
데이터 양과 질에서 구글과 차이 뚜렷

[편집자] '바둑판의 풍운아' 이세돌 9단이 현역에서 물러납니다.  상대의 의표를 찔러 난전을 즐겼던 승부사. 평범을 거부했기에 인공지능(AI)을 극복한 세계 유일의 기사. 은퇴 이벤트도 이목을 집중시킵니다. AI와 의 재대결. 구글 '알파고'와 대결후 3년9개월만입니다. 국내 기술진이 만든 '한돌'과 세 판을 둡니다. 종합뉴스통신 뉴스핌이 '세돌과 한돌의 대결'을 두 가지 측면에서 조명합니다. 인간과 AI의 두뇌싸움이란 측면과 알파고(구글)와 한돌(NHN)의 AI기술 대결입니다.  

[서울=뉴스핌] 김지완 기자 = 이세돌 9단 은퇴대국 상대 인공지능(AI) '한돌' 실력은 알파고 최종버전 '알파제로'에 근접한 것으로 나타났다. 다만 구글 알파고와 NHN 한돌 사이를 구분짓는 확실한 '격차'가 존재한다는 게 전문가들의 평가다.

한돌은 10개월간의 개발 기간을 거쳐 지난 2017년 12월 '한돌' 버전 1.0을 출시했다. 이후 두 번의 판올림을 거치며 3.0버전까지 출시됐다.

출시 1주년을 맞은 지난해 12월 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단과 국내 바둑 랭킹 1위 신진서 9단과의 대국에서 연이어 승리를 거뒀다. 올해 8월 중국 산둥성에서 열린 '2019 중신증권배 세계 인공지능(AI) 바둑대회'에선 3위를 달성했다.

<사진=이형석 사진기자>

◆ 한돌, 알파고 성장 경로 그대로 답습...'알파제로' 수준 근접

한돌은 알파고 성장 경로를 그대로 따랐다. 이창율 NHN 게임AI팀장은 "한돌 1.0은 인간 기보를 사용해서 기력을 끌어올렸고, 2.0부턴 사람 기보 없이 자가 대국만으로 기력을 향상시켰다"며 "3.0에선 자가 대국 속도를 좀 더 빠르게 할 수 있도록 평가 과정을 없앴다"고 밝혔다.

그는 "그 결과 한돌 1.0은 프로기사를 상대로 60%의 승률을 보였다"며 "한돌 2.0은 1.0에 비해 90%의 승률로 개선됐다. 버전 3.0은 2.0에 대해 80~90% 승률을 기록했다"고 설명했다.

알파고 제로(Zero) 역시 인간의 기보에 의존하는 지도학습 없이, 바둑 규칙만으로 스스로 학습하며 기력을 끌어올렸다. 학습 36시간 만에 알파고 리(Lee)의 수준을 능가했다. 72시간 만에 알파고 리와 대국에서 100승에 이를 때까지 패배가 없었다. 40일 후 알파고 마스터와 대국에선 100전 89승 11패를 기록했다.

이에 한돌이 알파고 최종버전 '알파제로(Alpha Zero)' 수준에 근접했다는 분석이다. 

알파제로는 점점 강해지는 자신과의 게임을 반복하면서 스스로 빅데이터를 구축하는 단계에 올라섰다. 알파고는 '판(Fan)' → '리(Lee)' → '마스터(Master)' → '제로(Zero)' → '알파제로(Alpha Zero)' 순으로 발전했다. 이세돌 9단과 승부를 겨뤘던 버전은 '알파고 리'.

이스트소프트 AI연구소의 수석연구원은 "알파고 각 버전의 기술이 공개되고, 이를 바탕으로 개발된 여러 바둑 인공지능들의 경쟁을 통해 기술이 발전하고 있다"며 "한돌은 최강으로 알려진 알파고 제로와 알파 제로에서 사용한 머신러닝 기술을 적용했다. 우리 인공지능 수준은 미국과 중국에는 다소 뒤지지만 사용하는 기술은 격차가 크지 않다"고 진단했다.

NHN 측은 딥러닝의 보편적 방식인 '하이퍼파라미터(Hyperparameter, 직접 세팅하는 값)'를 사용해 동시 학습을 진행했다고 전했다. 아울러 학습 속도를 높일 수 있는 최신 트렌드의 다양한 학습법을 많이 적용했다고 밝혔다.

이창율 NHN 게임AI팀장은 "알파고는 프로기사 9단하고만 대국을 했고, 은퇴를 해서 정확한 기력을 모른다"면서도 "하지만 논문을 기준으로 봤을 때, 한돌은 '알파고 리'는 넘어섰고, 알파고 제로나 알파제로 사이로 본다"고 평가했다. 

구글 알파고는 2017년 10월 네이처에 '인간 지식 없이 바둑을 마스터하기', 지난해 12월 사이언스에 '자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘'을 각각 게재했다.

◆ 몬테카를로 기술 적용에선 알파고만큼 성과 못내..."데이터 차이만큼 실력차이 날 것"

다만 구글과 NHN 사이에 넘볼 수 없는 차이, '격차'는 존재한다.

한돌에도 알파고에서 쓰였던 '몬테카를로 트리 탐색(Monte Carlo tree search, MCTS)' 기술이 그대로 적용됐지만, 성과에선 차이를 보였다. MCTS는 상대방과 한번씩 번갈아 가면서 두는 바둑에서 실시간으로 자신과 상대의 가장 좋은 수를 시뮬레이션하면서 최적의 수를 찾는 방법이다.

이창율 팀장은 "알파고는 MCTS에 자가대국으로 만든 기보를 더해 다음 수에 대한 예측과 승리 확률을 높였다"면서 "우리도 MCTS를 놓고, 딥러닝/UCB(Upper Confidence Bound, AI 강화학습 방법 중 하나) 등의 알고리즘들을 실험 해봤지만, 성능이 그렇게 좋아지진 않았다"고 말했다.

그는 "다만 한돌엔 여러 사람이 의논해 좋은 수를 내는 것과 비슷한 '앙상블 추론(Ensemble Inference)'과 통계를 이용한 시뮬레이션으론 어느 정도 성능 개선이 나타났다"고 설명했다.

인공지능 성능을 판가름 짓는 데이터 양과 질에서도 구글에 비해 NHN은 한 수 아래란 평가다. 

소프트웨어업체 인공지능을 담당중인 한 개발자는 "인공지능은 학습에 필요한 데이터와 장비의 규모가 성능을 좌우한다"면서 "한돌이 규모의 경제가 있는 미국·중국만큼 성능을 끌어올리는데 어려움이 있었을 것"이라고 분석했다.

또 다른 인공지능 개발자는 "알파고 알파제로 수준의 데이터를 한돌은 확보하지 못했다"며 "데이터 질적 수준과 양에서 구글과 NHN 차이는 뚜렷하다. 그 차이만큼 알파고와 한돌의 실력 차이가 존재할 것"이라고 평가했다.

 

swiss2pac@newspim.com

[뉴스핌 베스트 기사]

사진
로저스 쿠팡 대표 61억 주식 보상 [서울=뉴스핌] 김연순 기자 = 해롤드 로저스 쿠팡 한국 임시대표가 대규모 주식을 보상받았다. 약 66억 원 규모의 성과조건부 주식보상(PSU)을 받은 지 두 달 만이다. 쿠팡의 모회사인 쿠팡Inc는 3일(현지 시간) 한국 법인 임시대표를 맡고 있는 로저스 최고관리책임자(CAO)겸 법무총괄에게 클래스A 보통주 양도제한조건부주식(RSU) 21만3884주를 부여했다고 공시했다. 쿠팡의 전날 정규장 종가(18.95달러)로 계산하면 405만3012달러, 한화 61억원 상당에 달하는 주식이다. 이 주식은 오는 7월 1일부터 분기별로 4회에 걸쳐 분할 수령할 수 있으며, 주식을 받으려면 해당일까지 근속해야 하는 조건이다. 해롤드 로저스 쿠팡 임시대표. [사진=뉴스핌DB] 이 주식을 모두 수령하면 로저스 임시대표가 보유하게 되는 쿠팡 주식은 총 93만3041주로 늘어나게 된다. 그는 지난 2월에도 26만9588주의 주식을 받았다. 한편 쿠팡은 대규모 개인정보 유출 사태가 터진 직후인 지난해 12월, 쿠팡Inc 최고관리책임자(CAO) 겸 법무총괄인 해롤드 로저스를 한국법인 임시대표로 임명했다. 로저스 임시대표는 지난해 12월 30일 국회에서 열린 '쿠팡 사태 연석 청문회'에서 허위 증언을 한 혐의로 고발당한 상태다.   y2kid@newspim.com 2026-04-04 11:49
사진
이란, 미군 F-15·A-10 잇따라 격추 [서울=뉴스핌] 김연순 기자 = 이란전쟁에 투입된 미군 F-15 전투기와 A-10 공격기가 3일(현지시간) 이란군의 공격으로 각각 격추됐다고 CBS 뉴스 등 복수의 미국 매체가 미 정부 당국자를 인용해 보도했다. CBS 및 워싱턴포스트 등 미국 언론들은 3일 미군 전투기 F-15에 이어 A-10 공격기가 이란 남서부에서 이란의 공격을 받아 추락했다고 보도했다. 미국이 지난 2월28일 이란전쟁을 시작한 이후 미군 군용기가 이란군 공격으로 격추된 것은 이번이 처음이다. 추락된 전투기의 조종사 3명 중 2명은 구조됐고, 1명은 실종 상태다. 미군은 이란 남서부 후제스탄 주 일대에 수색·구조용 헬기 HH-60G와 연료 공급을 위한 C-130 급유기를 투입해 1명을 구조했다. 이 과정에서 헬기 2대도 이란군의 공격을 받아 일부 탑승자가 부상했지만 기지로 복귀한 것으로 파악됐다. 이란은 이날 F-15 전투기에 이어 미군의 A-10 선더볼트Ⅱ 워트호그 공격기도 호르무즈 해협 인근 게슘 섬 남단에서 격추해, 기체는 바다로 떨어졌다. 단독 탑승한 조종사 1명은 구조된 것으로 전해졌다. 도널드 트럼프 대통령은 NBC와 전화 인터뷰에서 미 군용기 격추가 이란과의 협상에 영향을 끼치느냐는 질문에 "전혀 아니다"라며 "이건 전쟁이고 우리는 전쟁 중"이라고 말했다. 격추된 군용기 2대의 임무는 확인되지 않았지만 격추 장소로 미뤄볼 때 각각 이란 내 인프라와 호르무즈 해협 주변을 타격하는 작전을 수행하고 있었을 것으로 추정된다. 현지시간 2026년 2월28일 이란 공습작전 (작전명 에픽 퓨리)에 투입된 미군 전투기 [사진=미 중부사령부] 트럼프 대통령은 지난 1일 대국민 연설에서 앞으로 2~3주 동안 이란을 강하게 타격해 '석기시대'로 되돌리겠다고 발표했다. 트럼프 대통령의 대국민 연설 이후 미군은 이란 수도 테헤란 인근 대형 교량을 공습으로 파괴한 데 이어 이란이 미국의 요구조건에 맞춰 전쟁 종식에 합의하지 않을 경우 이란 내 발전소도 타격하겠다고 예고했다. 이란 관영 파르스 통신은 미국이 지난 1일 우방국 중 한 곳을 통해 48시간 동안의 휴전을 제안했지만, 이란은 이를 거부했다고 보도했다. 트럼프가 유예했던 이란 내 발전소 등 에너지 인프라 공격 기간이 오는 6일 종료된다. 이번 사태는 전쟁의 중대 고비가 될 것이란 관측이 나온다. 한편 중부사령부에 따르면 현재까지 미군 사망자는 13명, 부상자는 300명 이상으로 집계된다. 로이터·입소스 등의 여론조사에 따르면 미국 국민의 27%만 이란 전쟁을 지지하고, 60%가 조속한 개입 종료를 원하고 있는 것으로 나타났다.   y2kid@newspim.com 2026-04-04 11:17
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동