전체기사 최신뉴스 GAM
KYD 라이브
KYD 디데이
산업

속보

더보기

[인간 vs 인공지능]알파고 데이비드 박사 "인간의 모방 아닌, 이기는 것이 우리 목표"

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

구글 알파고의 학습 비법은 '심층 신경망'과 '트리 탐색'

[뉴스핌=이수경 기자] "알파고(AlphaGo)가 흥분을 가져다주는 이유는 기계가 더 높은 수준으로 지식을 쌓아갈 수 있다는 기대에 부응하기 때문이다. 인간이 입력한 정보만 수행하는 것에 그치는 것이 아니라, 기계가 스스로 학습해서 인간과 같은 사고(思考)를 하게 만드는 것이 알파고의 최종 목표다." - 데이비드 실버 구글 딥마인드 리서치 사이언티스트 

미래창조과학부가 주최하고 소프트웨어정책연구소가 주관하는 '성큼 다가온 인공지능' 컨퍼런스가 8일 경기창조혁신센터에서 개최됐다. 

이날 데이비드 실버 구글 딥마인드 리서치 사이언티스트가 '심층 신경망과 트리 탐색을 이용한 바둑 게임 마스터하기'라는 주제로 발표에 나섰다. 

알파고는 지난 2014년 구글이 인수한 인공지능 기업 딥마인드에서 개발한 인공지능 컴퓨터로, 실버 박사는 알파고 프로젝트 팀 리더를 맡고 있다. 

구글 알파고 프로젝트 팀 리더를 맡은 데이비드 실버 박사가 8일 경기창조경제혁신센터에서 열린 '성큼 다가온 인공지능' 컨퍼런스에 참석했다. <사진=이수경 기자>

알파고의 학습 원리에 대해 실버 박사는 "무작위 대입을 통해 모든 경우의 수를 계산하는 '딥블루'와는 달리 알파고는 자가학습을 통해 지식체계를 구축해나간다"며 "남은 경기 내용을 미리 여러 번 진행해 미래를 예측하며, 선별적인 시뮬레이션을 통해 가장 성공적인 수를 찾는 것이 알파고의 특징"이라고 말했다. 

데이비드 실버 박사는 "알파고는 탐색의 최적화를 위해 정책망과 가치망이라는 2종류의 신경망을 구축했다"고 설명했다. 

'정책망'은 이길 가능성이 큰 후보군 위주로 탐색 너비를 줄여준다. 승률이 가장 높은 전략만 추려주는 것. '가치망'은 승자를 예측하며 탐색의 깊이를 줄여준다. 가상으로 게임을 플레이하지 않고도 승자를 예측할 수 있게 해주는 셈이다. 

이 신경망을 구축하기 위해 알파고는 3000만개의 바둑 기보를 '지도학습'했다. 5단 이상의 프로 전문기사가 바둑을 두는 방식을 교본삼아 4주 동안 스스로 학습한 것이다. 이후 자가대국(강화학습)을 통해 신경망을 정교하게 구축했다. 그 결과 인간이 두는 바둑의 수를 예측하는 정확도가 43%에서 57%로 높아졌다.  

실버 박사는 "지도학습을 통해 알파고가 기보를 스스로 학습할 수 있도록 하고 강화학습으로 스스로 학습을 통해 시행착오를 거쳐 승률을 높일 수 있도록 했다"며 "낮은 수준의 기보를 학습했다고 해서 알파고 학습 수준이 낮아지는 것은 아니고 최적의 탐색 알고리즘을 탐색하는 방향으로 학습 수준을 높이는 데 주력했다"고 말했다. 

특정 바둑 기사의 기보 스타일이 기계학습에 영향을 미치느냐는 질문에 실버 박사는 "아니다"라고 선을 그었다. 그는 "알파고가 바둑을 학습하기 위해서는 최소 수십만 개의 기보가 필요하다"며 "특정 기사의 기보를 소량 학습한다고 해서 알파고의 학습 결과에 큰 영향을 미치지는 않는다고 생각한다"고 설명했다. 

실버 박사는 "인간이 당면한 다양한 과제들을 하는 데 밑거름이 되도록 하는 데 알파고가 이바지하고자 한다"며 "구글 딥마인드에서 향후 고려하고 있는 것은 개개인의 의료 데이터를 학습해서 최적화된 치료법을 제공하는 맞춤형 의료 서비스 등이 있다"고 말했다. 

마지막으로 실버 박사는 "우리의 목표는 인간의 행동을 모방하는 것이 아니라 인간을 이기는 것"이며 "다양한 변수가 있어서 누가 이길지는 알 수 없지만, 개인적으로는 알파고가 이기길 기대하고 있다"고 밝혔다. 

 

[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)

[뉴스핌 베스트 기사]

사진
안세영 11승, 배드민턴 새 역사 [서울=뉴스핌] 박상욱 기자 = 안세영이 배드민턴 새 역사를 쓰면서 2025년을 마무리했다. 여자 단식 세계 랭킹 1위 안세영(23·삼성생명)은 21일 중국 항저우 올림픽스포츠센터에서 열린 세계배드민턴연맹(BWF) 월드투어 파이널 여자 단식 결승에서 왕즈이(중국·2위)를 2-1(21-13 18-21 21-10)로 꺾고 정상에 올랐다. 월드투어 파이널은 한 해 동안 가장 뛰어난 성적을 거둔 선수 8명만 출전하는 '왕중왕전'이다. 안세영은 2021년에 이어 두 번째로 이 대회 정상에 섰다. 안세영. [사진=BWF] 1게임은 안세영이 주도했다. 8-8 이후 랠리 싸움에서 우위를 잡았고, 왕즈이의 범실이 겹치며 21-13으로 먼저 가져갔다. 2게임에서는 흐름이 바뀌었다. 왕즈이가 공격 정확도를 끌어올리며 리드를 지켰고, 안세영은 추격했지만 18-21로 내줬다. 3게임은 체력전 양상 속에서 왕즈이의 움직임이 눈에 띄게 둔해졌다. 안세영은 수비 범위를 유지하며 점수 차를 벌렸다. 15-6까지 달아난 뒤 흐름을 놓치지 않았다. 챔피언십 포인트를 한 점 남겨둔 20-10에서 왼다리 통증을 호소하며 절뚝거렸다. 주심은 메디컬 타임을 주었지만 안세영이 원했던 스프레이는 뿌리지 못한 채 경기에 다시 돌입했다. 안세영은 얼굴을 찡그리며 고통을 참고 뛰었다. 대각선 하프 스매시로 셔틀콕을 상대 코트에 떨어뜨려 '96분의 대혈투'에 마침표를 찍었다. 안세영. [사진=BWF] 승리가 확정되자 안세영은 관중을 향해 양손 손가락 한 개씩을 펴 보이며 '11승 세리머니'를 했다. "짜요"를 외치며 열띤 응원을 펼치던 중국 홈관중을 침묵시켰다.  이번 우승으로 안세영은 왕즈이와의 상대 전적에서 16승 4패의 절대 우위를 점했다. 특히 올해 펼쳐진 여덟 차례의 맞대결에서는 단 한 번의 패배 없이 전승을 거두며 압도적인 기량 차를 입증했다. 안세영의 시즌 11승은 2019년 모모타 겐토가 세운 단일 시즌 최다 우승 기록과 타이다. 시즌 성적은 73승 4패로 승률 94.8%다. 남녀 단식을 통틀어 한 시즌 60경기 이상 소화한 선수 가운데 최고 승률이다. 안세영. [사진=BWF] 상금 기록도 새로 썼다. 파이널 우승 상금 24만 달러를 더해 시즌 상금 100만3175달러를 기록했다. 배드민턴 역사상 단일 시즌 상금 100만 달러를 넘긴 최초의 선수다. 커리어 누적 상금도 257만 달러로 역대 최고다. 안세영의 2025년은 11승, 최고 승률, 최고 상금. 결과와 내용 모두에서 한 시즌의 기준을 다시 세웠다. 세계배드민턴연맹은 안세영이 파이널스 챔피언에 오르자 SNS에 시즌 11승, 최고 승률, 최고 상금을 거둔 한국의 안세영 사진을 게재하면서 'GOAT'라는 단어를 새겨넣어 그녀가 이미 리빙 레전드임을 인정했다.   psoq1337@newspim.com 2025-12-21 19:45
사진
군 마트 매출 상위 4개 모두 '술' [서울=뉴스핌] 오동룡 군사방산전문기자 = 올해 1∼11월 군 마트 판매량 상위 4개 품목이 모두 주류로 집계됐다. 국군복지단 소속 PX(군 마트)가 병영 내 '생활복지 시설'로 운영되고 있음에도, 판매 구조는 사실상 '주류 중심'으로 재편된 셈이다. 논산 육군훈련소 본점 군 마트 전경. [사진=국방부 제공] 2025.12.21 gomsi@newspim.com 국회 국방위원회 소속 유용원 국민의힘 의원이 21일 국방부로부터 제출받은 자료에 따르면, 기간 내 판매량 1위는 A 캔맥주(2398만개)였으며, 이어 B 캔맥주(2171만개), D 캔맥주(1400만개), C 소주(256만개) 순으로 나타났다. 네 품목 판매량을 합치면 총 8025만개, 매출액은 918억6948만원에 달한다. 군 마트 내 A 캔맥주 가격은 1000원으로, 편의점 평균가(2250원)의 절반 이하다. C 소주 역시 1060원으로, 시중가(1800원)보다 약 40% 낮은 수준이다. 복지단이 대량 구매 및 유통 수수료 절감으로 단가를 낮춘 영향으로 풀이된다. 매출액 기준으로는 E 화장품 세트가 전체 1위(323억6621만원)를 차지했다. 판매량은 83만개로, 군 마트 판매가(3만8930원)는 온라인 최저가(29만원)의 약 7분의 1 수준이다. 유용원 의원은 "군 마트는 장병들의 기본적인 생활을 지원하기 위한 공간임에도, 실제 판매 비중을 보면 주류와 화장품이 매출을 주도하고 있다"며 "복지 취지에 맞게 품목 구성과 가격 체계를 다시 점검할 필요가 있다"고 지적했다. gomsi@newspim.com 2025-12-21 15:12
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동