전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 생활경제

속보

더보기

[김정호의 4차혁명 오딧세이] 인공지능은 강아지와 고양이를 어떻게 구분할까?

기사입력 : 2019년01월14일 07:55

최종수정 : 2019년01월14일 08:04

알고보면 흥미로운 선형대수(linear algebra. 線型代數)

보통 고등학교 때 처음 수학 ‘행렬’을 배운다. 행렬은 다차원적인 숫자의 나열로 2차원인 경우 '(x,y)'로 표현된다. 대부분의 고등학교 수학처럼 왜 배워야 하는지, 어디 쓰는지 그때 알기 어렵다. 그런데 이 행렬 수학이 ‘인공지능 컴퓨터 계산’의 핵심 방법이다.

김정호 카이스트 교수

필자는 대학 2학년때 ‘선형 대수학’이라는 수학과목을 수강했다. 행렬의 수학적 의미와 원리를 배운다. 이 과목은 필자가 대학 때 공부한 과목 중에 가장 감동적이고 재미가 있었다. 수학 논리 전개의 아름다움을 깊이 느끼는 계기가 됐기 때문이다. 전기공학이나, 전자 공학, 전산 과목 또는 물리학 과목이 아니라 ‘수학과목’이었던 기억이 흥미롭고 그 중에서도 선형대수학이라는 과목이라는 점도 지금도 신기하다.

선형대수학에서는 벡터에서 출발해서 행렬의 정의하고 행렬의 기본이 되는 원리들을 순서대로 제시하고 증명한다. 행렬 속의 각 열 벡터가 서로 상호 의존적인가 독립적인가 논의한다. 서로 선형적이면 종속적이고 비선형적이면 독립적이다. 각 열 벡터가 독립적 벡터로 이루어진 행렬은 역행렬이 존재하고 구할 수 있다. 역행렬이 존재하는 행렬은 그 벡터들을 더하고 곱해서 변형하면 대각행렬(Diagonal Matrix, 대각선 부분 숫자만 있고 나머지는 모두 ‘0’인 행렬)가 될 수 있다.

선형대수 과목에서는 이러한 이론들을 처음부터 끝까지 200 여 페이지 책에서 순서대로 빈틈없이 증명한다. 처음부터 끝까지 한 개의 논리적 오점 없이 전체를 증명하고 전개해 간다. 이러한 논리의 완결성이 눈부시기까지 하다. 완벽하게 논리적이다.

행렬의 구성과 곱셈 공식. [출처: 정보통신 기술용어해설]
대각행렬의 구성과 조건. [출처: 정보통신 기술용어해설]

 

강아지와 고양이를 구분하게 해주는 'CNN 알고리즘'


요즈음 행렬 계산이 공학적으로 더욱 중요해 지고 있다. 모든 빅데이터가 디지털로 기록되기 때문이다.

그 중에서도 데이터의 깊이가 크고 정보량이 많은 데이터가 영상 이미지이다. 카메라에서 얻은 이미지는 카메라 센서가 2차원 평면 배열로 되어 있다. 이 배열 자체가 (x,y) 2차원이다. 여기에 색깔 정보, 밝기 정보, 빛의 세기 정보가 더해지면 N 차원 정보가 되고 이를 수학적으로 표시하면 N 차원 행렬이 된다. 그래서 유튜브의 사용이 더욱 확대되면 행렬 계산양도 늘어난다.

인공지능 딥러닝 알고리즘 중에서 영상 이미지 판독에 가장 유효하게 쓰이는 방법이 CNN(Convolution Neural Network) 이라는 알고리즘이다. CNN 에는 여러 개의 신경망 층으로 이루어져 있다. 쉽게 이야기해서 CNN 입력으로 사진이 들어가면 CNN이 강아지인지, 고양이 인지, 곰인지, 사슴인지 찾아 낸다.

그런데 이 CNN 에서 여러 개의 신경망 층(Layer)을 지나면서 각 층의 출력이 단순화되고 추상화 되어 나간다. 이러한 과정을 거치면서 입력이 수천 다차원 행렬이라 하더라도 최종 출력은 ‘동물의 이름’이 되기 때문이다. 이렇게 크기가 큰 행렬을 줄여나가는 과정을 수학적으로 함수 합성곱(Convolution) 이라고 한다. 이 과정은 수식적으로 볼 때 크기가 큰 행렬에 작은 크기의 행렬을 계속 곱해서 얻는다.

이 곱하는 작은 행렬을 필터 행렬이라고 한다. 이렇게 되면 각 신경망 층이 추상화(Abstraction) 과정을 하게 된다. 첫 층의 입력이 사진이라면 2층은 윤곽을 표현하고, 3층은 코, 입, 귀를 판단하고, 뒷 부분 층은 남녀 인종 등을 파악하고 최종적으로 누구인지 파악하는 과정을 거친다. 이처럼 CNN 에서도 학습과정에서 계속해서 행렬 연산이 이루어져 있다.

사진과 영상 분석에 유용한 인공지능 알고리즘인 CNN의 구성도. [출처: Intel]

행렬과 텐서

그러니 인공지능을 위한 프로그램을 만들기 위해 소프트웨어 코딩을 한다는 것은 수많은 행렬연산을 계획된 순서대로 짜는 것과 같다. 특히 인공지능의 학습과정과 ‘판단(Decision)’ 혹은 ‘추론(Inference)’을 내릴 때 수 많은 행렬 연산을 한다. 그래서 인공지능을 연구하고 개발한다는 의미는 행렬 연산에 묻혀 사는 것과 같다.

이처럼 다차원 행렬을 수학에서 텐서(Tensor)라고 부른다. 그러므로 스칼라(Scalar)는 ‘0 텐서’, 벡터(Vector)는 ‘1 텐서’, 행렬은 ‘2 텐서’라고 부르기도 한다. 구글에서 제공하는 인공지능 계산 플랫폼을 텐서 플로우(Tensor Flow) 라고 부르는 것이 이런 배경이 된다. 인공지능에서 다 차원 행렬인 텐서 계산이 딥러닝 층을 지나가면서 쭉 흘러간다. 이 수학적인 과정이 학습과 판단 과정이다.

재미있는 드라마에는 ‘암시’를 주고 되살아나는 과정이 있으며, 이 과정이 드라마의 재미를 더해 준다. 암시는 장면, 만남, 표정, 대사에서 다양하게 나타난다. 특히 드라마 초반에 나타나 미래 전개 과정을 암시한다. 필자가 대학 2학년 때 선형대수 과목에 푹 빠졌던 것은 40년 후 다가올 4차 산업혁명 시대와 인공지능 시대를 암시했는지도 모른다.

구글의 오픈소스 인공지능 플랫폼 텐서 플로우, [출처: Data Flair]

 

 

joungho@kaist.ac.kr


[김정호 카이스트 전기 및 전자공학과 교수]

[뉴스핌 베스트 기사]

사진
당정, 내년 의대정원 '증원 전' 3058명 수용 가닥 [서울=뉴스핌] 이석훈 기자 = 정부가 내년도 의대 모집인원을 증원 이전인 3058명으로 되돌리는 방향을 검토 중인 것으로 알려졌다. 6일 국민의힘은 내년도 의과대학 모집 인원을 증원 이전인 3058명으로 되돌리는 방안이 타당하다고 밝혔다. 정부는 당정 협의에 이어 관계 부처 회의를 잇달아 열고 의대 정원을 동결하자는 의견을 수용하기로 한 것으로 전해졌다. [서울=뉴스핌] 최지환 기자 = 의사와 정부간 갈등이 심화되는 25일 오후 서울의 한 대학병원에서 의료진이 이동하고 있다. 전국의과대학교수협의회는 이날 의대 교수의 사직과 주 52시간 근무, 외래진료 축소를 예정대로 시행할 것이라고 밝혔다. 2024.03.25 choipix16@newspim.com 권성동 국민의힘 원내대표는 당정 협의 후 가진 국회 브리핑에서 "국민의힘은 의대 교육 정상화가 시급하다고 보고, 의과대학학장협의회의 건의 내용이 현실적으로 타당하다고 판단한다"고 밝혔다. 앞서 의대 학장 협의체인 한국의과대학·의학전문대학원협회(KAMC)는 지난달 내년 의대 정원을 3058명으로 동결하자고 제안한 바 있다. 의대가 있는 전국 40개 대학 총장 모임인 '의과대학 선진화를 위한 총장협의회'(의총협)도 동결안에 합의했다. 의대교육 공백을 방치할 수 없다는 위기감이 고조되면서 정부도 내년 동결안으로 잠정 가닥을 잡은 것으로 보인다. 이미 24학번과 25학번 신입생을 합하면 최대 7500명에 이르는 상황에서, 올해도 의대교육이 파행될 경우 내년엔 1학년만 1만명을 훌쩍 넘길 것으로 보인다. 만약 이렇게 되면 의대교육이 사실상 불가능해진다. 정부는 7일로 예고한 '의대 복학 및 의대교육 정상화' 관련 브리핑에서 내년 정원에 대해 발표할 것으로 보인다. 다만 3058명 수용안은 의대생이 3월 말까지 복귀한다는 전제로 한다. 휴학생이 이달 내 돌아온다면 모집인원을 수정하는 행정절차에 돌입한다는 계획이다. stpoemseok@newspim.com 2025-03-06 22:14
사진
상암경기장, 하이브리드 잔디로 교체 [서울=뉴스핌] 이경화 기자 = 서울시와 서울시설공단은 한파 장기화와 평년보다 2주 정도 앞당겨진 K리그 개막에 따라 서울월드컵경기장 잔디에 대한 긴급 복구 작업을 진행한다고 7일 밝혔다. 오는 29일 열리는 FC서울 홈경기 전까지 잔디 상태를 정상화하겠다는 계획이다. 이를 위해 잔디 일부를 하이브리드 잔디로 교체하고 밀도를 높이기 위한 배토·파종작업을 긴급하게 진행한다. 올해 서울시는 지난해보다 3배 증가한 33억원의 예산을 투입해 잔디 교체 물량 확보와 잔디 생육을 위한 선진 기계 도입 등으로 최상의 잔디 상태를 유지하겠다는 방침이다.  시는 올해 K리그가 지난해보다 16일 앞당겨져 2월 22일 개막됨에 따라 사전 준비가 어려웠다고 전했다. 한파가 3월 초까지 이어지면서 잔디 뿌리내림과 생육 상태의 불량으로 잔디가 들뜸 현상을 보였다고 덧붙였다. 공단은 조기 개막에 따른 문제를 프로축구연맹에 지속적으로 전달하며 일정 조율을 요구했으나 받아들여지지 않았다고 밝혔다. 서울 마포구 서울월드컵경기장 [뉴스핌DB] 이에 따라 우선 서울월드컵경기장 내 2500㎡ 이상 잔디를 하이브리드 잔디로 교체하고, 잔디 밀도를 높이기 위해서는 5900㎡ 면적에 대해 배토와 파종작업이 진행된다. 이 외에도 잔디 생육을 위한 통기·병충해 예방 시약, 비료 성분 공급을 위한 시비 작업과 그라운드 다짐, 관수작업도 실시한다.  긴급 보수 외에도 시는 지난해 수립한 잔디 집중 개선 계획을 토대로 연중 잔디 상태 개선·관리를 체계적으로 추진하기로 했다. 교체가 가능한 잔디를 작년(4200㎡)과 비교해 3배 많은 1만2500㎡를 확보하고, 잔디 상태가 좋지 않을 경우 즉시 교체할 예정이다. 또 해외 유명 경기장에서 사용되는 선진 장비를 도입해 잔디 생육에 필요한 채광과 통풍을 확보하고 그라운드 품질을 철저히 관리한다. 이를 위해 여름철 잔디 생육에 필요한 쿨링팬을 추가하고, 인공 채광기와 배수 불량 개선을 위한 에어레이터 등을 새로 갖출 계획이다. 서울월드컵경기장과 관계기관으로 구성된 거버넌스 가칭 '전국 축구경기장협의회'도 4월부터 운영한다. 협의회에서는 그라운드 관리와 복구 대책, 인프라 개선 등을 논의해 서울은 물론 전국 축구장 잔디 관리의 해결 방안 마련에 나선다. 경기장 대관 방식도 개선한다. 대규모 경기장 부족을 고려해 콘서트 등 문화 행사 대관은 지속하되 잔디 보호를 위해 그라운드석 제외 대관 지침을 유지할 예정이다. 마지막으로 시는 한지형 잔디 특성을 고려해 동절기와 하절기 구장 사용 일정에 대해 한국프로축구연맹 등 관계기관과 협의한다.  중장기적으로는 서울의 고온다습한 날씨에 맞는 잔디종 도입을 위해 관계기관과 전문가 등의 의견을 청취하고, 추가로 잔디를 재배할 공간도 발굴할 계획이다. 구종원 서울시 관광체육국장은 "리그 일정이 앞당겨져 겨울철 잔디 관리에 어려움이 있음을 유감스럽게 생각한다"며 "향후 잔디 교체 물량 확대와 선진 장비 투입, 리그 일정 조율 등을 통해 선수들이 최상의 환경에서 경기를 치를 수 있도록 조치하겠다"고 말했다. kh99@newspim.com 2025-03-07 10:33
안다쇼핑
Top으로 이동