[편집자] 4차 산업혁명은 모든 사물과 인간을 연결하여 빅데이터를 모으고, 이를 이용하여 인공지능으로 학습하여, 결국 인공지능이 인간을 대체하는 시대를 말한다. 이러한 4차 산업혁명의 물결이 산업뿐만 아니라 경제, 사회, 정치 등 전 분야에 걸쳐서 막대한 변화를 일으키고 있다.
글로벌뉴스통신사 뉴스핌은 '김정호의 4차혁명 오딧세이' 칼럼을 매주 연재하여 4차 산업혁명의 본질과 영향, 그리고 전망을 독자들에게 쉽게 소개하고자 한다. 4차 산업혁명의 핵심은 바로 인공지능, 빅데이터, 클라우드 컴퓨팅으로 표현할 수 있으며 그 핵심 부품이 반도체이다. 이들 핵심 기술의 개념과 원리, 응용을 설명하여 일반 독자들이 4차 산업혁명에 대해서 공감하고 이해하며 더 나아가 개인과 기업, 국가의 미래를 계획하는 것을 돕고자 한다.
김정호 카이스트(KAIST) 전기 및 전자공학과 교수는 서울대 전기공학과를 졸업하고 미국 미시건대에서 박사 학위를 받았다. AI대학원 겸임교수, IEEE펠로우, 카이스트 ICT석좌교수, 한화 국방 인공지능 융합연구 센터장, 삼성전자 산학협력 센터장 등을 겸하고 있다.
인공지능 개발의 시작 조건
심층기계학습(Deep Machine Learning)으로 불리는 인공지능이 가까운 미래에 인간의 역할을 대부분 대체할 전망이다. 특히 단순 사무직, 자료 조사, 문서 작성, 상담, 심사, 면접 등은 인공지능이 쉽게 잘 할 수 있다.
김정호 교수 |
은행 창구 지원, 전화 상담원 등이 사라질 대표적인 직업이라 생각한다. 더 나아가 교육자, 의사, 변호사, 법관 등도 그 역할의 상당 부분이 인공지능으로 바뀐다. 인공지능은 빠르고 정확하면서 쉬지도 않는다. 노동조합도 없다.
그 결과, 인간이 '일'과 '노동'에서 소외될 가능성이 크다. 일하고 싶어도 일할 기회가 없어진다는 뜻이다. 앞으로 자라나는 청년들의 취업이 더욱 어려워질 전망이다. 이상적인 상황은 인공지능이 인간의 '일'을 대신해 주고, 대신 인간은 여가 생활, 취미생활, 여행, 독서 등 여가 활동이나 창작 활동을 할 수 있다. 또는 봉사 활동들을 통해서 삶의 의미를 높일 수 있겠다.
인공지능이 인간을 위해서 일을 하도록 하기 위해서는 인공지능을 그러한 목적에 맞게 경제적으로 설계를 해야 한다. 경제적이라는 것은 비용, 시간을 최소화해야 한다는 뜻이다. 그러려면 먼저, 설계하는 인공지능의 목적이 명확할 필요가 있겠다. 일을 대신 할지, 새로운 서비스를 창조할지 등이다.
그리고 그것을 통해서 얻고자 하는 바를 설계에 잘 설정해야 한다. 인간에게 도움을 줄지, 이윤을 얻을지, 효율을 높일지, 에너지나 자원을 절약할지 등이다. 목적하는 바가 인간을 이롭게 해야 한다. 인간을 공격하거나, 인간을 괴롭히지는 말아야 한다.
어찌하거나 인공지능을 설계하려면 목적이 친 인간적이어야 한다. 그리고 개발에 필요한 투자와 거기서부터 얻는 이득 또는 효과가 균형이 맞아야 한다.
인공지능 설계 순서
인공지능의 목적이 명확해지면 설계에 들어간다. 이때 먼저 지도학습 방법을 사용할 것인가, 비지도 학습 방법을 채택할 것인가 정해야 한다.
지도학습에서 대표적인 인공지능 구조가 CNN(Convolution Neural Network), RNN(Recurrent Neural Network), LSTM(Long-term Short-term Memory) 등이 있다.
비지도 학습의 대표적인 구조로 강화 학습이 있다. 판별, 판단(Classification), 인식, 이해, 번역, 인식 등에는 지도학습이 유리하고 게임, 투자, 설계, 최적화 등에는 강화학습이 유용하다.
인공지능 강화학습에 사용되는 동적 프로그래밍(Dynamic Programming)의 예. [출처=KAIST] |
다음 단계로, 개발하려는 인공지능의 입력과 출력이 정해진다. 입력은 이미지, 영상, 문장, 책, 소리 등 다양한 디지털 데이터가 된다. 원하는 인공지능 학습과 판단에 필요한 입력 데이터를 설정하고, 충분한 학습과 테스트에 필요한 데이터를 확보해야 한다.
다음으로는 출력을 정해야 한다. 제목이 될 수도 있고, 캡션(caption)이 될 수도 있고, 판단 문장이 될 수도 있고, 그림이 될 수도 있다. 더 나아가 언어가 될 수도 있고, 문장이 될 수도 있고, 목소리가 될 수도 있다.
이때, 지도 학습을 한다고 하면 학습에 쓰일 데이터를 정해야 한다. 그리고 데이터에 설명(Labeling)해야 한다. 어찌 보면 학습용 데이터를 확보하는 것이 가장 난도가 높고 시간과 비용이 많이 들어간다고 볼 수 있다.
데이터를 사업장에서 구할 수도 있다. 구글, 아마존은 자체 플랫폼을 이용해서 데이터를 모은다. 또는 인터넷에서 구할 수도 있다. 이 모든 작업에는 개인의 프라이버시를 침해하지 말아야 하는 어려운 점이 있다. 그래서 플랫폼 확보가 경쟁력이기도 하다.
이렇게도 구하기 어려운 경우, 컴퓨터 시뮬레이션으로 데이터를 만들어 학습하기도 한다. 미래에는 학습용 데이터 자체를 컴퓨터 인공지능으로 만들 수도 있다. 그러면 점점 인공지능은 인간의 손을 떠나게 된다.
이제 인공지능망의 구조(Architecture)를 정해야 한다. CNN, RNN, LSTM을 바로 쓰거나 변형할 수 있다. 대부분 기본 구조를 따르면서 변형하게 된다.
또는 복합적으로 합쳐서 사용하기도 한다. 이때, 데이터 자체도 문장, 그림, 목소리 등 융합적으로 사용하기도 한다. 이런 구조를 멀티모달(Multi-modal) 구조라고 하기도 한다. 앞으로 인공지능 목적에 맞게 새로운 인공지능망 구조도 나오고, 융합할 것으로 예상한다. 이 부분이 창의성이 요구되는 설계 부분이다.
이제 구조가 정해지면 수학적 함수들을 정해야 한다. 활성화 함수(Activation Function)와 비용함수(Cost Function) 등이 구해진다. 이들 함수를 이용해서 역전파 방정식(Back Propagation Chain Relation)을 구한다.
인공지능 설계 순서도. [출처=KAIST] |
이 함수들은 판별과 전파, 학습과정에서 핵심 역할을 하는 수학 함수다. 수학 실력이 가장 필요한 부분이다. 그리고 설계 변수(Hyper-parameter)들을 정하고 출력 함수, 신경망 층수, 노드 개수 등을 정한다. 최적화 방법, 초기화 방법도 정한다. 여기에는 개발 경험이 많이 필요하다.
이제 구상된 인공지능을 소프트웨어로 구현한다. 여러 가지의 공개된 프레임워크(Framework)를 사용할 수 있다. 보통 구글에서 개발하고 공개한 '텐서 플로우(Tensor Flow)'를 많이 사용하며, 그 상위 언어로 파이선(Python)을 사용한다. 이때 코딩 능력이 필요하다.
다음 단계에서는 개발한 인공지능을 데이터로 학습하며, 테스트를 거친다. 그리고 일정 부분 오차율 미만이 될 때까지 변수와 구조를 최적화해 간다. 이 부분 또한 시간이 오래 걸린다. 목표한 성능이 나올 때까지 반복적인 작업이 계속된다. 인력과 시간이 소모된다.
마지막으로 목표한 사업 또는 미션에 부합하는지 점검하게 된다. 최종 점검 단계에서 목표한 성능이 나오지 않으면, 구조를 바꿔 다시 설계 작업을 해야 한다. 이처럼 반복 작업이 많다. 반복 작업 줄이려면 경험과 수학, 코딩 실력이 필요하다. 이러한 작업은 작게는 수개월에서 수년의 시간이 걸린다.
인공지능 개발 최종 평가
개발한 인공지능의 평가는 결국 시장에서 받게 된다. 사용자가 많이 생기고 수익이 많으면 성공적이라고 볼 수 있다. 즉, 투자 대비 수익이 높아야 한다. 여기서 수익은 현금, 이익, 수수료 또는 노동, 에너지, 시간 절약 등으로 볼 수 있다. 또는 주관적인 행복, 평화, 사랑 등이 지표가 될 수도 있다.
결국 성능이 좋은 인공지능의 향방은 인공지능 구조의 우수성과 데이터 확보의 용이성, 투자 대비 효과 등이 좌우할 전망이다. 여기에 더해 관리비용, 하드웨어 투자비용, 유지비용도 포함된다. 한발 더 나아가, 개발할 인공지능이 가지는 사회적 가치와 윤리 준수도 중요한 평가 항목이 되어야 한다.
김정호 카이스트 전기 및 전자공학과 교수 joungho@kaist.ac.kr