[서울=뉴스핌] 최원진 기자= 중국 최대 포털사이트 바이두(百度)가 오는 16일 '챗GPT'와 유사한 자체 인공지능(AI) 챗봇 '어니봇'(Ernie Bot)을 출시하기까지 이제 일주일 밖에 남지 않은 상황이지만 반도체칩 부족과 더딘 AI 모델 훈련에 '비상'이라고 월스트리트저널(WSJ)이 복수의 소식통을 인용해 10일 보도했다.
보도에 따르면 바이두는 오는 16일 제한된 이용자를 대상으로 어니봇 서비스를 출시한다. 당초 바이두는 3월 중으로 어니봇을 포털 검색창에 통합시켜 전면 서비스화 하겠다고 공언했지만 어니봇을 전면 공개하기에는 시기상조로 판단했을 것으로 보인다.
[베이징 로이터=뉴스핌] 최원진 기자= 중국 포털 바이두의 베이징 본사에 있는 인공지능(AI) 로봇과 회사 로고. 2021.04.23 wonjc6@newspim.com |
소식통들은 챗봇의 근간이 되는 AI 언어모델은 "아직도 데이터로 훈련받고 있는 상황"이라고 알렸다. 서비스 공개 막바지 시점인데 아직 AI모델조차 완성하지 못한 것이다. 일부 개발팀 직원들은 "잘 작동하는 챗봇을 개발하기에는 턱없이 부족한 시간이었다"고 한탄했다.
바이두의 어니봇 개발팀 직원들은 지난 1월 초부터 중국의 음력설인 춘제(春節) 연휴도 반납해가며 24시간 불철주야 근무하고 있다. 단기간 안에 챗GPT에 버금가는 챗봇을 개발해야 하니 인력은 부족하다. 회사는 챗봇의 성능과 이용자 경험을 검토하기 위해 외부로부터 계약직도 고용했다.
어니봇 개발팀은 바이두의 자율주행자동차 부서로부터 미국 엔비디아의 AI용 그래픽처리장치(GPU) 반도체인 A100 등을 요청했다고 소식통들은 전했다.
AI챗봇 개발에는 많은 고성능 첨단 반도체가 필요한데 미국이 대(對)중국 첨단 반도체 수출규제를 하는 상황 속 바이두도 확보가 어려운 것이 아니냐는 관측이 나온다.
이밖에 바이두가 단기간 안에 챗봇을 개발하기에는 다른 어려움도 있다. 첫째로 직역하기 어려운 문구나 문맥에 따라 여러 의미를 갖는 단어 등을 구분할 수 있게끔 AI 언어 모델을 훈련시키는 일이다. 두 번째는 챗봇이 최대한 사람과 비슷하게 대화형으로 구동할 수 있게 프로그램하는 일이다. 두 가지 모두 수많은 AI 모델 훈련을 해야 얻을 수 있는 성과다.
마지막으로 세 번째는 언어 모델의 문장 생성 기술이다. 챗봇은 정보의 조각만 수집해 재조합하는 것이 아니라 한 단어가 나오면 그 다음 단어를 확률에 기초해 선정, 문장으로 묶는 방식으로 구동한다.
이는 "민감한 주제를 피하거나 당국 검열에 준수하기가 어렵다"고 WSJ는 꼬집었다. 기존의 검열은 민감한 정보를 삭제하면 그만이지만 챗봇은 이용자의 질문에 따라 단어를 찾아 문장을 생성하기 때문이다.
AI 챗봇 개발 지원에 나선 베이징 시당국은 중국의 첫 '챗GPT 대항마'가 될 어니봇에 거는 기대가 크지만 동시에 회사에 "어니봇 서비스가 데이터 수집과 처리를 포함한 중국 법과 규정에 준수해야 하고, 무엇보다 당국의 엄격한 인터넷 검열 규칙에 따라야 한다는 점을 상기시켰다"고 소식통들은 전했다.
가뜩이나 AI 모델 훈련도 더딘 마당에 당국의 검열도 신경써야하는 바이두. 회사가 이토록 어니봇 출시에 서두르는 이유는 "다른 경쟁업체들보다 국내에서 시장을 선점하려는 계산된 도박(calculated gamble)"이라고 WSJ는 분석했다.
바이두는 어니봇 출시도 전에 이미 중국 내 400개 기업 제품에 서비스를 공급하기로 합의를 맺었다. 바이두는 이들 회사에 서비스를 제공하는 대신 어니봇은 다양한 상황에서 데이터를 쌓고 성능을 개선하는 데 도움이 될 것이다.
WSJ는 바이두가 어니봇 출시를 성공할 경우 지난 수 년간 투자자들로부터 관심이 식었던 회사가 다시 각광을 받을 기회가 될 것이지만 만일 실패한다면 구글의 '바드'처럼 주가 급락과 명성 훼손이란 비슷한 전철 밟게 될 것이라고 전망했다.
wonjc6@newspim.com