전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 전기·전자

속보

더보기

삼성전자 전세계에 '갤럭시AI' 언어모델 과정 공개

기사입력 : 2024년06월25일 08:51

최종수정 : 2024년06월25일 08:51

[서울=뉴스핌] 김지나 기자 = 삼성전자는 언어 장벽 없이 자유로운 소통이 가능하도록 돕는 '갤럭시 인공지능(AI)'의 언어 모델 개발 과정을 공개했다고 25일 밝혔다.

삼성전자는 언어를 넘어 문화를 이해하고 지식을 갖춘 고도화된 '갤럭시 AI'를 위해 전 세계 총 20여개의 연구개발(R&D) 센터에서 언어 모델 연구·개발에 매진하고 있다.

'갤럭시 AI'의 온디바이스 실시간 통·번역 기능은 현재 16개 언어를 지원 중이며, 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어의 4개 언어를 더 추가해 총 20개 언어를 지원할 계획이다.

삼성리서치 요르단 연구소(SRJO)의 '갤럭시 AI' 언어 개발 담당자. [사진=삼성전자]

삼성전자의 '갤럭시 AI' 언어 모델은 언어의 특성과 문법에 대한 정량 평가, 문화에 대한 지식과 이해를 검증하는 정성 평가 등을 거쳐 공개된다.

아랍어는 20여개국 4억명 이상이 사용하는 세계에서 6번째로 많이 사용되는 언어다. 아랍어를 통번역에 활용하기 위해서는 현대 표준 아랍어인 풋스하(Fusha)와 일상생활에서 사용하는 방언인 암미야(Ammiyya)를 모두 학습해야 한다. 특히 아랍어 방언은 총 30여 종에 달한다.

삼성리서치 요르단 연구소(SRJO)는 아랍어 방언을 이해하면서, 답변은 표준 아랍어로 할 수 있는 언어 모델을 개발했다. 이를 위해 각기 다른 방언의 음성 녹음 데이터를 수집하고, 이를 직접 텍스트로 변환하는 과정을 거쳤다.

데이터베이스 구축을 맡은 요르단 연구소의 아야 하산(Ayah Hasan)은 "여러 방언의 미묘한 차이와 변형을 정확히 이해할 수 있는 원어민들로 갤럭시 AI 팀을 구성하고, 음성 데이터를 일일이 글과 문장으로 바꾸는 수작업을 진행했다"고 설명했다.

삼성전자는 아랍어의 복잡성에 대한 깊은 이해와 신중한 데이터 선별을 진행하고, 고급 모델링 기술을 적용해 아랍어를 갤럭시 AI에 추가할 수 있었다.

베트남어는 전세계 약 1억명이 사용하는 언어로 중국어, 태국어 등 인근 지역 언어와 비슷한 성조 체계를 지니고 있다. 특히 베트남어는 여섯 가지의 성조를 가진다. 예를 들어 베트남어 단어 '마(Ma)'는 성조에 따라 엄마(Má), 무덤(Mả), 귀신(Ma) 등 전혀 다른 의미를 지녔다.

삼성리서치 베트남 연구소(SRV)는 성조의 미세한 차이를 인식할 수 있도록, 음성 데이터를 매우 정교하게 다듬고 정제하는 과정을 거쳤다. 무엇보다 성조를 정확히 구분해 내기 위해 한 단어를 0.02초 전후의 짧은 프레임으로 잘라내고 이를 데이터베이스화 했다.

중남미 22개국의 공식 언어는 스페인어다. 하지만 같은 스페인어라도 동일한 대상을 지칭하는 단어는 국가와 지역에 따라 천차만별이다.

예를 들어 멕시코에서는 수영장을 '알베르카(alberca)'라고 한다. 하지만 아르헨티나, 파라과이, 우루과이에서는 '필레타(pileta)'라고 부른다. 콜롬비아, 볼리비아, 베네수엘라에서는 '피시나(piscina)'라고 표현한다.

중남미 지역의 언어 모델 개발을 담당한 삼성리서치 브라질 연구소(SRBR)는 '갤럭시 AI'가 중남미 국가의 스페인어 차이를 이해할 수 있도록, 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

2억8000만명, 인구 4위의 인도네시아는 2억8000만 인구가 인도네시아어를 사용하고 있다. 인도네시아어는 관사, 복수형, 동사의 시제 변화가 없어서 상대적으로 배우기 쉬운 언어로 평가받는다. 하지만 반대로 문장의 맥락을 충분히 파악하지 못하면 내용을 이해할 수 없어 통·번역이 쉬지 않은 언어이다.

이러한 언어적 특성을 반영해 삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 '인공신경망번역(Neural Machine Translation, NMT)' 방식을 적용했다. 단어가 아닌 '문장 단위'로 언어를 학습시켜, 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.

 

abc123@newspim.com

[뉴스핌 베스트 기사]

사진
尹부부 공천개입 수사 급물살 타나 [서울=뉴스핌] 박서영 기자 = 윤석열 전 대통령이 탄핵심판 선고에서 헌법재판관 전원일치 의견으로 파면된 가운데 이른바 '명태균 의혹' 사건에 대한 검찰 수사가 윤 전 대통령 부부에 속도를 낼지 이목이 집중된다. 5일 법조계에 따르면 헌법재판소는 4일 오전 11시 윤 전 대통령 탄핵심판 선고기일을 열어 윤 전 대통령의 파면을 결정했다. 박근혜 전 대통령에 이은 헌정 사상 두 번째 파면이다. 사진은 윤석열 전 대통령. [사진=뉴스핌 DB] 검찰은 지난 2월 17일 윤 전 대통령 부부 공천개입 의혹, 여론조사 조작 의혹, 여론조사 비용 대납 의혹 등 명씨 관련 사건을 창원지검에서 중앙지검으로 이송했다. 이후 검찰은 해당 사건과 관련한 연이은 소환조사 및 강제수사 등에 착수하면서 잔여 수사에 속도를 내 왔다. 검찰은 명씨가 실질적으로 운영한 여론조사업체 미래한국연구소가 당시 대선 후보였던 윤 전 대통령을 돕고자 총 81차례에 걸쳐 불법 여론조사를 해 주고, 그 대가로 김영선 전 국민의힘 의원이 2022년 6·1 보궐선거에서 경남 창원 의창 선거구 공천을 받았다는 의혹을 받았다고 보고 있다. 윤 전 대통령의 부인 김건희 여사는 이와 관련, 보궐선거와 지난해 4월 22대 총선 당시 국민의힘 공천 과정에 개입한 의혹을 받는다. 이날 헌재의 결정으로 윤 전 대통령은 현직 대통령으로서 가졌던 '불소추특권'을 잃게 됐다. 기존 수사 대상이던 내란 혐의뿐 아니라 공천 개입 의혹 수사도 피할 수 없게 된다는 의미다. 법조계 안팎은 조기 대선을 앞두고 윤 전 대통령 부부를 향한 공천 개입 의혹 사건 수사가 급물살을 탈 것이라고 내다봤다. 정계 출신 법조인은 "박 전 대통령도 파면된 다음에 소환조사가 바로 이뤄졌다"며 "곧바로는 아니겠지만 민주당 측에서 신속한 수사를 압박할 텐데 검찰도 조만간 협의를 해 윤 전 대통령 부부의 소환 일정 등을 잡으려 할 것"이라고 전망했다. 실제 2016∼2017년 박근혜 정부의 국정농단 사건 때, 박 전 대통령의 탄핵안이 국회에서 가결되고 3개월 만에 헌법재판소가 파면 결정을 내렸다. 당시 검찰과 박영수 특별검사팀의 수사는 박 전 대통령이 자연인 신분이 된 이후 급물살을 탔다. 박 전 대통령은 파면 11일 만에 검찰에 소환됐고, 이후 열흘 만에 구속됐다. 양홍석 변호사(법무법인 이공)는 "윤 전 대통령이 파면됐으니 명태균 수사의 경우 검찰이 좀 더 가열차게 할 것 같고, 공직선거법 위반 사건도 있는데 이 또한 바로 착수해야 하지 않을까 싶다"며 "다만 전직 대통령이기 때문에 신병 문제는 바로 결정하기는 쉽지 않을 수 있다"고 예상했다. 검찰의 신속한 수사는 진행되겠지만, 윤 전 대통령의 소환조사 등은 조기 대선이 끝난 후 이뤄질 것이란 분석도 있었다. 부장검사 출신 변호사는 "대통령이 파면됐으니 적극적으로 윤 전 대통령 부부를 조사하려고 들긴 하겠지만 소환조사의 경우 조기 대선 이후가 될 것 같다"며 "정치적 파장이 큰 사안이라 검찰이 속도를 내서 수사 한다 해도 대선 정국에서 전 대통령 부부를 직격하기는 어렵다"고 했다. 윤석열 전 대통령이 4일 탄핵심판 선고에서 헌법재판관 전원일치 의견으로 파면된 가운데 이른바 '명태균 의혹' 사건에 대한 검찰 수사가 윤 전 대통령 부부를 향할지 이목이 집중된다. 사진은 명태균 씨가 지난해 11월 8일 오전 경남 창원시 창원지방검찰청에 정치자금법 위반 혐의 피의자 신분으로 출석하고 있는 모습. [사진=뉴스핌 DB] seo00@newspim.com 2025-04-05 07:00
사진
[尹 파면] 조기 대선 막 올랐다 [서울=뉴스핌] 한태희 기자 = 헌법재판소가 윤석열 대통령 파면을 선고하며 조기 대선 막이 올랐다. 현재 조기 대선 레이스에서 이재명 더불어민주당(민주당) 대표가 독주하는 구도다. 여·야 잠룡들은 권력 구조를 개편하는 개헌론으로 차별화에 나서는 등 대권을 향한 행보를 시작했다. [서울=뉴스핌] 한태희 기자 = 2025.04.03 ace@newspim.com 6일 정치권에 따르면 조기 대선은 오는 5월 말에서 6월 초에 치러질 가능성이 높다. 헌법 제68조 2항에 따라 파면 등으로 대통령 궐위 시 60일 이내 선거를 치러야 해서다. 한덕수 대통령 권한대행은 공직선거법 제35조 1항에 따라 늦어도 오는 14일까지 조기 대선일을 공고해야 한다. 조기 대선 레이스에 들어가며 대권을 노리는 후보자 발걸음도 분주해졌다. 선두 주자는 이재명 대표다. 이 대표는 차기 대권 유력 후보자를 묻는 각종 여론조사에서 압도적인 1위를 달리고 있다. 이 대표는 최근 공직선거법 위반 사건 2심에서 무죄를 받으며 사법 리스크 부담도 덜었다. 야권에서는 김경수 전 경남지사, 김동연 경기지사, 김두관 전 국회의원, 김부겸 전 국무총리, 김영록 전남지사, 이광재 전 강원지사, 전재수 의원 등이 당내 경선에 참여할 가능성이 있다. 이들은 '1강'인 이 대표와 비교해 열세다. 야권 잠룡들은 차기 대통령 임기 단축 등 개헌론을 부각하고 있다. 이준석 개혁신당 국회의원도 차기 대권을 넘보고 있다. 이준석 의원은 '40대 기수론' 등 정치권 세대 교체론을 앞세우고 있다. 여권에서는 김문수 고용노동부 장관, 안철수 국회의원, 오세훈 서울시장, 원희룡 전 국토교통부 장관, 유승민 전 국회의원, 한동훈 전 국민의힘 대표, 홍준표 대구시장 등이 조기 대선에 참전할 가능성이 있다. 여권 후보자들은 당내 경선에서 정통 지지자인 보수 표심을 먼저 얻어야 한다. 동시에 본선에서 중도층 표까지 끌어올 수 있는 경쟁력도 보여줘야 한다. 여권 후보자들은 '12·3 비상계엄 사태'를 촉발한 제왕적 대통령제 한계 극복 방안으로 대통령 권한을 분산하는 개헌론을 제시하고 있다. 각 당은 곧 당내 경선을 시작해 본선에 올릴 후보자 선정에 들어간다. 공직선거법 제49조에 따라 조기 대선 24일 전부터 이틀 동안 대통령 후보 등록을 끝내야 하기 때문이다. 조기 대선이 오는 6월 3일 치러지면 각 당은 오는 5월 11일까지 중앙선거관리위원회에 대통령 후보를 등록해야 한다. 여야는 약 8년 전 제19대 대통령 선거 당시 박근혜 대통령 파면이 결정된 후 1개월 안에 대통령 후보 선출을 마무리했다. 범야권이 대통령 단일 후보로 본선에 들어갈지도 주목된다. 당 내 간판 주자가 없는 조국혁신당은 '야권 통합 완전국민경선(오픈프라이머리)'을 제안했다. 이 대표가 있는 민주당이 이에 응할지에 정치권 이목이 쏠리고 있다. ace@newspim.com 2025-04-06 07:00
안다쇼핑
Top으로 이동