전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 전기·전자

속보

더보기

삼성전자 전세계에 '갤럭시AI' 언어모델 과정 공개

기사입력 : 2024년06월25일 08:51

최종수정 : 2024년06월25일 08:51

[서울=뉴스핌] 김지나 기자 = 삼성전자는 언어 장벽 없이 자유로운 소통이 가능하도록 돕는 '갤럭시 인공지능(AI)'의 언어 모델 개발 과정을 공개했다고 25일 밝혔다.

삼성전자는 언어를 넘어 문화를 이해하고 지식을 갖춘 고도화된 '갤럭시 AI'를 위해 전 세계 총 20여개의 연구개발(R&D) 센터에서 언어 모델 연구·개발에 매진하고 있다.

'갤럭시 AI'의 온디바이스 실시간 통·번역 기능은 현재 16개 언어를 지원 중이며, 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어의 4개 언어를 더 추가해 총 20개 언어를 지원할 계획이다.

삼성리서치 요르단 연구소(SRJO)의 '갤럭시 AI' 언어 개발 담당자. [사진=삼성전자]

삼성전자의 '갤럭시 AI' 언어 모델은 언어의 특성과 문법에 대한 정량 평가, 문화에 대한 지식과 이해를 검증하는 정성 평가 등을 거쳐 공개된다.

아랍어는 20여개국 4억명 이상이 사용하는 세계에서 6번째로 많이 사용되는 언어다. 아랍어를 통번역에 활용하기 위해서는 현대 표준 아랍어인 풋스하(Fusha)와 일상생활에서 사용하는 방언인 암미야(Ammiyya)를 모두 학습해야 한다. 특히 아랍어 방언은 총 30여 종에 달한다.

삼성리서치 요르단 연구소(SRJO)는 아랍어 방언을 이해하면서, 답변은 표준 아랍어로 할 수 있는 언어 모델을 개발했다. 이를 위해 각기 다른 방언의 음성 녹음 데이터를 수집하고, 이를 직접 텍스트로 변환하는 과정을 거쳤다.

데이터베이스 구축을 맡은 요르단 연구소의 아야 하산(Ayah Hasan)은 "여러 방언의 미묘한 차이와 변형을 정확히 이해할 수 있는 원어민들로 갤럭시 AI 팀을 구성하고, 음성 데이터를 일일이 글과 문장으로 바꾸는 수작업을 진행했다"고 설명했다.

삼성전자는 아랍어의 복잡성에 대한 깊은 이해와 신중한 데이터 선별을 진행하고, 고급 모델링 기술을 적용해 아랍어를 갤럭시 AI에 추가할 수 있었다.

베트남어는 전세계 약 1억명이 사용하는 언어로 중국어, 태국어 등 인근 지역 언어와 비슷한 성조 체계를 지니고 있다. 특히 베트남어는 여섯 가지의 성조를 가진다. 예를 들어 베트남어 단어 '마(Ma)'는 성조에 따라 엄마(Má), 무덤(Mả), 귀신(Ma) 등 전혀 다른 의미를 지녔다.

삼성리서치 베트남 연구소(SRV)는 성조의 미세한 차이를 인식할 수 있도록, 음성 데이터를 매우 정교하게 다듬고 정제하는 과정을 거쳤다. 무엇보다 성조를 정확히 구분해 내기 위해 한 단어를 0.02초 전후의 짧은 프레임으로 잘라내고 이를 데이터베이스화 했다.

중남미 22개국의 공식 언어는 스페인어다. 하지만 같은 스페인어라도 동일한 대상을 지칭하는 단어는 국가와 지역에 따라 천차만별이다.

예를 들어 멕시코에서는 수영장을 '알베르카(alberca)'라고 한다. 하지만 아르헨티나, 파라과이, 우루과이에서는 '필레타(pileta)'라고 부른다. 콜롬비아, 볼리비아, 베네수엘라에서는 '피시나(piscina)'라고 표현한다.

중남미 지역의 언어 모델 개발을 담당한 삼성리서치 브라질 연구소(SRBR)는 '갤럭시 AI'가 중남미 국가의 스페인어 차이를 이해할 수 있도록, 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

2억8000만명, 인구 4위의 인도네시아는 2억8000만 인구가 인도네시아어를 사용하고 있다. 인도네시아어는 관사, 복수형, 동사의 시제 변화가 없어서 상대적으로 배우기 쉬운 언어로 평가받는다. 하지만 반대로 문장의 맥락을 충분히 파악하지 못하면 내용을 이해할 수 없어 통·번역이 쉬지 않은 언어이다.

이러한 언어적 특성을 반영해 삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 '인공신경망번역(Neural Machine Translation, NMT)' 방식을 적용했다. 단어가 아닌 '문장 단위'로 언어를 학습시켜, 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.

 

abc123@newspim.com

[뉴스핌 베스트 기사]

사진
'문자 논란'에도 '어대한' 기류…국힘 지지층 63.4% 한동훈 지지 [서울=뉴스핌] 신정인 기자 = 국민의힘 차기 당권주자 여론조사 결과 한동훈 전 국민의힘 비상대책위원장이 38.2%로 1위에 올랐다. 국민의힘 지지층으로 한정지으면 63.4%까지 오르는 등 '어대한(어차피 대표는 한동훈)' 기류를 이어가고 있다. 여론조사 전문기관 미디어리서치가 뉴스통신사 뉴스핌의 의뢰로 지난 8~9일 전국 만 18세 이상 남녀 1000명을 대상으로 국민의힘 차기 당대표 적합도를 물은 결과 한 전 위원장은 38.2%를 기록했다. 이는 직전 조사 대비 2.4%포인트(p) 오른 수치다. 원희룡 전 장관은 10.1%→11.7%로 2위에 올랐다. 뒤이어 나경원 의원(11.0%→8.9%), 윤상현 의원(6.7%→7.2%) 순이다. 없음은 24.9%→28.7%, 잘모름은 3.3%→5.5%다. 연령대별로 보면 한 전 위원장이 만18세~29세(34.7%), 30대(28.3%), 40대(37.6%), 50대(32.7%), 60대(47.7%), 70대 이상(48.8%) 등 전 전 연령대에서 가장 높았다. 지역별로 살펴보면 서울(34.9%), 경기/인천(40.3%), 대전/충청/세종(38.9%), 강원/제주(39.7%), 부산/울산/경남(39.9%), 대구/경북(45.8%), 광주/전남/전북(26.0%) 등 모든 지역에서 한 전 위원장이 우세하다. 국민의힘 지지층으로 범위를 좁히면 한 전 위원장의 지지율은 63.4%까지 올랐다. 뒤이어 원 전 장관 15.5%, 나 의원 10.7%, 윤 의원 2.2% 순이다. 김대은 미디어리서치 대표는 "윤 대통령의 부인 김건희 여사가 지난 1월 한 전 위원장에게 보낸 사과 문자에 대해 한 전 위원장이 문자를 '읽씹(읽고 씹음)'했다는 논란이 일자 원 전 장관과 나 의원 등이 일제히 이 문제를 계기로 총공세에 나섰다"며 "한 전 위원장의 지지율은 지난 조사 대비 국민의힘 지지층에서는 소폭 하락했으나 전체 국민 여론조사에서는 소폭 상승해 '어대한'지형이 계속 이어져가고 있다"고 분석했다. 이번 조사는 무선 RDD 활용 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p, 응답률은 3.0%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. allpass@newspim.com 2024-07-11 06:00
사진
나토 공동성명 "北, 대러 무기 수출 규탄...양국 관계 심화 큰 우려" [서울=뉴스핌] 최원진 기자= 북대서양조약기구(NATO·나토) 회원국과 정상회의에 참석한 비회원국 정상들이 10일(현지시간) 공동성명에서 북한과 러시아 군사 협력 강화에 큰 우려를 표명했다. 나토 창설 75주년을 기념해 전날부터 미국 워싱턴DC에서 회의 중인 나토 정상들과 초청된 비회원국 정상들은 이날 채택한 공동성명 '워싱턴 선언문'에서 "우리는 유엔 안전보장이사회(안보리)의 여러 결의를 위반하는 북한의 (대러) 포탄과 탄도미사일 수출을 강력히 규탄한다"며 "북한과 러시아 간의 관계가 깊어지고 있는 것을 심히 우려하며 지켜보고 있다"고 밝혔다. 10일(현지시간) 미국 워싱턴DC에서 열린 정상회의에서 단체 기념촬영 하는 북대서양조약기구(NATO·나토) 정상들. [사진=로이터 뉴스핌] 또한 이들은 북한과 이란이 탄약과 무인기(UAV) 등 직접적인 군사적 지원을 통해 우크라이나에 대한 러시아의 침략 전쟁을 부추기고 있다면서 "이는 유럽·대서양 안보에 심각한 영향을 끼치고 전 세계 비확산 체제를 약화한다"고 지적했다. 나토 회의 참석 정상들은 중국을 러시아의 우크라이나 침략 전쟁 지속을 가능케 하는 결정적인 조력자(decisive enabler)로 지목, 중국에 러시아가 방위산업에 쓸 수 있는 무기 부품, 장비, 원자재 등 이중용도 물품을 포함한 모든 물질·정치적 지원을 중단할 것을 촉구했다. 아울러 중국은 "유럽·대서양 안보에 지속적으로 구조적 도전(systemic challenge)이 되고 있다"며 중국에 사이버 공간과 우주 역량 개발과 활동 면에서 책임 있는 행동을 촉구했다. 1949년 대러 견제 서방 안보협의체로 출범한 나토는 2021년 정상회의 공동성명에서 중국을 새로운 구조적 도전으로 규정한 바 있다.  특히 중국은 핵탄두 등 핵무기를 빠르게 증대하고 있다며 핵무기 위험 감축을 위한 대화에 참여하고 투명하게 관련 정보를 공개해 줄 것을 촉구했다. 아울러 공동성명에는 나토 회원국 정상들이 오는 11일 한국, 일본, 호주, 뉴질랜드 등 아시아·태평양 파트너 4개국(AP4), 유럽연합(EU) 정상들과 "공통의 안보 도전과 협력 분야"를 논의한다면서 "인도·태평양 지역에서 진행되는 일들은 유럽·대서양 안보에 직접적으로 영향을 끼치기에 인태 지역은 나토에 중요하다"고 강조했다. 나토 정상회의 공동성명에는 '우크라이나에 대한 장기 안보 지원 약속'이란 부제의 별도 성명이 담겼다. 나토는 "우크라이나는 장기적인 지원이 필요하다"면서 "우크라이나가 오늘날 러시아의 침략을 물리치고 미래에 이를 억제할 수 있는 군을 지원하기 위해 내년 안에 최소 400억 유로(약 60조 원)의 자금을 지원하겠다"고 선언했다. 또 우크라이나가 원한 나토 가입과 관련해 "우크라이나의 미래는 나토"라며 우크라이나가 지난 빌뉴스 정상회의 이래 나토 가입 조건 충족을 위한 진전을 이뤘고 "우리는 계속해서 우크라이나의 완전한 통합이란 불가역적인 길을 지지할 것"이라고 밝혔다. wonjc6@newspim.com 2024-07-11 09:08
안다쇼핑
Top으로 이동