전체기사 최신뉴스 GAM 라씨로
KYD 디데이

서울과기대·테디썸, 한국어 최초 405B급 언어모델 '블로썸' 공개

기사입력 : 2024년08월07일 08:16

최종수정 : 2024년08월07일 08:16

메타 라마3.1 기반으로 개발
영어 성능 손실 없이 달성

[세종=뉴스핌] 이경태 기자 = 서울과학기술대학교 멀티모달 언어처리 연구실(MLP) 임경태 교수팀과 테디썸은 한국어 최초 405B급 한국어-영어 초거대 언어모델 Bllossom-405B를 6일 완전 공개했다.

이 모델은 메타가 최근 공개한 공개 언어모델인 라마3.1(LLama3.1-405B) 기반 모델을 토대로 만들어졌다. 메타가 공개한 라마3.1-405B 모델은 한국어가 가능한 공개 언어모델 중 가장 큰 모델이다.

챗 블로썸 서비스 모습 [사진=테디썸] 2024.08.07 biggerthanseoul@newspim.com

블로썸-405B 모델은 라마3.1 모델에 자체 개발한 '효율적인 층별 최적화(Efficient Layer-specific Optimization, ELO)' 추가 사전학습 방법을 적용한 모델이다.

한국어-영어 병렬 말뭉치 데이터를 활용한 지식 연결을 통해 영어 성능의 손실 없이 한국어 성능을 강화한 모델이다.

405B급 초거대 모델 추론에만 최소 엔비디아의 A100 GPU 6대가 필요할 정도로 상당히 큰 모델로 추가 사전학습의 장벽이 높다.

서울과기대 임경태 교수팀은 이러한 문제를 자체 개발한 층별 최적화 방법으로 완화시켰다.

이번 블로썸 3.1 모델은 공식적으로 한국 '휴렛 패커드 엔터프라이즈(Hewlett Packard Enterprise. HPE)의 컴퓨팅 지원과 커먼 크롤(Common Crawl) 재단이 제공한 한국어 데이터를 토대로 대량의 GPU와 영어-한국어 데이터를 활용해 만들어진 모델이다.

이번에 공개된 모델은 Bllossom3.1-8B 모델과 Bllossom3.1-405B 모델이다. 이 모델은 전체적으로 공개가 되며, 개별적인 추가 학습이 가능해 상업적인 이용도 할 수 있다. GPU메모리 사용량을 매우 줄인 4bit 양자화된 모델도 동시에 공개해 일반 유저들이 직접 활용해볼 수 있다.

함영균 테디썸 대표는 "한국어 공개 모델의 필요성에 공감한 글로벌 빅테크 기업들이 현재 블로썸과 협업하고 있다"며 "앞으로도 지속적으로 거대 모델을 공개해 중소규모 회사 및 연구 그룹에서도 활용할 수 있도록 초거대 언어모델의 민주화에 기여할 것"이라고 말했다.

biggerthanseoul@newspim.com

CES 2025 참관단 모집

[뉴스핌 베스트 기사]

사진
위례과천선 광역철도 민자적격성 통과 [서울=뉴스핌] 최현민 기자 = 경기 과천시와 서울 강남구, 송파구 일원을 연결하는 위례과천선 사업이 본궤도에 오른다.   국토교통부는 위례과천 광역철도사업이 한국개발연구원(KDI)의 민자적격성 조사를 통과했다고 7일 밝혔다. 위례과천선은 서쪽으로는 정부과천청사, 동쪽으로는 송파구 법조타운과 위례신도시를 연결하고 북쪽으로는 강남구 압구정까지 연결하는 총 연장 28.25km의 광역철도 사업으로 민간투자방식으로 지어진다.  위례과천선 노선도안 [자료=국토부] ※노선 미확정 위례과천선은 제4차 국가철도망 구축계획 반영 후 2021년 12월 '대우건설 컨소시엄'에서 국토부에 최초제안서를 제출했으며 제안서 검토 및 지자체 협의과정을 거쳐 2022년 9월 민자적격성 조사에 착수했다. 민자적격성 조사 과정에서 원자재 가격 급등, 양재첨단물류단지 개발 등 여건 변화가 발생했고 경제성을 최대한 확보하기 위한 사업계획 보완을 거쳐 올해 11월 최종적으로 사업의 타당성을 인정받았다. 특히 본 사업 영향권에 있는 9개 공공주택지구에 총 8만6000명 규모의 입주가 예정돼 있어 신규 철도노선을 통해 선제적으로 교통난을 해소해 나갈 계획이다. 입주 예정 지구는 과천주암 공공지원주택지구, 서울강남 공공주택지구 등이다. 다만 노선안은 아직 확정되지 않았다. 국토부는 세부노선 및 역사는 실시협약 체결 시 확정‧공개할 방침이다.  윤진환 국토부 철도국장은 "내년 전략환경영향평가를 마무리하고 제3자 제안 공고를 통해 우선협상대상자를 선정해 협상까지 착수하는 것을 목표로 속도감 있게 사업을 추진할 계획"이라고 말했다. min72@newspim.com 2024-11-07 17:36
사진
의왕 오전왕곡, 1.4만 가구 들어선다 [서울=뉴스핌] 최현민 기자 = 2029년 개통예정인 인덕원~동탄 복선전철 그리고 수도권광역급행철도(GTX) C노선이 연계되는 경기 의왕시 오전동, 왕곡동 일대에 약 1만4000가구가 들어선다. 5일 국토교통부에 따르면 지난 8월 발표한 '주택 공급 방안' 후속 조치로 의왕 오전왕곡지구가 신규 택지 후보지로 선정됐다. 오전왕곡지구는 경기도 의왕시 오전동, 왕곡동에 걸쳐 있고 187만㎡(57만평)에 1만4000가구가 들어선다. 의왕 오전왕곡은 경수대로·과천-봉담 간 도시 고속화 도로에 연접한 부지로 산업 기능 유치 잠재력이 높은 곳으로 난개발 방지를 위한 계획적 개발이 요구되는 곳이다. 특히 지구 내 친수 공간이 풍부해 정주 환경이 우수하고 인접한 과천지식정보타운 등과 연계한 의료·바이오 산업 유치에 유리해 자족 기능 확보를 통한 수도권 남부의 새로운 직주 근접 생활 공간 조성이 전망된다. 의왕 오전왕곡은 서울시 경계에서 약 10㎞ 남측, 의왕 IC 인근으로 인접 지역에 의왕·군포·안산 신도시, 의왕고천지구, 의왕백운밸리 등이 위치하고 있다. 과천~봉담 도시 고속화 도로, 경수대로(국도 1호선)가 인접하고 있으며 의왕시청역(가칭) (동탄~인덕원선, 2029년 개통 예정)이 700m 거리에 위치한다. 현재 도시철도 혜택을 받지 못하는 오전왕곡지구는 주변에 형성되는 3개 광역철도와의 연계에 촛점을 맞추고 있다. 국토부는 수도권광역급행철도(GTX)-C, 인덕원-동탄선과의 연계 강화를 통해 서울 도심까지 30분 내 접근이 가능하도록 교통망을 구축하겠다는 계획이다. 우선 GTX-C 노선 연계성, 인덕원~동탄선 접근성 강화 등 철도 교통 접근성을 향상시킨다. 이와 함께 대상지 북측으로 월곶~판교선이 예정돼 있는 만큼 현재 주거단지로 바뀐 백운호수 일대와 연계하는 방안도 고려될 전망이다.  현 과천-봉담 고속화 도로와 경수대로(국도 1호선)의 연결 및 주변 도로 확충을 통해 서울 등 지역 간 접근성 개선 및 교통량 분산도 추진한다. 의왕 TG 광역버스 정류장을 활용한 광역 대중교통 환승 체계 개선과 오전동과 왕곡동으로 분리된 사업 지구 간 도로 연결 체계를 구축해 지구 간 단절을 해소하고 단일 생활권으로 조성한다. min72@newspim.com 2024-11-05 15:00
안다쇼핑
Top으로 이동