KAIST, GPT-4 버전의 시각 멀티모달 성능 뛰어넘는 대형 언어모델 개발

기사입력 : 2024년06월20일 10:52

최종수정 : 2024년06월20일 10:52

공개형 멀티모달 LLM 'CoLLaVO'·'MoAI' 개발

[세종=뉴스핌] 이경태 기자 = 한국과학기술원(KAIST)은 전기및전자공학부 노용만 교수 연구팀이 오픈AI(OpenAI)의 GPT-4 등 기업에서 비공개하고 있는 상업 모델인 초대형 언어모델의 시각 성능을 뛰어넘는 공개형 멀티모달 대형 언어모델을 개발해 출시했다고 20일 밝혔다.

노용만 교수 연구팀은 단순히 모델의 크기를 키우거나 고품질의 시각적 지시 조정 데이터셋을 만들지 않고 멀티모달 대형언어모델의 시각 성능을 획기적으로 높인 콜라보(CoLLaVO), 모아이(MoAI) 2가지 기술을 연속적으로 개발했다.

MoAI 멀티모달 대형언어모델 성능 [자료=한국과학기술원] 2024.06.20 biggerthanseoul@newspim.com

연구팀이 개발한 첫번째 기술인 '콜라보(CoLLaVO)'는 현존하는 공개형 멀티모달 대형언어모델이 비공개형 모델의 성능에 비해 현저하게 낮은 이유를 일차적으로 물체 수준에 대한 이미지 이해 능력이 현저하게 떨어진다는 것을 먼저 검증했다.

해당 능력을 효율적으로 증가시켜 시각-언어 태스크에 대한 성능을 향상 하기 위해 연구팀은 이미지 내의 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 입력으로 직접 넣어주는 새로운 방법인 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새롭게 제안했다.

시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 연구팀은 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습해 서로 간의 정보를 잃지 않게 만드는 획기적인 학습 전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다.

연구팀은 이를 통해 콜라보(CoLLaVO) 멀티모달 대형언어모델은 이미지 내에서 배경 및 물체를 구분하는 능력이 뛰어나 일차원적인 시각 구분 능력이 크게 향상됐다고 전했다.

두 번째 대형언어모델인 '모아이(MoAI)'는 인간이 사물을 판단할 때 물체의 존재, 상태, 물체 간의 상호작용, 배경에 대한 이해, 텍스트에 대한 이해 등으로부터 상황을 판단하는 인지과학적인 요소에 영감을 받아서 만들었다는 게 연구팀의 설명이다.

기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용한다. 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면 이해가 부족하다는 점을 연구팀은 지적했다. 연구팀은 이런 컴퓨터 비전 모델들의 결과를 받으면 모두 인간이 이해할 수 있는 언어로 변환한 뒤에 멀티모달 대형언어모델에 입력으로 직접 사용했다.

노용만 교수는 "연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐고, 각종 SNS를 통해 세계 연구자에게 알려지고 있다"며 "모든 모델을 공개형 대형언어모델로 출시 했기 때문에 이 연구모델이 멀티모달 대형언어모델 발전에 기여할 것"이라고 말했다.

biggerthanseoul@newspim.com

[관련기사]

[관련키워드]

KAIST 모델 이미지 AI LLM 콜라보

GAM - 해외주식 투자 도우미

애로우헤드 ② 고중성지방혈증 적응증 확대 기대감 고조

애로우헤드 ① 플로자시란 임상 3상 잭팟에 52주 최고가

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

北TV "오늘 시간당 50~80㎜ 폭우" [서울=뉴스핌] 이영종 통일북한전문기자 = 북한 조선중앙TV가 23일 황해도와 강원도 지역에 폭우와 많은 비가 내릴 예정이라면서 '중급경보'를 알렸다. 중앙TV는 이날 오전 10시 보도 맨 앞머리에 "황해도와 강원 국부적 지역에 시간당 50~80mm의 폭우와 80~150mm의 많은 비가 내리겠다"고 전했다. [서울=뉴스핌] 이영종 통일북한전문기자 = 북한 조선중앙TV가 23일 황해도와 강원도 지역에 폭우와 많은 비가 내릴 예정이라면서 '중급경보'를 알렸다. [사진=조선중앙TV] 2026.07.23 yjlee@newspim.com 또 "개성과 강원도 여러지역과 평남, 황해도 일부 지역에 시간당 30~50mm의 폭우와 80~150mm의 많은 비가 쏟아질 예정"이라면서 '주의경보'를 내렸다. 중앙TV는 카드뉴스 형식의 보도를 통해 이날 오전 집중 강수지역의 강수량과 각 도별 평균강수량 등을 전했다. 북한 매체들은 앞서 보도를 통해 "27일까지 대부분 지역에 잦은 비가 내리겠고 국부적으로 폭우가 내릴 수 있다"면서 "23일에는 황남과 황북, 강원, 개성 등 여러지역이, 24~25일에는 중부 위주의 여러 지역에서 많은 비가 내릴 것"이라고 예보한 바 있다. 북한이 관영 선전매체를 동원해 기상특보를 실시간으로 전하며 촉각을 곤두세운 건 장마철 집중 호우로 인해 주택과 농경지 피해가 발생할 것을 우려한 때문으로 보인다. 핵과 미사일 개발에 치중해온 김정은 정권이 재난 예방 시설에 대한 투자나 대책마련을 소홀히 하면서 해마다 수해와 가뭄 등이 반복되고 있다는 지적도 나온다. 노동신문 등 매체들은 최근 집중호우로 인한 피해를 막아야 한다면서 노동당·내각 간부와 농장·기업소 간부들의 분발을 촉구하고 있다. [서울=뉴스핌] 이영종 통일북한전문기자 = 북한 조선중앙TV가 23일 황해도와 강원도 지역에 폭우와 많은 비가 내릴 예정이라면서 '중급경보'를 알렸다. 사진은 중앙TV가 전한 집중 강수지역과 강수량. [사진=조선중앙TV] 2026.07.23 yjlee@newspim.com 한편 북한은 집중 호우가 내리자 임진강 상류 황강댐을 무단 방류한 것으로 파악됐다. 북한의 무단 방류는 사전통보를 약속한 남북 간 합의 위반이다. 지난 2009년 9월에는 북한의 황강댐 무단 방류로 우리 야영객 6명이 숨지고, 차량 21대가 침수되는 등 피해가 발생한 바 있다. yjlee@newspim.com 2026-07-23 10:28

사진

원희룡, 종합특검 첫 출석 [과천=뉴스핌] 김영은 기자 = 서울-양평고속도로 노선 변경 의혹에 연루된 원희룡 전 국토교통부 장관이 23일 2차 종합특별검사팀(종합특검)에 처음으로 출석했다. 원 전 장관은 종합특검이 1년 넘게 노선 변경 특혜 의혹을 수사하다 이제 와 사업 백지화 선언으로 수사 대상을 바꾸고 있다며 혐의를 부인했다. 원 전 장관은 이날 오전 9시46분께 경기 과천시 종합특검 사무실에 직권남용 권리행사방해 혐의 피의자 신분으로 도착했다. [과천=뉴스핌] 김영은 기자 = 서울-양평고속도로 노선 변경 및 사업 백지화 의혹을 받는 원희룡 전 국토교통부 장관이 23일 2차 종합특검에 출석했다. 2026.07.23 yek105@newspim.com 그는 출석에 앞서 "1년 넘게 고속도로 특혜를 추진했다고 수사하다가 도저히 안 되는지 이제 와서는 수사 대상을 중단한 백지화 선언으로 바꿀 모양"이라고 밝혔다. 이어 "어떻게든 엮어보겠다는 의도를 가지고 있다면 마음대로 그림을 그려보라"며 "위법 사실이 없기 때문에 특검의 의도대로는 잘 안 될 것"이라고 강조했다. 다만 노선 변경 당시 김건희 여사 일가 토지와의 연관성을 알고 있었는지 묻는 질문에는 "나중에 하겠다"고 답했다. 백지화 결심 시점과 외부 지시 여부에 대해서는 답하지 않고 조사실로 향했다. 이날 특검 사무실 앞에는 오전 7시30분께부터 원 전 장관 지지자 수십명이 모였다. 인원이 늘자 경찰은 폴리스라인을 설치했고, 참가자들은 '정치특검 표적수사 국민은 안 속는다', '억지수사 중단하고 진실을 밝혀라' 등의 문구가 적힌 피켓을 들었다. 원 전 장관이 모습을 드러내자 지지자들은 그의 이름을 연호하며 "힘내라"고 외쳤다. 집회 사회자는 "원 전 장관이 사익을 추구하거나 국민에게 피해를 끼친 사실이 없다"며 "무법천지 특검은 해산하라"고 주장했다. 양평고속도로 의혹은 윤석열 정부 출범 이후 고속도로 종점이 기존 양서면에서 김 여사 일가 소유 토지가 있는 강상면 일대로 변경되는 과정에 특혜가 있었는지가 핵심이다. 종합특검은 국토부가 노선 변경을 검토하는 과정에 원 전 장관이나 대통령실 등 윗선이 개입했는지 수사해왔다. 원 전 장관은 2023년 7월 이 같은 특혜 논란이 불거지자 사업 전면 백지화를 선언했다. 종합특검은 노선 변경 의혹과 별도로 원 전 장관이 도로정책심의위원회 등 적법한 절차를 거치지 않고 사업 중단을 지시해 국토부 공무원들에게 의무 없는 일을 하게 한 것으로 의심하고 있다. 법 위반 소지가 있다는 내부 검토에도 이와 배치되는 보도자료를 배포하도록 했다는 의혹도 들여다보는 것으로 전해졌다. 앞서 종합특검은 원 전 장관에게 두 차례 출석을 통보했으나 '폐문부재'로 송달되지 않았다. 이에 지난 15일 원 전 장관의 신체와 차량을 압수수색해 휴대전화 등을 확보하고 출석요구서를 전달한 뒤 이날로 조사 일정을 조율했다. 앞서 원 전 장관을 먼저 조사했던 김건희 특검(특별검사 민중기)은 그를 피의자로 입건했지만 '윗선' 개입 여부는 결론 내지 못한 채 수사를 마무리한 바 있다. 종합특검은 이날 원 전 장관을 상대로 노선 변경과 사업 백지화 과정에 직접 개입했는지, 김 여사 일가 토지와의 연관성을 언제 인지했는지, 대통령실 등 외부와 협의하거나 지시받은 사실이 있는지 등을 집중 추궁할 전망이다. [서울=뉴스핌] 김영은 기자 = 종합특검 건물 앞에 원희룡 전 장관의 지지자들이 모여 있다. 2026.07.23 yek105@newspim.com yek105@newspim.com 2026-07-23 10:20