전체기사 최신뉴스 GAM
KYD 디데이
글로벌 미국·북미

속보

더보기

오픈AI '챗GPT-4o' 기습공개..."사람처럼 보고 듣고 말해"

기사입력 : 2024년05월14일 06:09

최종수정 : 2024년05월14일 07:51

단일 모델로 음성, 텍스트, 시각 데이터를 처리
오픈AI "챗 GPT-4o, 기존보다 2배 빠르고 저렴"
구글 연례 최대 행사인 I/O 컨퍼런스 앞두고 기습 공개

[휴스턴=뉴스핌] 고인원 특파원= 챗GPT를 개발해 전 세계적인 생성형 인공지능(AI) 열풍을 몰고 온 오픈AI가 13일(현지시간) 챗GPT-4의 가장 최신 버전인 'GPT-4o'(GPT-포오)를 선보였다.

새롭게 공개된 GPT-4o는 주로 텍스트를 통해 대화할 수 있었던 기존 모델과 달리 텍스트뿐 아니라 청각, 시각을 이용해 추론하고 음성을 통해 마치 사람과 대화하듯 실시간 소통이 가능하다.

이날 시연에 나선 오픈AI의 마크 첸 멀티모달 연구책임자는 챗GPT-4o와 실시간으로 대화하고 소통하는 모습을 보여줬다. 

오픈AI가 13일 라이브스트림으로 공개한 챗GPT-4o 시연영상, 2024.05.14 koinwon@newspim.com

◆ 음성, 텍스트, 시각 데이터 처리..."기존보다 2배 빠르고 저렴"

첸 책임자가 "지금 시연 중이라 너무 긴장되는데 긴장을 풀도록 도와달라"고 하자 챗GPT-4o는 "숨을 크게 들이마시라"고 조언하고 "너는 최고의 전문가니까 괜찮아"라며 긴장을 달래주기도 했다. 

숨을 과도하게 들이마시는 모습을 보이자 "이봐 진공청소기가 아니잖아. 천천히 들이마셔야지"라며 농담을 하기도 했으며, 숨을 내쉬는 동안 "바로 그거야"라고 말하기도 했다. 마치 진짜 사람과 대화하는 것처럼 즉각적이고 자연스럽게 반응했다. 

로봇과 사랑에 대한 이야기를 들려달라고 하자 즉각 이야기를 시작했으며, "좀 더 감정적으로 말해줘"라거나 "로봇처럼 말해줘" 등 다양한 요구에 맞춰 마치 진짜 사람처럼 자연스럽게 어조나 목소리를 바꿨다.

이 외에도 수학 문제를 종이에 써서 보여주자 풀이 과정을 한 단계씩 자세히 설명해 주었으며, 코딩 과정을 보며 문제 해결을 도와주기도 했다. 

오픈AI의 최고기술책임자(CTO)인 미라 무라티는 블룸버그 뉴스와의 인터뷰에서 "이번에 처음으로 상호작용과 사용 편의성 면에서 큰 도약을 이뤘다"면서 "우리는 챗GPT와 같은 도구가 사람과 협업하는 것이 가능하게 만들고 있다"고 강조했다. 마치 사람과 함께 일하는 것처럼 챗GPT와 일할 수 있도록 하겠다는 것이다.

또 이날 공개된 챗GPT-4o는 한층 업그레이드된 통역 기능도 보여줬다. 첸이 이탈리아어만 가능한 사람과 소통할 수 있도록 도와달라고 하고 영어로 말하자 실시간으로 이를 이탈리아어로 통역해 주고, 상대의 이탈리아어는 다시 영어로 통역해 주며 실시간 통역사 역할도 했다.

다양한 입력을 처리하기 위해 서로 다른 AI 모델에 의존하는 지금까지의 여러 AI모델과 달리, GPT-4o는 음성, 텍스트, 시각을 단일 모델로 결합하여 이전 모델보다 훨씬 빠른 속도로 데이터를 처리한다. 오픈AI 측은 새로 공개된 4o가 기존 모델(터보)보다 2배 빠르고 훨씬 효율적이라고 밝혔다.

무라티 CTO는 "서로 다른 세 가지 모델(음성, 텍스트, 시각)이 함께 작동하면 반응 시간이 늦어지고 경험의 몰입도도 떨어진다"면서 "새로운 GPT-4o는 세 종류의 데이터를 하나의 모델로 처리하고 추론해 지연시간을 없애고 (사람과) 상호작용하는 것처럼 챗GPT와 상호작용을 할 수 있도록 해준다"고 설명했다.

하지만 이날 시연 과정에서 문제점도 포착됐다. 이날 시연 중 오디오가 끊기는 현상이 발생했으며, 수학 문제 풀이를 마친 후 갑자기 "옷이 멋지네요"라며 다소 상황과 맞지 않는 엉뚱한 발언을 하기도 했다. 

챗GPT와 오픈AI 일러스트 이미지. [사진=로이터 뉴스핌]

◆ 구글 연례 최대 행사인 I/O 컨퍼런스 앞두고 기습 공개 

오픈AI는 이번 업데이트를 통해 웹에서 검색하여 질문에 대한 답변 찾기, 챗봇과 대화하여 다양한 음성으로 답변 듣기, 챗봇이 향후 기억할 수 있는 정보를 저장하도록 명령하는 기능 등 지금까지 유료 사용자에게만 제공됐던 여러 기능을 무료 사용자들에게도 제공할 것이라고 밝혔다. 업데이트된 버전은 향후 몇 주 내에 대중에 공개될 예정이다. 

이날 새롭게 공개된 GPT-4o는 빠르게 진화하는 AI시장에 다시 한번 지각 변동을 일으킬 전망이다. 구글, 코히어, 앤드로픽 등 여러 스타트업과 빅테크 기업들은 챗GPT-4를 업계 표준 삼아 성능이 비슷하거나 더 뛰어난 AI 모델 출시에 박차를 가하고 있다. 

특히 이날 GPT-4o 공개는 구글 연례 최대 행사인 I/O 컨퍼런스 직전에 기습적으로 이뤄진 것이어서 더욱 눈길을 끈다. 오픈AI에 비해 상대적으로 뒤쳐졌다는 평가 속에 구글은 하루 뒤인 14일 개최될 I/O 콘퍼런스에서 생성 AI인 제미나이를 비롯해 안드로이드, 검색, 크롬 브라우저 등 구글 서비스 전반에 대한 최신 사항을 발표할 것으로 기대된다. 

koinwon@newspim.com

[뉴스핌 베스트 기사]

사진
뉴스핌 K컬처 플랫폼 'K·SPOT' 론칭 [서울=뉴스핌] 양진영 기자 = 종합뉴스통신사 뉴스핌이 K컬처 전문 글로벌 플랫폼 'K·SPOT' 유튜브 채널(https://www.youtube.com/@K%C2%B7SPOT_newspim)을 17일 공식 론칭했다. 'K·SPOT(@K·SPOT_newspim)'은 한국의 생생한 K컬처 현장을 전 세계에 전하는 K컬처 글로벌 플랫폼으로 영어·중국어·일본어 등 다국어 자막 서비스를 통해 글로벌 소통력을 강화한 것이 특징이다. 'This is K·SPOT – where K-culture comes alive.'라는 슬로건 아래, KPOP, K드라마, K라이프 등 한국 대중문화(K컬처) 전반을 조명한다. 특히, 전 세계의 언어 장벽을 허무는 다국어 자막 시스템을 기반으로 글로벌 팬층과의 연결을 강화했으며, 영어, 중국어, 일본어 지원과 함께 추후 스페인어, 힌디어 등 주요 언어로 확장할 예정이다. 채널명 'K·SPOT'은 한국(K) 문화의 중심 '스팟'을 의미하며, K컬처가 살아 숨 쉬는 현장에 스포트라이트를 비춘다는 의미를 담았다. K-컬처를 실시간으로 소비하는 글로벌 팬들과 그 현장을 연결하는 플랫폼으로 콘텐츠 소비의 지리적·언어적 경계를 허물며, KPOP 쇼케이스, 드라마 제작발표회 등 전 세계 팬들이 궁금해하는 바로 그 현장을 경험할 수 있는 디지털 K컬처 허브를 지향한다.  K·SPOT에서는 K라이징스타 힛지스를 시작으로 대중문화, 예술 분야 예비 스타들을 전 세계에 소개하며 다양한 K컬처 콘텐츠들도 두루 만나볼 수 있다.  ◆생생한 K-컬처 현장을 전달하는 글로벌 플랫폼 K·SPOT은 단순한 영상 채널을 넘어, 전 세계 어디서든 K컬처를 실시간으로 즐길 수 있도록 설계된 글로벌 플랫폼이다. 영어, 중국어, 일본어 등 다국어 자막 서비스를 제공해 언어 장벽을 낮추고, 다양한 문화권의 팬들이 동시 접속해 K-컬처를 함께 알아볼 수 있다. 'K·SPOT(@K·SPOT_newspim)' 채널 로고. 검색 뿐만 아니라 , 무음 시청·청각 장애인 접근성 향상 등도 도모할 예정이다.  뉴스핌은 K·SPOT은 단순한 K컬처 소개 채널에 머물지 않고, 다양한 언어와 콘텐츠 포맷을 아우르는 글로벌 문화 플랫폼으로 키울 예정이다. K컬처 심장부를 세계와 연결하며 글로벌 콘텐츠 생태계의 중심으로 도약한다는 계획이다. K·SPOT에서는 K컬처 모든 현장을 생생하게 포착하고, 전 세계 팬들과 소통하며, 디지털과 현실을 연결하는 진정한 K-컬처 허브로 자리매김할 계획이다. jyyang@newspim.com 2025-07-17 01:00
사진
충남 서산 시간당 114㎜ 폭우 [세종 = 뉴스핌] 김범주 기자 = 충청권과 중부지방을 중심으로 시간당 최대 100㎜가 넘는 강한비가 내리면서 주민 1070명이 대피하는 등의 피해를 입었다. 31개 항로에서 39척의 여객선이 운행을 멈췄고, 서울 등 90구역 하천변이 통제됐다. 중앙재난안전대책본부(중대본)는 17일 오전 10시 기준으로 이 같은 피해가 발생했다고 밝혔다. 호우경보는 세종, 충북, 충남, 경남에, 호우주의보는 서울, 대전, 광주, 경기, 강원, 전북, 전남 등에 각각 발효됐다. 전날 자정부터 이날 오전 10시까지 총 누적 강수량은 충남 서산이 가장 많은 419.5㎜로 집계됐다. 이어 홍성 411.4㎜, 당진 376.5㎜ 아산 349.5㎜, 태안 348.5㎜, 세종 324.5㎜, 충북 청주 276㎜, 경기 평택 262㎜ 등 이었다. 60분 기준 일최대 강수량은 서산 114.9㎜, 홍성 96.2㎜, 서천 98㎜, 경남 함안 70㎜ 등이었다. [서울=뉴스핌] 김학선 기자 = 서울에 폭우가 내리고 있는 17일 오전 서울 서초구 서울고검에서 청사 관계자들이 우비를 입고 이동하고 있다. 2025.07.17 yooksa@newspim.com 해당 지역을 중심으로 산사태 예보 발령도 발효됐다. ▲세종 ▲경기(평택, 안성) ▲충북(진천) ▲충남(천안, 공주, 보령, 아산, 서산, 논산, 당진, 부여, 청양, 홍성, 예산, 태안) 등 16개 지역에 경보가 내려졌다. 인명피해는 경기 1명, 충남 1명으로 집계됐다. 옹벽붕괴 1건, 도로 토사유실 2건 등으로 공공시설의 피해도 있었다. 이번 집중호우로 3개 시·도, 5개 시·군에서 313세대 1070명이 일시적으로 대피하는 피해도 발생했다. 아직 287세대 1041명이 귀가하지 못하는 것으로 집계됐다. 집중호우 지역 중심으로 통제도 있었다. 목포와 홍도, 격포와 위도, 군산과 어청도를 잇는 여객선이 통제됐다. 북한산 97개, 지리산 39개, 속리산 24개, 월악산 24개 등 총 15개 국립공원 374개 구간에서 시설 통제도 있었다. 지하차도는 충북 5개, 충남 5개, 경기 2개 등에, 도로는 인천 1개, 세종 1개, 경기 3개, 충북 1개, 충남 2개 등에 각각 통제가 이뤄졌다. [서울=뉴스핌] 류기찬 인턴기자 = 서울에 강한 비가 내리고 있는 17일 오전 서울 종로구 광화문광장 일대에서 시민들이 이동하고 있다. 2025.07.17 ryuchan0925@newspim.com 한편 중대본은 이날 오전 4시부로 중대본 1단계에서 2단계로 격상하고, 기상 상황을 실시간으로 모니터링 중이다. 또 환경부, 산림청과 같은 관계 부처와 협업을 강화해 비상근무 체제를 유지하기로 했다. 특히 서산, 당진, 태안 등 강수가 집중되고 있는 지역에는 재난문자 등을 통해 새벽시간 외출 자제, 위험지역 접근금지 등과 같은 국민행동요령을 집중적으로 홍보할 것을 당부했다. 지역재난안전대책본부에는 총 1만5708명이 비상근무 중이며 재난문자는 123건, 자동음성통보는 138회 등이 발송됐다. 이날 김민재 중앙재난안전대책본부 본부장(행안부 장관 직무대행)은 '집중호우 대처상황 긴급 점검회의'를 주재하고 "정부는 인명 피해를 최소화하기 위해 상황 대응에 만전을 기할 것"이라고 말했다. 특보 및 강수량 분포도/제공=행정안전부 wideopen@newspim.com 2025-07-17 13:39
안다쇼핑
Top으로 이동