전체기사 최신뉴스 GAM
KYD 디데이
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 : 2023년03월21일 17:21

최종수정 : 2023년03월21일 17:21

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
뉴스핌 K컬처 플랫폼 'K·SPOT' 론칭 [서울=뉴스핌] 양진영 기자 = 종합뉴스통신사 뉴스핌이 K컬처 전문 글로벌 플랫폼 'K·SPOT' 유튜브 채널(https://www.youtube.com/@K%C2%B7SPOT_newspim)을 17일 공식 론칭했다. 'K·SPOT(@K·SPOT_newspim)'은 한국의 생생한 K컬처 현장을 전 세계에 전하는 K컬처 글로벌 플랫폼으로 영어·중국어·일본어 등 다국어 자막 서비스를 통해 글로벌 소통력을 강화한 것이 특징이다. 'This is K·SPOT – where K-culture comes alive.'라는 슬로건 아래, KPOP, K드라마, K라이프 등 한국 대중문화(K컬처) 전반을 조명한다. 특히, 전 세계의 언어 장벽을 허무는 다국어 자막 시스템을 기반으로 글로벌 팬층과의 연결을 강화했으며, 영어, 중국어, 일본어 지원과 함께 추후 스페인어, 힌디어 등 주요 언어로 확장할 예정이다. 채널명 'K·SPOT'은 한국(K) 문화의 중심 '스팟'을 의미하며, K컬처가 살아 숨 쉬는 현장에 스포트라이트를 비춘다는 의미를 담았다. K-컬처를 실시간으로 소비하는 글로벌 팬들과 그 현장을 연결하는 플랫폼으로 콘텐츠 소비의 지리적·언어적 경계를 허물며, KPOP 쇼케이스, 드라마 제작발표회 등 전 세계 팬들이 궁금해하는 바로 그 현장을 경험할 수 있는 디지털 K컬처 허브를 지향한다.  K·SPOT에서는 K라이징스타 힛지스를 시작으로 대중문화, 예술 분야 예비 스타들을 전 세계에 소개하며 다양한 K컬처 콘텐츠들도 두루 만나볼 수 있다.  ◆생생한 K-컬처 현장을 전달하는 글로벌 플랫폼 K·SPOT은 단순한 영상 채널을 넘어, 전 세계 어디서든 K컬처를 실시간으로 즐길 수 있도록 설계된 글로벌 플랫폼이다. 영어, 중국어, 일본어 등 다국어 자막 서비스를 제공해 언어 장벽을 낮추고, 다양한 문화권의 팬들이 동시 접속해 K-컬처를 함께 알아볼 수 있다. 'K·SPOT(@K·SPOT_newspim)' 채널 로고. 검색 뿐만 아니라 , 무음 시청·청각 장애인 접근성 향상 등도 도모할 예정이다.  뉴스핌은 K·SPOT은 단순한 K컬처 소개 채널에 머물지 않고, 다양한 언어와 콘텐츠 포맷을 아우르는 글로벌 문화 플랫폼으로 키울 예정이다. K컬처 심장부를 세계와 연결하며 글로벌 콘텐츠 생태계의 중심으로 도약한다는 계획이다. K·SPOT에서는 K컬처 모든 현장을 생생하게 포착하고, 전 세계 팬들과 소통하며, 디지털과 현실을 연결하는 진정한 K-컬처 허브로 자리매김할 계획이다. jyyang@newspim.com 2025-07-17 01:00
사진
충남 서산 시간당 114㎜ 폭우 [세종 = 뉴스핌] 김범주 기자 = 충청권과 중부지방을 중심으로 시간당 최대 100㎜가 넘는 강한비가 내리면서 주민 1070명이 대피하는 등의 피해를 입었다. 31개 항로에서 39척의 여객선이 운행을 멈췄고, 서울 등 90구역 하천변이 통제됐다. 중앙재난안전대책본부(중대본)는 17일 오전 10시 기준으로 이 같은 피해가 발생했다고 밝혔다. 호우경보는 세종, 충북, 충남, 경남에, 호우주의보는 서울, 대전, 광주, 경기, 강원, 전북, 전남 등에 각각 발효됐다. 전날 자정부터 이날 오전 10시까지 총 누적 강수량은 충남 서산이 가장 많은 419.5㎜로 집계됐다. 이어 홍성 411.4㎜, 당진 376.5㎜ 아산 349.5㎜, 태안 348.5㎜, 세종 324.5㎜, 충북 청주 276㎜, 경기 평택 262㎜ 등 이었다. 60분 기준 일최대 강수량은 서산 114.9㎜, 홍성 96.2㎜, 서천 98㎜, 경남 함안 70㎜ 등이었다. [서울=뉴스핌] 김학선 기자 = 서울에 폭우가 내리고 있는 17일 오전 서울 서초구 서울고검에서 청사 관계자들이 우비를 입고 이동하고 있다. 2025.07.17 yooksa@newspim.com 해당 지역을 중심으로 산사태 예보 발령도 발효됐다. ▲세종 ▲경기(평택, 안성) ▲충북(진천) ▲충남(천안, 공주, 보령, 아산, 서산, 논산, 당진, 부여, 청양, 홍성, 예산, 태안) 등 16개 지역에 경보가 내려졌다. 인명피해는 경기 1명, 충남 1명으로 집계됐다. 옹벽붕괴 1건, 도로 토사유실 2건 등으로 공공시설의 피해도 있었다. 이번 집중호우로 3개 시·도, 5개 시·군에서 313세대 1070명이 일시적으로 대피하는 피해도 발생했다. 아직 287세대 1041명이 귀가하지 못하는 것으로 집계됐다. 집중호우 지역 중심으로 통제도 있었다. 목포와 홍도, 격포와 위도, 군산과 어청도를 잇는 여객선이 통제됐다. 북한산 97개, 지리산 39개, 속리산 24개, 월악산 24개 등 총 15개 국립공원 374개 구간에서 시설 통제도 있었다. 지하차도는 충북 5개, 충남 5개, 경기 2개 등에, 도로는 인천 1개, 세종 1개, 경기 3개, 충북 1개, 충남 2개 등에 각각 통제가 이뤄졌다. [서울=뉴스핌] 류기찬 인턴기자 = 서울에 강한 비가 내리고 있는 17일 오전 서울 종로구 광화문광장 일대에서 시민들이 이동하고 있다. 2025.07.17 ryuchan0925@newspim.com 한편 중대본은 이날 오전 4시부로 중대본 1단계에서 2단계로 격상하고, 기상 상황을 실시간으로 모니터링 중이다. 또 환경부, 산림청과 같은 관계 부처와 협업을 강화해 비상근무 체제를 유지하기로 했다. 특히 서산, 당진, 태안 등 강수가 집중되고 있는 지역에는 재난문자 등을 통해 새벽시간 외출 자제, 위험지역 접근금지 등과 같은 국민행동요령을 집중적으로 홍보할 것을 당부했다. 지역재난안전대책본부에는 총 1만5708명이 비상근무 중이며 재난문자는 123건, 자동음성통보는 138회 등이 발송됐다. 이날 김민재 중앙재난안전대책본부 본부장(행안부 장관 직무대행)은 '집중호우 대처상황 긴급 점검회의'를 주재하고 "정부는 인명 피해를 최소화하기 위해 상황 대응에 만전을 기할 것"이라고 말했다. 특보 및 강수량 분포도/제공=행정안전부 wideopen@newspim.com 2025-07-17 13:39
안다쇼핑
Top으로 이동