전체기사 최신뉴스 GAM
KYD 디데이
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
李대통령 지지율 62.2% [리얼미터] [서울=뉴스핌] 김미경 기자 = 이재명 대통령의 국정수행 지지율이 62.2%를 기록했다는 여론조사 결과가 27일 나왔다. 여론조사 전문기관 리얼미터가 이날 공개한 4월 4주차 주간동향을 살펴보면 이 대통령의 국정수행 긍정평가는 62.2%로 지난주보다 3.3%포인트(p) 하락했다. 직전 조사인 4월 3주차에서 65.5%로 취임 후 최고치를 경신한 뒤 하락했다. 부정평가는 33.4%로 3.4%p 상승했다. '잘 모름' 응답은 4.4%였다. 리얼미터 측은 "인도-베트남 정상회담 성과와 코스피 최고치 경신이라는 긍정적 신호에도 불구하고, 중동전쟁 여파로 이어진 고유가·고물가로 민생 부담이 커지면서 지지율은 하락 조정을 받은 것으로 보인다"고 분석했다. [서울=뉴스핌] 이재명 대통령이 15일 청와대에서 열린 규제합리화위원회 제1차 전체회의에서 발언을 하고 있다. [사진=청와대] 2026.04.15 photo@newspim.com 정당 지지도 조사에서는 더불어민주당이 0.8%p 상승한 51.3%, 국민의힘이 0.7%p 하락한 30.7%를 기록했다. 양당 격차는 전주 19.1%포인트에서 20.6%포인트로 늘었다. 이어 개혁신당 3.6%, 조국혁신당 2.5%, 진보당 1.3% 순이었다. 기타 정당은 3.3%, 무당층은 7.2%였다. 리얼미터 측은 "지방선거를 앞두고 정청래 민주당 대표가 전국 현장을 찾는 민생 행보를 이어가며 당의 결집력을 강화하면서 민주당 지지율 상승세로 나타났다"고 설명했다. 국민의힘 지지율 하락에는 "장동혁 대표의 방미 성과를 둘러싼 외교 논란과 지방선거 당내 공천 갈등이 겹쳐 지지율 하락세를 보였다"고 판단했다. 이번 여론조사는 에너지경제신문 의뢰로 진행됐으며, 대통령 국정수행 지지도 조사는 20~24일 동안 전국 18세 이상 유권자 2509명을 대상으로, 무선(100%) 자동응답 방식으로 이뤄졌다. 표본오차는 95% 신뢰수준에서 ±2.0%p다. 응답률은 5.4%다.  정당 지지도 조사는 23~24일 동안 전국 18세 이상 유권자 1006명을 대상으로, 무선(100%) 자동응답 방식으로 진행됐다. 표본오차는 95% 신뢰수준에서 ±3.1%포인트다. 응답률은 4.3%다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지에서 확인할 수 있다. the13ook@newspim.com 2026-04-27 09:36
사진
케냐 사웨, 마라톤 '2시간 벽' 깨다 [서울=뉴스핌] 박상욱 기자 = 마라톤 풀코스 42.195㎞ '2시간의 벽'이 공식 대회에서 처음으로 무너졌다. 케냐의 사바스티안 사웨(30)는 26일(한국 시간) 영국 런던에서 열린 2026 런던 마라톤 남자부에서 1시간 59분 30초에 결승선을 통과했다. 2023년 켈빈 키프텀(케냐)이 시카고 마라톤에서 작성한 종전 세계기록 2시간 00분 35초를 무려 65초나 지운 역대급 레이스였다. 인류가 공식 공인 마라톤 레이스에서 '서브 2'에 성공한 것은 이번이 처음이다. 사웨는 초반부터 흔들림이 없었다. 선두 그룹에서 안정적으로 레이스를 이끌며 5㎞를 14분 14초에 통과했다. 당시 페이스만으로도 2시간 00분 3초가 예측되는 살인적인 속도였다. 하프 지점도 1시간 00분 29초로 통과했다. 세계기록 페이스를 유지하면서도 표정에는 여유가 남아 있었다는 현지 중계진의 평가다. [런던=뉴스핌] 박상욱 기자=사바스티안 사웨가 26일(한국시간) 2026 런던 마라톤 남자부에서 1시간 59분 30초에 결승선을 골인한 뒤 자신의 신발을 들어보이며 포즈를 취하고 있다. 2026.4.26 psoq1337@newspim.com 승부는 30㎞ 이후였다. 사웨는 1시간 26분 03초로 30㎞ 지점을 찍은 뒤 페이스를 다시 끌어올렸다. 요미프 케젤차(에티오피아)가 옆에서 따라붙자 오히려 속도를 더 올리며 양자 구도를 만들었다. 결승선을 약 1.7㎞ 남기고 마지막 승부수를 띄웠다. 사웨는 체중이 하나도 남지 않은 듯 가볍게 치고 나갔고 케젤차는 그 스퍼트를 끝내 버티지 못했다. 버킹엄궁 앞 스트레이트에 들어설 때 승부는 이미 끝나 있었다. 사웨는 두 팔을 번쩍 치켜들며 1시간 59분 30초를 찍었다. 2시간 벽을 깨기 위한 수십 년 도전이 한순간에 결실을 맺는 장면이었다. 그는 결승점에서 "정말 행복하다. 잊지 못할 날이다. 초반부터 페이스가 좋았고 결승선에 가까워질수록 몸 상태가 더 좋아지는 걸 느꼈다"고 말했다. [런던=뉴스핌] 박상욱 기자=사바스티안 사웨가 26일(한국시간) 2026 런던 마라톤 남자부에서 1시간 59분 30초에 결승선을 골인하고 있다. 2026.4.26 psoq1337@newspim.com 2위로 골인한 케젤차 역시 1시간 59분 41초에 완주하며 인류 역사상 두 번째 '서브 2' 기록을 남겼다. 3위 제이컵 키플리모(우간다)는 2시간 00분 28초로 골인해 종전 세계기록을 앞질렀다. 인류가 한 번도 넘지 못했던 장벽이 한 레이스에서만 세 번이나 뛰어넘어진 셈이다. '2시간의 벽'은 오랫동안 인간 한계의 상징이었다. 엘리우드 킵초게(케냐)가 2019년 비엔나 특설 코스에서 1시간 59분 40초를 찍긴 했다. 하지만 이는 레이저 유도차량, 대규모 페이스메이커, 특수 설계 코스가 동원된 이벤트 레이스로 공식 기록으로는 인정받지 못했다. '인간의 다리만으로, 공인 조건에서 2시간을 깰 수 있는가'라는 질문은 여전히 열린 채 남아 있었다. 사웨는 그 물음에 '가능하다'는 답을 내놓았다. 사웨는 이미 예고된 '차세대 괴물'이었다. 2024년 발렌시아 마라톤 데뷔전에서 2시간 02분 05초로 우승한 뒤, 2025년 런던 마라톤에서는 2시간 02분 27초로 정상에 올랐다. 메이저 마라톤 풀코스 4전 전승이다. 그는 대회를 앞두고 "세계 신기록은 시간문제다. 언젠가 2시간 이내에 마라톤을 완주하는 첫 선수가 될 것이라 믿는다"고 말했다. 그리고 런던에서 그 약속을 현실로 바꿨다. [런던=뉴스핌] 박상욱 기자=티지스트 아세파가 26일(한국시간) 2026 런던 마라톤 여자부에서 2시간 15분 41초에 결승선을 통과한 뒤 감격하고 있다. 2026.4.26 psoq1337@newspim.com 여자부에서도 세계기록이 쓰였다. 에티오피아의 티지스트 아세파가 2시간 15분 41초에 결승선을 통과했다. 지난해 같은 대회에서 자신이 작성한 2시간 15분 50초를 9초 줄인 기록이다. 여자 선수만 뛰는 레이스 기준 세계 최고 기록이 다시 한 번 교체됐다. 2위 헬렌 오비리와 3위 조이실린 제프코스게이(이상 케냐)도 각각 2시간 15분 53초, 2시간 15분 55초를 찍으며 사웨의 레이스 못지않은 하이 레벨 경쟁을 펼쳤다. 세계육상연맹은 여자 도로 레이스 기록을 '혼성 경기'와 '여자 단독 경기'로 나눠 집계한다. 남자 선수들이 페이스메이커 역할을 하는 혼성 레이스와 여자들만 뛰는 레이스의 조건이 다르기 때문이다. 혼성 마라톤 여자 세계기록은 루스 체픈게티(케냐)가 2024년 시카고 마라톤에서 작성한 2시간 09분 56초다. 이번 런던에서는 여자 단독 레이스 기록이 다시 쓰였다. 마라톤은 인간 한계를 시험하는 스포츠다. 그 종목에서 가장 단단해 보이던 벽이 무너졌다. 사웨는 레이스 뒤 "오늘 이 자리까지 오직 기록 단축만을 위해 달렸다. 인간에게 한계가 없다는 걸 보여줘 기쁘다"고 말했다. psoq1337@newspim.com 2026-04-27 07:27
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동