전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 중기·벤처

속보

더보기

네이버 검색, 자연어처리 분야 글로벌 최정상 학회서 논문 채택

기사입력 : 2024년10월18일 09:25

최종수정 : 2024년10월18일 09:25

[서울=뉴스핌] 송은정 기자 =네이버가 세계 최고 권위 자연어처리(NLP, Natural Language Processing)학회인 'EMNLP(Empirical Methods in Natural Language Processing) 2024'에서 검색 기술 관련 정규 논문이 채택되는 성과를 거두며 글로벌 수준의 검색 연구 역량을 입증했다.

네이버 로고. [사진=네이버]

올해로 28회차를 맞은 EMNLP는 NAACL(Annual Conference of the North American Chapter of the Association for Computational Linguistics)', ACL(Association for Computational Linguistics)과 함께 자연어처리 분야에서 글로벌 최고 AI 학회로 꼽힌다. AI 번역, 챗봇, 기계 독해 등 언어 데이터 기반 자연어처리 접근법에 대한 다양한 연구를 다룬다. EMNLP 2024는 오는 11월12일부터 16일까지 미국 플로리다에서 진행된다. 네이버는 이 자리에서 검색 기술 관련 연구를 포함해 채택된 논문 4건을 발표할 예정이다.

특히 네이버는 이번 연구 성과를 실제 네이버 검색 서비스에 직간접적으로 활용해 검색 품질과 사용성을 높이는 등 서비스 가치 창출과 연구의 실효성 측면에서 의미를 더했다.

먼저, 네이버 생성형 AI 검색 서비스인 '큐(CUE):'에 적용된 알고리즘에 대한 연구 논문이 채택됐다. 해당 연구는 SLM(Small Language Model)을 사용하는 모듈식 접근법을 통해, 유해 질의를 탐지하고 적절한 답변을 제공할 수 있는 학습 메커니즘을 다룬 연구이다. 네이버는 연구 성과를 지난 해 11월 큐:에 적용해 AI 안정성을 강화하는데 활용하고 있다. 예를 들어, 범죄·유해 등 불법정보나, 저작권법 및 사생활 침해, 개인정보유출, 욕설·비속어 등과 관련한 질의를 판별해 무분별한 답변이 제공되지 않도록 안전한 생성형 AI 검색 환경을 구축하고 있다. 

네이버는 향후 해당 기술을 활용해 질의와 검색 결과의 적합성 판단력을 높여 고품질 콘텐츠 노출을 확대하고, 신뢰도 높은 출처의 답변을 상단에 노출할 수 있도록 검색 서비스 전반의 품질을 강화하는데 활용할 예정이다.

또한 네이버는 통합검색 결과 상단에 검색어와 연관된 주요 정보를 요약해서 제공하는 '지식스니펫' 서비스에서 정보를 추출할 때, 텍스트 뿐 만 아니라 리스트, 테이블 등 복잡한 형태의 스니펫(정보)까지 AI가 효과적으로 처리하는 기술을 제안했다. 해당 기술은 내년 상반기 지식스니펫 적용을 목표로 하고 있다. 롱테일 질의(길고 복잡한 검색어)에도 정확히 답변하는 비율을 높여 사용자가 원하는 정보를 빠르게 확인할 수 있도록 성능을 높이는데 기여할 예정이다.

아울러, LLM(초거대 생성형 언어모델, Large Language Model)의 문서 랭킹 능력을 sLLM(작은 생성형 언어모델, Small Large Language Model)에 이식시켜 검색 서비스에 적용하는 방법에 관한 논문도 채택됐다. 사용자가 원하는 결과를 실시간으로 제공해야 하는 검색 서비스에서 속도 저하 없이도 LLM 만큼 품질을 낼 수 있는 기술을 고안해 제안한 것이다. 네이버는 논문에서 소개된 모델을 지난 6월 통합검색 서비스에 적용해 롱테일 질의의 맥락에 더 적합한 문서를 결과로 제공할 수 있게 됐다. 기술 적용 후 문서 클릭률(CTR)이 4.3%, 체류시간이 3% 증가하는 등의 효과를 거두기도 했다.

이 밖에도, 네이버 검색은 올해 EMNLP와 더불어 세계 최고 자연어처리 학회로 꼽히는 NAACL(1건), 세계 최고 AI 학회 CVPR(2건)을 포함해 Information Sciences(1건), LREC-COLING(1건), SIGIR/LLM4Eval(1건) 등 세계 유수 AI 학회에 검색 기술 관련 논문을 등재했다. 또 올해로 36회를 맞이한 국내 최고 권위의 HCLT(한글 및 한국어 정보처리 학술대회)에서도 7개 논문이 채택됐다. 이 중 2건은 우수 논문으로 선정되는 등 수준 높은 검색 기술력을 입증하고 있다.  

김광현 네이버 검색·데이터 플랫폼 부문장은 "이번 연구를 통해 국내 검색 시장을 선도해온 네이버의 검색 기술을 세계 무대에서도 인정받은 것"이라며 "앞으로도 개선된 검색 정확도와 생성형 AI 실험을 바탕으로 사용자들에게 최적화된 검색 결과를 제공할 수 있는 경쟁력 있는 검색 서비스를 지속 선보일 것"이라고 밝혔다.

한편 네이버는 최근 다변화되는 사용자의 검색 니즈에 대응하기 위해 강화된 컴퓨팅 파워를 기반으로 웹 검색 색인 규모를 50% 확대하고 신뢰도 높은 콘텐츠를 AI 기반으로 강조하는 등 기술과 인프라를 지속 고도화하고 있다. 지난 8월에는 신뢰도 높은 문서에 대한 기계 학습 방법을 보다 정교화 하고 문서 출처의 신뢰도와 전문성을 판단하기 위한 랭킹 학습 방법을 개선한 바 있다. 

yuniya@newspim.com

[뉴스핌 베스트 기사]

사진
김수현 "故김새론, 미성년땐 사귀지 않아" [서울=뉴스핌] 정일구 기자 = 미성년자였던 고(故) 김새론과 교제했다는 의혹을 받는 배우 김수현이 31일 오후 서울 마포구 스탠포드호텔에서 열린 긴급 기자회견에서 입장 밝히며 눈물을 흘리고 있다. 2025.03.31 mironj19@newspim.com   2025-03-31 17:43
사진
김효주 "아직도 할 수 있는 선수 증명" [서울=뉴스핌] 김용석 기자 = "LPGA에서 17개월 만에 우승을 차지해 기쁘다." 김효주(30)가 미국여자프로골프(LPGA) 투어에서 통산 7번째 우승 트로피를 들어 올렸다. 김효주는 31일(한국시간) 미국 애리조나주 챈들러의 월윈드골프클럽에서 열린 포드 챔피언십 최종일, 연장전 끝에 릴리아 부를 꺾고 우승을 차지했다. [서울=뉴스핌] 김용석 기자 = LPGA 통산 7승을 수확한 김효주. [사진= LPGA] 2025.03.31 fineview@newspim.com 역전 우승이다. 3라운드까지 릴리아 부에게 4타 뒤진 공동5위로 출발한 김효주는 대회 마지막 날인 4라운드에서 버디 9개, 보기 1개로 무려 8타를 줄였다. 릴리아 부와 나란히 최종합계 22언더파 266타로 동타를 이룬 김효주는 연장전이 벌어진 18번 홀(파4)에서 1.5m 거리의 버디 퍼트를 성공시켜 승리를 확정지었다. LPGA 통산7승이다. 2015년과 2016년 각각 1승씩을 올린 그는 2021년 HSBC 위민스 월드 챔피언십, 2022년 롯데 챔피언십, 2023년 볼룬티어스 오브 아메리카스 클래식 등에서 6승을 수확한 뒤 1년5개월만에 다시 정상에 올랐다. 김효주는 매니지먼트사 지애드스포츠를 통해 "오늘 마지막까지 집중한 것이 중요했다"고 밝혔다. "작년 겨울 전지훈련에서 열심히 훈련하며 몸 상태를 끌어올리기 위해 노력했기 때문에 이번 대회에서도 좋은 샷감을 기대할 수 있었다"고 말했다. 파이널 라운드에서도 집중을 잃지 않기 위해 노력했다는 그는, "그 결과 좋은 성과로 이어져서 정말 감사한 마음"이라고 기쁨을 전했다. 이번 대회에서는 새로운 샤프트와 퍼터를 사용한 것이 주효했다는 김효주는 "좋은 샷감과 함께 시너지 효과가 난 덕분에 우승까지 할 수 있었다"고 말했다. 특히 LPGA에서 17개월 만에 우승을 차지한 그는 "아직도 내가 할 수 있는 선수라는 것을 증명해 너무 뿌듯하다"며 언제나 응원해주시는 팬들에게 진심으로 감사의 인사를 전했다. 이번 우승은 김아림에 이어 한국 선수로는 올해 두 번째 LPGA 투어 우승이다. 김효주는 "올 시즌, 한국 선수들의 상승 흐름에 좋은 기폭제가 되었으면 한다"고 덧붙였다. fineview@newspim.com 2025-03-31 14:44
안다쇼핑
`
Top으로 이동