대형언어모델로 42% 향상된 추천 기술 연구 개발

염현철 기자 | 기사입력 2024/07/17 [13:29]

대형언어모델로 42% 향상된 추천 기술 연구 개발

염현철 기자 | 입력 : 2024/07/17 [13:29]

▲ 박찬영 교수 연구팀에서 개발한 모델의 개요 / 협업 필터링 모델에서 생성되는 사용자-상품 상호작용 정보와 상품 텍스트 정보를 결합하여 대형언어모델에 주입하는 방식으로 상품 추천을 진행한다. 이를 통해 기존 연구보다 빠른 학습/추론 속도를 달성하였으며, 상품 추천의 정확도를 향상시켰다.(그림 및 설명=KAIST)  © 특허뉴스


KAIST-네이버, 대형언어모델 학습 없이 사용자의 상품 소비 이력 및 상품 텍스트 정보를 활용할 수 있는 대형언어모델 기반 추천시스템 연구 개발

 

8월 데이터마이닝 분야 최고권위 국제학술대회 ‘KDD 2024’에서 발표 예정 

 

대형언어모델 기반 추천 시스템 연구에서 최신 방법 대비 최대 42% 상품 추천 성능 향상, 최대 253% 학습 속도 향상, 최대 171% 추론 속도 향상 

 

대화형 추천 시스템, 개인화 상품 상세 정보 생성 등 다양한 서비스의 등장 기대

 

최근 소셜 미디어, 전자 상거래 플랫폼 등에서 소비자의 만족도를 높이는 다양한 추천서비스를 제공하고 있다. 그 중에서도 상품의 제목 및 설명과 같은 텍스트를 주입하여 상품 추천을 제공하는 대형언어모델(Large Language Model, LLM) 기반 기술이 각광을 받고 있다. 한국 연구진이 이런 대형언어모델 기반 추천 기술의 기존 한계를 극복하고 빠르고 최상의 추천을 해주는 시스템을 개발하여 화제다.

 

KAIST는 산업및시스템공학과 박찬영 교수 연구팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering) 기반 추천 모델이 학습한 사용자의 선호에 대한 정보를 추출하고 이를 상품의 텍스트와 함께 대형언어모델에 주입해 상품 추천의 높은 정확도를 달성할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다.

 

이번 연구는 기존 연구에 비해 학습 속도에서 253% 향상, 추론 속도에서 171% 향상, 상품 추천에서 평균 12%의 성능 향상을 이뤄냈다. 특히, 사용자의 소비 이력이 제한된 퓨샷(Few-shot) 상품(사용자의 소비 이력이 풍부하지 않은 상품) 추천에서 평균 20%의 성능 향상, 다중-도메인(Cross-domain) 상품 추천에서 42%의 성능 향상을 이뤄냈다. 다중-도메인 상품 추천은 타 도메인에서 학습된 모델을 활용하여 추가학습없이 현재 도메인에서 추천을 수행한다. 예를 들어, 의류 도메인에 추천 모델을 학습한 뒤, 도서 도메인에서 추천을 수행하는 상황을 일컫는다.

 

기존 대형언어모델을 활용한 추천 기술들은 사용자가 소비한 상품 이름들을 단순히 텍스트 형태로 나열해 대형언어모델에 주입하는 방식으로 추천을 진행했다. 예를 들어 ‘사용자가 영화 극한직업, 범죄도시1, 범죄도시2를 보았을 때 다음으로 시청할 영화는 무엇인가?’라고 대형언어모델에 질문하는 방식이었다. 

 

이에 반해, 연구팀이 착안한 점은 상품 제목 및 설명과 같은 텍스트뿐 아니라 협업 필터링 지식, 즉, 사용자와 비슷한 상품을 소비한 다른 사용자들에 대한 정보가 정확한 상품 추천에 중요한 역할을 한다는 점이었다. 하지만, 이러한 정보를 단순히 텍스트화하기에는 한계가 존재한다. 이에 따라, 연구팀은 미리 학습된 협업 필터링 기반 추천 모델로부터 사용자의 선호에 대한 정보를 추출하고 이를 대형언어모델이 이해할 수 있도록 변환하는 경량화된 신경망을 도입했다. 

 

연구팀이 개발한 기술의 특징으로는 대형언어모델의 추가적인 학습이 필요하지 않다는 점이다. 기존 연구들은 상품 추천을 목적으로 학습되지 않은 대형언어모델이 상품 추천이 가능하게 하도록 대형언어모델을 파인튜닝(Fine-tuning/사전 학습된 대규모 언어모델을 특정 작업이나 데이터셋에 맞게 최적화하는 과정)하는 방법을 사용했다. 하지만, 이는 학습과 추론에 드는 시간을 급격히 증가시키므로 실제 서비스에서 대형언어모델을 추천에 활용하는 것에 큰 걸림돌이 된다. 이에 반해, 연구팀은 대형언어모델의 직접적인 학습 대신 경량화된 신경망의 학습을 통해 대형언어모델이 사용자의 선호를 이해할 수 있도록 했고, 이에 따라 기존 연구보다 빠른 학습 및 추론 속도를 달성했다.

 

연구팀을 지도한 박찬영 교수는 “제안한 기술은 대형언어모델을 추천 문제에 해결하려는 기존 연구들이 간과한 사용자-상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 대형언어모델에 전달하는 새로운 방법으로 이는 대화형 추천 시스템이나 개인화 상품 정보 생성 등 다양한 고도화된 추천 서비스를 등장시킬 수 있을 것이며, 추천 도메인에 국한되지 않고 이미지, 텍스트, 사용자-상품 상호작용 정보를 모두 사용하는 진정한 멀티모달 추천 방법론으로 나아갈 수 있을 것”이라고 말했다.

 

KAIST 산업및시스템공학과 김세인 박사과정 학생과 KAIST 전산학부 강홍석 학사과정(졸) 학생이 공동 제1 저자, 네이버의 김동현 박사, 양민철 박사가 공동 저자, KAIST 산업및시스템공학과의 박찬영 교수가 교신저자로 참여한 이번 연구는 데이터마이닝 최고권위 국제학술대회인 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024)’에서 올 8월 발표할 예정이다. 

 

논문명은 Large Language Models meet Collaborative Filtering: An Efficient All-round LLM-based Recommender System 이다. 

이 기사 좋아요
  • 도배방지 이미지

대형언어모델,대화형추천시스템,네이버,KAIST, 관련기사목록
광고
광고