"병원·은행·쇼핑몰 AI가 하나로 통했다"... KAIST, 개인정보 공유 없이 배우는 ‘연합학습 AI’ 혁신

합성데이터로 전문성과 범용성 동시 확보... 의료·금융·소셜 전 영역 협업 AI의 새 패러다임 제시

염현철 기자 | 기사입력 2025/10/15 [15:27]

"병원·은행·쇼핑몰 AI가 하나로 통했다"... KAIST, 개인정보 공유 없이 배우는 ‘연합학습 AI’ 혁신

합성데이터로 전문성과 범용성 동시 확보... 의료·금융·소셜 전 영역 협업 AI의 새 패러다임 제시

염현철 기자 | 입력 : 2025/10/15 [15:27]

▲ 연합학습(Federated Learning)은 여러 기관이 각자의 데이터를 직접 공유하지 않고 공동의 인공지능 모델을 훈련하는 분산형 학습 방식이다. 각 기관은 자신들이 보유한 로컬 데이터(기관 1, 2, 3 데이터)를 이용해 개별 AI 모델을 학습시킨다. 이후, 원본 데이터가 아닌 학습된 모델의 정보만을 안전하게 중앙으로 모아 하나의 성능이 뛰어난 ‘공동 AI 모델’을 구축한다. 이 방식은 민감한 정보의 프라이버시를 보호하면서도 다양한 데이터를 학습한 효과를 얻을 수 있다.(그림 및 섦명=KAIST)  © 특허뉴스

 

데이터는 나누지 않고, 지식만 나눈다

 

KAIST 연구진이 개인정보를 공유하지 않고도 여러 기관이 함께 AI를 학습시킬 수 있는 차세대 연합학습(Federated Learning) 기술을 개발했다.

병원, 은행, 쇼핑몰처럼 데이터를 직접 주고받을 수 없는 환경에서도 AI의 전문성과 범용성을 동시에 확보할 수 있는 기술로, 데이터 협업의 새로운 길을 열었다.

 

KAIST는 산업및시스템공학과 박찬영 교수 연구팀이 연합학습의 고질적인 문제였던 ‘지역 과적합(Local Overfitting)’을 해결하고, AI의 일반화(Generalization) 성능을 획기적으로 높이는 새로운 학습 방법을 개발했다고 밝혔다.

 

이번 연구는 인공지능 분야 최고 권위 학회 중 하나인 ICLR 2025(International Conference on Learning Representations) 에서 상위 1.8%만 선정되는 구두 발표(Oral Presentation) 로 채택되며 그 성과를 세계적으로 인정받았다.

 

‘공동 AI’의 딜레마, 데이터 없이 푼다

 

연합학습은 여러 기관이 자신의 데이터를 외부에 노출하지 않고도 공동으로 AI를 학습시키는 방식이다.

하지만 문제는 학습 후 각 기관이 자체 환경에 맞게 AI를 조정(파인튜닝)하는 과정에서 발생했다.

AI가 특정 기관의 데이터 패턴에만 적응하면서, 새로운 데이터나 다른 기관의 상황에는 성능이 급격히 저하되는 지역 과적합 문제가 나타난 것이다.

 

예를 들어 여러 은행이 공동으로 ‘대출 심사 AI’를 학습한 뒤, 특정 은행이 대기업 고객 중심으로 추가 학습을 시키면, 그 AI는 대기업엔 강하지만 개인·스타트업 대출에는 약해지는 편향된 결과를 낳는다.

 

박 교수팀은 이러한 문제를 해결하기 위해, ‘합성 데이터(Synthetic Data)’ 기반의 새로운 연합학습 알고리즘을 고안했다.

 

합성 데이터가 만든 ‘AI 균형 감각’

 

연구팀의 방법은 각 기관의 실제 데이터를 직접 공유하지 않고, 데이터의 본질적인 특징만을 추출해 가상의 합성 데이터를 생성한다.

이 합성 데이터는 개인정보를 포함하지 않으면서도, 기관별 데이터의 특성을 충분히 반영한다.

이를 연합학습 과정에 포함하면 AI는 특정 기관의 정보에 치우치지 않고 모든 기관의 특성을 고르게 학습하게 된다.

 

이 덕분에 병원, 은행, 정부기관 등 민감 데이터 환경에서도 AI가 보안을 지키며 협력 학습이 가능해졌다.

특히 연구진은 의료, 금융, 소셜미디어, 전자상거래 등 변화가 빠르고 민감한 분야에서 해당 기술이 일관된 예측 성능을 유지함을 실험으로 입증했다.

새로운 기관이 협력에 참여하거나 데이터가 급격히 바뀌어도 AI는 혼란 없이 안정적인 성능을 보였다.

 

“AI, 데이터가 아니라 ‘지식’을 공유하는 시대로”

 

박찬영 산업및시스템공학과 교수는 “이번 연구는 데이터 프라이버시를 지키면서도, 각 기관의 AI가 전문성과 범용성을 동시에 보장하는 새로운 길을 열었다”라며, “의료 AI, 금융 사기 탐지 AI처럼 데이터 협업이 필수적이지만 보안이 중요한 분야에서 큰 도움이 될 것”이라고 말했다.

 

이번 연구에는 데이터사이언스대학원 김성원 학생이 제1저자로 참여했으며, ICLR 2025 싱가포르 대회에서 세계 연구자들에게 소개될 예정이다.

 

논문명은 Subgraph Federated Learning for Local Generalization이다. 

이 기사 좋아요
  • 도배방지 이미지

KAIST, 연합학습, 개인정보보호, 합성데이터, 일반화성능, ICLR 관련기사목록
광고
광고
광고