[인사이트] ‘챗GPT’의 등장으로 본 AI의 미래

특허뉴스 허재관 기자 | 기사입력 2023/03/28 [17:33]

[인사이트] ‘챗GPT’의 등장으로 본 AI의 미래

특허뉴스 허재관 기자 | 입력 : 2023/03/28 [17:33]

 

▲ 출처=freepik

 

 

미국 오픈 AI(캘리포니아주)가 제공하는 인공지능(AI) 채팅봇 GPT’가 성황이다. 살아있는 사람과 같은 자연스러운 대화나 방대한 학습 데이터에 근거하는 질의응답에 전 세계가 끓어오르고, 서비스 공개로부터 2개월 만에 이용자가 1억 명을 돌파. 게다가 문장의 생성이나 번역 등의 다채로운 기능에 대해서도 모두가 어떻게 다루는지를 잇달아 시험하고 있는 단계다. 그 앞에 보이는 것은 AI의 진화에 따른 새로운 패러다임(가치관 등의 틀)이다.

 

특허뉴스는 그간 GPT’와 관련해 특허출원, 지식재산권 쟁점, 상표출원, 저작권 관련 등 다양한 접근을 해왔다. 그렇다면 일본은 챗 GPT의 미래를 어떻게 보고 있는지 전문가들의 말을 조명해 본다.

 

GPT가 가져오는 파급효과에 대해 일본 IBM 이사인 후쿠다 고시 도쿄 기초연구소 소장은 “AI에 대한 액세스(접근) 장애물이 단번에 내려갔다. 이를 계기로 AI 활용이 폭발적으로 확산될 것 같다고 말한다. 그는 이어 인터넷의 역사에 비교하면, “미국 넷스케이프의 웹 브라우저가 등장해 누구나 인터넷에 액세스할 수 있게 된 당시(1994)를 방불케 한다라는 목소리가 많다고 전했다.

 

▲ 출처=freepik


모두가 예견하는 것은 AI의 미래 가능성이다.

해외의 거대 클라우드 벤더에서 개발 담당을 역임한 후라이 윌의 하무라 오오 이사/최고기술 책임자(CTO)는 일상생활을 비행기의 조종에 비유해 모두가 AI인생의 코파일럿(부조종사)’처럼 사용하는 시대가 올지도 모른다고 전망한다. 그는 이어 GPTAPI(응용 프로그래밍 인터페이스) 연계에 의하여, 업무 애플리케이션에서의 활용도 시작되고 있다. 사람과 IT와의 관계성에 있어서 대화 그 자체가 인터페이스가 되는 시대가 눈앞에 있다고 전했다.

 

후쿠다 이사는 “AI빅데이터(대량데이터계산파워를 엔진으로 진화를 이루고, 2010년경에는 신경망(NN)’이라 불리는 인간의 뇌 신경계를 모방한 기계 학습 알고리즘(산법)을 구사한다. ‘심층학습이 주역(主役)의 자리에 뛰어들었다다만, 사전에 컴퓨터에 정답을 가르치는 교사 학습시에, 데이터의 라벨(분류나 식별의 인식) 붙이기를 사람의 손으로 실시하기 때문에, 용도(태스크)별로 학습 데이터를 모으는 작업이 힘들었다고 전했다.

 

또한 그 후, 2017년을 기점으로 인해(人海) 전술은 잠시였고, 현재는 대량의 라벨링 없이 학습 데이터(-데이터)를 이용해 AI가 스스로 배운 자기 교사 학습이 주류를 이룬다, “ 자기 교사 학습을 이용해 대규모 AI 모델을 일단 만들면, 그것을 기반으로 용도별로 추가 학습하여, 커스터마이즈(customize)AI 모델이나 앱을 효율적으로 만들 수 있다. 추가 학습 시에는 소량의 라벨링 첨부 데이터를 준비하는 것만으로 좋다고 전했다.

 

사실, GPT 뒤에서 움직이는 오픈 AI가 개발한 대규모 언어 모델 ‘GPT3’도 기반 모델의 일종이다. 예측이나 분류에서 이용하는 학습 끝난 파라미터(가중치 등)수는 1,750억 개에 달한다. 매개 변수는 숫자가 클수록 복잡한 작업을 처리할 수 있다. 이에 하무라 CTO스포츠 선수에 비유하면, 다양한 경기를 해낼 수 있도록 높은 신체 능력을 익힌 것이 기반 모델이라며, “신체 능력이 높으면 특정 경기에서도 조금만 조정(튜닝)하면 좋은 결과를 낼 수 있다고 전했다.

 

기반 모델의 개념은 이전부터 있었지만, 실용 수준으로 끌어 올린 것은 트랜스포머라고 부르는 자연 언어 처리의 새로운 NN 모델로서, 미국 구글이 2017년에 논문으로 발표했다. 트랜스포머의 가장 큰 특징은, 문장에서 단어의 중요도에 가중치를 부여하여 문장 단어의 관련성을 포착하는 어텐션-attention 메커니즘에 있다. 비유하자면, 영어를 번역할 때, 어디에서 번역하면 좋은가를 곧바로 알 수 있는 이미지로, 긴 문장에서도 높은 성능을 발휘할 수 있다.

 

또한, 어텐션-attention 메커니즘은 병렬 처리가 가능하다. 이것에 의해, 순차적인 계산이 필수였던 자연언어 처리를 병렬화할 수 있어, 대규모의 학습을 단시간에 실시할 수 있게 되었다. 하무라 CTO비유한다면, 1명의 천재가 처리하고 있던 것을 분업할 수 있게 되었다. 이것이 트랜스포머의 논문이 가져온 기술 혁신이라며, “자연 언어 처리의 병렬화 효과는 크고, 클라우드상의 거대한 계산 파워를 사용하여 방대한 계산을 분산 환경에서 처리할 수 있다. 이것이 클라우드 벤더의 비즈니스 모델에도 히트쳤다고 전했다.

 

▲ 출처=freepik


미국 마이크로소프트(MS)는 일찍부터(재빨리) 검색 엔진 ‘Bing()’에 챗 GPT의 탑재를 결정했다. 미국 구글 등 GAFA(미국 4IT기업)도 대()책을 잇따라 내세우며 AI 플랫폼을 둘러싼 싸움 경쟁으로 불꽃이 퍼졌다.

 

기반 모델의 활용은 이미 다양한 영역으로 확산되고 있다. 기반 모델의 구축에서는 트랜스포머는 물론, 그 이외의 AI 모델이나 학습법을 조합하여 개성(특성)을 낼 수 있는 것이 묘미다.

 

일본 IBM의 후쿠다 이사는 -데이터가 있으면, 그 일부를 임의로 마스크하여, (, 으뜸,기본)을 재현하는 학습을 끊임없이 반복하면, 어느 영역에 관한 기반 모델을 만들 수 있다, “, IBM이 취급하는 것은 엔터프라이즈(기업) 데이터를 기반으로 신뢰성이 높은 기반 모델이라고 전문 분야의 깊이를 강조한다. IBM이 조준을 맞추는 것은 재료 화학 분야에서 신소재 발견 등으로 각광 받는 머티리얼스-material 인포매틱스(MI)’이다.

 

전통적인(종래의) AI 모델은 데이터를 수집하는 재료가 각기 다르기 때문에, 작업(task)별로 고유의 모델을 만든다. 그 결과, 학습한 기초 지식이 모델 간에 공유될 수 없고, 이용 가능한 데이터도 모델별로 한정된다.

 

대조적으로, 기반 모델은 다른 분야에서 수집된 데이터를 통합하여 상호 관련되는 특성을 찾아내는 등 기존의 AI 모델에서 불가능했던 것을 실현할 수 있다. 다케다 일본 IBM 도쿄기초연구소 팀 리더는 소재 재료 화학 전반에 걸친 기반 지식을 포착한 보편적이고 거대한 기반 모델을 만들어 다양한 태스크에 응용 전개/적용한다고 말한다.

 

기초(기반) 모델로서 상징되는 AI 모델은 가속도적으로 진화하여 응용 범위가 넓어지고 있다. AI가 보급되면 많은 작업이 자동화되고, 또한 의료의 진보나 교육의 본질 등에도 영향을 미친다.

 

때문에, AI 활용에 따른 윤리문제도 피할 수 없다. AI의 진화를 사회에 도움이 되도록 하기 위해서는 세계 각국이 어떻게 머리를 맞대고 중지를 모을 수 있을지를 묻고 있다.

이 기사 좋아요
  • 도배방지 이미지

챗봇,챗GPT,AI,챗chatGPT,빅데이터,오픈AI, 관련기사목록
광고