[지식재산 활용백서③] 특허검색 키워드와 연산자

특허뉴스 박진석 기자 | 기사입력 2019/03/26 [18:38]

[지식재산 활용백서③] 특허검색 키워드와 연산자

특허뉴스 박진석 기자 | 입력 : 2019/03/26 [18:38]

 

 

어떤 노하우를 알면 나도 특허 전문가가 될 수 있을까? 흔히 집을 지을 때 기본 뼈대가 탄탄해야 튼튼한 집이 완성되듯, 특허 분석도 기본검색 과정을 제대로 수행해야 분석 결과가 명확해 질 수 있다. 특허 리포트 전문기관 IP타깃이 발간한 보고서를 중심으로 특허 조사에 필수적인 검색 키워드와 연산자를 활용해 가장 효율적으로 검색할 수 있는 방법을 살펴본다.  <편집자> 

 

검색 키워드 및 연산자

▲ 특허 검색식 구성 예시     © 특허뉴스

 

초보자들은 특허 검색 과정부터 어려움을 느낄 수 있다. 예를 들어 ‘휴대폰’에 관한 특허분석을 수행할 때 ‘휴대폰‘이라는 단어를 입력하면 관련 특허문헌이 검색될 것으로 생각할 수도 있다. 일반적으로 보편화된 네이버나 구글 등과 같은 일반검색 DB들이 그러하듯이, 전혀 틀린 말은 아니다. 하지만, 수많은 데이터들 중 내가 찾고자 하는 문헌을 효율적으로 가려내는 것은 결코 쉬운 일이 아니다. 그래서 좀 더 자세하고 정확한 검색식과 함께 편리한 기능을 갖춘 특허 전문DB가 필요한 것이다.
간단히 설명하면, 검색식은 키워드와 검색 연산자 조합으로 구성된다. 키워드는 키워드의 동의어, 유사어, 외래어 등을 포함할 수 있고, 검색 연산자는 AND, OR 등을 말한다. 예시로 제시한 검색식은 2개의 키워드군과 검색 연산자로 구성되어 있다. 키워드1은 “초코파이, chocopie”로 외래어 동의어를 포함하고, 키워드2는 “딸기, 스트로우베리, strawberry” 로 유사어, 외래어, 동의어를 포함한다. 또한 검색 연산자로는 OR, AND를 사용하고 있다.
예시에서 보는 것은 아주 심플한 경우이며, 키워드 군에 더 많은 키워드로 동의어, 유사어 등을 포함할 수도 있다. 검색 연산자도 OR, AND 뿐만 아니라 다양한 검색 연산자를 사용하여 복잡한 검색식을 사용할 수도 있다.

 

왜 복잡한 검색식이 필요할까?


결론부터 말하면, 반드시 복잡한 검색식이 필요한 것은 아니다. 검색할 때 상황에 따라 복잡한 검색식을 넣어야만 원하는 결과 값을 유추해 낼 수도 있고, 간단한 검색식만으로 원하는 결과를 얻을 수도 있다.
하지만, 복잡한 검색식을 이용하면 사용자의 요구에 맞춰 정밀한 검색과정을 수행할 수 있다. 또한 데이터 노이즈 양을 줄이고, 시간을 절약할 수 있는 것도 장점이다. 그러나 상황에 따라 복잡한 검색식을 이용하면, 중요한 특허 문헌을 놓칠 수도 있다. 이 같은 단점은 다양한 검색식으로 극복할 수 있다.
복잡한 검색식의 구성은 (키워드1) and (키워드2) and (키워드3) 등과 같이 키워드1, 2, 3 이 and 검색연산자로 조합되어 있는 구성이다. 각 키워드1, 2, 3 은 유사어, 동의어, 외래어, 검색연산자(*, A/1, or(띄어쓰기))로 구성되어 있다.
주요 검색연산자의 기능을 살펴보자. 모든 특허 검색 DB에서 공통적으로 가장 많이 사용되는 검색 연산자는 and, or(띄어쓰기)이다. 검색 연산자 중에 “필드 검색 연산자”라는 것이 존재한다. 특허 명세서에는 발명의 명칭, 요약, 청구항, 발명의 상세한 설명 등 다양한 섹션이 구성되어 있다. 검색 효율을 높이기 위해서는 원하는 섹션만 한정해서 검색할 필요가 있기 때문에 “필드 검색 연산자”라는 요소가 필요하다. 이를 제공하지 않는 검색 DB에서는 기본적으로 항목별 검색이 가능한 검색 필드를 제공한다. 검색 연산자와 필드 연산자는 특허 검색 DB 마다 상이하게 적용되므로 사용하는 특허DB의 연산자 적용 방법을 반드시 확인해야 한다.

 

다양한 특허검색 연산자 


특허청이 무료로 제공하는 특허DB서비스인 '키프리스'는 기본적으로 AND, OR, NOT,  연산자를 이용할 수 있다. 키프리스의 경우 검색 필드는 있으나, 검색 필드 연산자는 제공되지 않는다. 검색 필드 연산자는 처음 사용하면 복잡하다 생각할 수 있으나, 어느 정도 적응이 되면, 검색 필드를 찾는 일이 더 번거롭게 되기 때문에 검색 필드 연산자의 필요성을 느끼게 된다. 또한 검색 숙력자는 본인이 주로 사용하는 필드를 이미 잘 알고 있기 때문에 필드 연산자를 기억하는 일은 크게 어려운 일이 아니다.
이에 반해 유료 특허 검색 DB들은 사용자 편의성에 초점을 맞췄기 때문에 더 다양한 검색 연산자를 제공한다. 실제로 유료 특허검색 DB중 하나인 keywert는 AND, OR, NOT 연산자 뿐만 아니라, A/n, N/n, ? 등 추가적인 검색 연산자를 제공한다. 이런 검색 연산자를 활용하면 검색 효율을 높이고, 찾고자 하는 선행문헌을 빠르게 찾을 수 있다.

 

▲ 복잡한 검색식에 포함되는 주요 검색 연산자     © 특허뉴스


검색 초보자인 경우에는 키워드 자체도 복잡한데, 굳이 검색 연산자까지 사용해야 하는 지 의문이 들 수도 있다. 하지만 검색 연산자를 사용해 특허 검색을 수행하면, 훨씬 빠르게 선행문헌을 가려낼 수 있어 검색 연산자를 사용하지 않을 수 없을 것이다.
특히, 가장 많이 사용되는 검색 연산자는 AND, OR, A/n인데, 만약 ‘A/1’라는 검색 연산자를 추가해 사용한 경우를 예로 들어보자. 검색 건수를 보면 알겠지만, A/1 검색 연산자를 이용할 경우 검색 건수가 상대적으로 크게 줄어 든 것을 확인 할 수 있다. 특히 A/1 검색 연산자의 경우, 특허 문헌 파악시, “유기”와 “발광” 사이에 단어가 1개 이하로 포함된 문헌이 검색되는 것이며, 검색 키워드에 하이라트 표시가 되기 때문에 특허 문헌 파악시 훨씬 수월하다. 그러나 “유기”와 “발광”이 AND 검색연산자로만 엮어 있는 경우, “유기”와 “발광” 단어가 포함되는 문헌이 모두 검색됨으로써 특허 문헌 파악시, A/1 검색 연산자를 사용한 경우보다 파악하기 어렵다.
“검색 연산자”와 마찬가지로 “검색 필드 연산자”도 쓰면 쓸수록 필요성이 높은 검색 요소이다. 선행 조사는 빠른 시간에 가장 유사한 선행문헌을 찾는 작업을 요구한다. 따라서 검색 필드 연산자를 사용하지 않으면, 검색 필드를 일일이 찾아 키워드를 입력해야 하는 번거로움이 생긴다. 처음에는 해당 특허 검색 DB가 제공하는 검색 연산자 및 검색 필드 연산자에 적응하는데 어려울 수 있으나, 사용하면 할수록 편의성과 효율성이 크게 높아진다. 그 결과, 어느 순간부터 검색 연산자와 검색 필드 연산자를 당연하게 사용하게 된다. 


단어의 어간을 추출하는 'stemming 검색'


검색 연산자, 검색 필드 연산자 외에도 “stemming 검색”이라는 게 있다. stemming 검색은 단어의 어간을 추출해내는 기술로, 동사 또는 형용사의 영문 원형 검색시 동일한 어간을 가진 단어가 함께 검색되는 기능이다. 예를 들면, 영문특허 검색시 US, EP, CN, PCT 국가 검색에 한에 ”stemming 검색“이 가능하며, 사용자들이 놓치는 특허 없이 결과를 확인할 수 있도록 영문특허 원형 검색시 동일 어간의 단어가 함께 검색되는 stemming 검색을 적용하고 있다. 단, 원형이 아닌 단어 검색 시에는 검색 결과의 정확도를 위해 stemming 검색이 적용되지 않는다.
“stemming 검색”이 적용되지 않는 경우, 일반적으로 reduce에 절단자(*)을 포함해 reduc*를 적용하여 검색한다. reduc*로 검색하게 되면, reduce, reduced, reducing 뿐만 아니라 reduct, reductant, reducting 등 노이즈 키워드가 더 많이 걸리게 된다.
이에 반해 “stemming 검색”을 제공하는 keywert로 reduce를 검색하면, reduce, reduced, reducing만 검색되기 때문에 검색 노이즈를 크게 줄여 준다.

 

▲ 무료 특허검색 DB “키프리스” 검색 필드     © 특허뉴스

 

선행기술 및 특허동향과 검색식


선행 기술 조사에는 발명의 목적, 효과 및 구성이 명확하기 때문에  좁은 범위의 검색을 수행한 후, 원하는 선행 문헌을 발견하지 못했을 경우 점차 검색 범위를 넓혀 가며 검색을 수행한다. 선행 기술 조사의 경우 기본적으로 발명의 명칭, 요약, 전체 청구항을 기본 검색 범위에 포함한다.
특허 동향 조사에는 기술 트랜드를 살펴보는 경우가 많아 넓은 기술  범위에서 좁은 범위로 좁혀가면서 검색하는 것이 일반적이다. 기본적으로 발명의 명칭, 요약, 독립 청구항을 기본 검색 범위에 포함한다. 분석 상황에 따라 출원인 필드, 출원일 필드를 이용하기도 한다.
이처럼 특허 조사의 종류, 성격에 따라서 사용되는 검색 연산자, 검색 필드 연산자가 달라 질 수 있으며, 검색 범위도 상황에 따라 차이가 난다. 따라서 조사자는 특허 검색 방향을 정확하게 세우고 조사를 수행해야 한다.
효율적이고 고품질의 선행조사를 수행하기 위해서는 적절한 검색 연산자를 사용해 검색을 수행하고, 정확한 결론을 도출해야 한다. 실제로 초보자들이 검색식에서 가장 많이 놓치는 것이 검색 연산자 사용 부분이다. 오랫동안 네이버나 구글 검색에 익숙해진 사람들은 검색 연산자를 어렵다고 생각할 수도 있기 때문이다. 하지만, 초보자들도 검색 연산자만 잘 사용해 효율적인 검색식을 수립하고 특허 검색을 수행하면, 전문가 못지않은 결과를 얻을 수 있다.
검색 연산자 사용으로 인한 기대 효과가 크기 때문에, 초보자들도 검색 연산자를 사용해 검색을 수행해봄으로써 특허 검색 전문가로 입문해 보길 바란다.

 

▲ 연산자 사용 여부에 따른 검색 결과 비교     © 특허뉴스
  • 도배방지 이미지

특허,특허검색,키워드,연산자,특허DB,검색식,키프리스,선행기술,특허동향 관련기사목록