Patent Data for AI Patent Analytics

Artificial Intelligence: Terminator is far from reality

AI 특허 분석 솔루션은 불가피하다

Garbage In, Garbage Out – 데이터 품질의 중요한 역할

 “Generative AI 는 지금까지 만들어진 가장 강력한 창의성 도구입니다. 인류 혁신의 새로운 시대를 열 잠재력이 있습니다.  ” Elon Musk

생성형 AI 의 과대광고는 이해하기 쉽습니다.컴퓨터와의 대화입니다. 기술 개발의 다음 단계보다 더 쉽고 더 명백한 것은 무엇일까요? 과대광고의 문제점은 단어에서 알 수 있듯이 일반적으로 제공되거나 경험되는 것 이상으로 기대치를 높인다는 것입니다. 이는Gartner가 만들어낸 용어를 활용하여 ‘환멸의 골짜기(Trough of Disillusionment)’ 로 이어지는 경향이 있습니다.

이 AI 롤러코스터가 만들어내는 혼란을 완화하기 위해 IP업계에서 AI 시스템을 성공적으로 개발하고 배포하는 데 필요한 기본 구성 요소를 이해하는 것이 중요합니다. 이는 데이터와 데이터 품질로 시작됩니다.

AI 특허 분석 툴의 개발에서 학습 데이터의 중요성

AI를 활용하는 모든 애플리케이션은 입력 데이터의 품질에 따라 달라집니다. 입력 데이터가 좋지 않으면 출력이 좋지 않을 것은 분명하지만, 이 기본 규칙을 현재 쉽게 사용할 수 있는 수많은 AI 솔루션에 적용하는 것은 더 어렵습니다. 기계 번역의 일반적인 예부터 시작한다면, 한 언어로 소스 텍스트를 입력하고, 다른 언어로 대상 텍스트를 출력합니다. 사용가능한 다양한 알고리즘의 품질에는 상당한 차이가 있습니다. 이러한 차이 중 일부는 알고리즘이 어떻게 (그리고 언제) 학습되었는지에 기인할 수 있고, 다른 일부는 배포된 기술에 따라 달라집니다. 이 아티클에서는Microsoft 와Google 번역 알고리즘을 비교하고, 비교의 여러가지 다양한 차원을 하이라이트합니다. 스코어카드는 길고 상황에 따라 다양합니다. 예를 들어, 음성에 대답하는데 필요한지 아니면 사용자가 지정해야 하는지 등.  

지적재산에 이 모든 것을 적용하기 전에, AI 기술에 대해 말해보겠습니다. AI의 개발은Turing (1950) 이전으로 거슬러 올라갑니다.  여기에는 비지도 및 지도형 머신러닝과 지금의 생성형 AI를 포함한 여러가지 유형이 있습니다. 생성형 AI에만 포커스를 두더라도, 선택할 수 있는 대규로 언어 모델  (LLMs)이 많으며 이들은 근본적으로 다른 기능을 갖추고 있습니다. 예를 들어,  Statista 2023 순위에서 Claude 3 Opus (Anthropic) 는 수학 문제를 푸는 능력에서60.1% 을 기록한 반면Gemini Pro (Google)는 32.6%를 기록했습니다 (개선된 Gemini 1.5 Pro는 58.5%를 기록함) . 만약 해결하려는 문제에 숫자가 포함되지 않으면, 이중 어느것도 중요하지 않습니다.



문제에 맞는 올바른  AI 특허분석 접근 방식 선택

그렇다면 Elon Musk 가 GenAI가 인류 혁신의 새로운 시대를 열 잠재력이 있다고 말했을 때, 이는 IP 업계에 어떤 의미가 있을까요? 답은 여러가지 입니다. R&D 팀의 핵심에 있는 혁신가에게 있어 이는 프로젝트를 가속화하거나 새로운 조사 방향을 자극할 수 있습니다. 특허 전문가에게 있어 이는 특허 초안 작성을 자동화하거나 특허 심사관 앞에서 특허 출원을 처리하는 행정적 부담을 줄이는 것이 될 수 있습니다.  

지난 10년동안, LexisNexis Intellectual Property Solutions는 특허 권리와 관련된 리스크와 가치의 핵심을 짚어내는 매우 구체적인 전략적 질문에 집중해 왔습니다. 이는 다음을 포함합니다:

이 개요는 광범위하고 다양한 IP 기회에 대한 불공평한 설명입니다. 하지만 여기에 도전과제가 있습니다: 과대 광고로 돌아갑니다. 모두가 더 많은 AI를 요구하고 있지만, 그들이 생각하는 것은 더 큰 효율성입니다. IP 전문가에게 이는 오늘날 채택된 접근 방식보다 더 좋고, 더 빠르고, 더 저렴한(소위 철의 삼각형) 솔루션을 제공하는 것을 의미합니다. AI 세계에서 이 삼각형은 신뢰와 투명성과 같은 새로운 차원을 얻습니다.

데이터 품질

이러한 많은 난제에 대한 답은 기본으로 돌아가야 합니다. 이는 특허 분석을 참고하면 설명할 수 있습니다. 믿기 어려울 정도로 들리겠지만, 특허를 디지털로 검색할 수 있는 능력은 1998년(Delphion)에야 시작되었습니다. 2006년(Google Patents 출시)에는 특허 데이터가 널리 퍼져 과학 정보의 필수 소스로 인식되었습니다. 오늘날에는 수십 개의 독점 특허 데이터 제품이 있으며, 국가(예: USPTO) 및 국제 특허청(예: EPO의 Espacenet)에서 제공하는 서비스를 포함하면 그보다 더 많은 경우가 많습니다. 적절한 특허 분석 소스를 선택한다는 것은 중요한 것에 집중하는 것을 의미합니다 :

  • 정확성 – 특허 데이터는 지저분하며, 국가 특허청에서 공개 데이터에 액세스하는 것은 무료일 수 있지만 종종 깨끗하지 않습니다. 여기서 가장 흔한 문제는 소유권으로, 같은 그룹의 구성원이 소유한 특허를 그룹화하려는 시도가 없습니다. 특허를 현재 소유자에게 귀속시킬 수 없다면 모든 것이 사라집니다.
  • 완결성 – 이것의 중요한 측면은 특허 패밀리의 개념으로, 동일한 발명과 관련하여 여러 관할권에 제출된 특허가 하나의 발명으로 처리됩니다. 이것의 또 다른 중요한 측면은 글로벌 적용 범위입니다.
  • 접근성 – 특허 분석은 원래 특허 포트폴리오를 구축하는 데 관여하는 특허 전문가에게만 관심사였습니다. 오늘날에는 속도와 활용이 훨씬 더 중요해진 비 IP 팀에 의한 수요가 증가되었니다.

다른 부가가치 정보로 특허 데이터 증강

특허 데이터의 중요성이 계속 커짐에 따라 특허 데이터만으로는 종종 충분하지 않다는 것이 점점 더 분명해졌습니다. 특허 분석의 전략적 사용 사례 중 일부를 다시 살펴보겠습니다:

  • 품질 – Patent Asset Index와 같은 주요 특허 평가 알고리즘 중 다수는 다양한 규모의 국가에서 특허권의 상대적 중요성을 조정하기 위해 인용 데이터와 국민 총소득(GNI) 데이터를 모두 사용합니다.
  • 리스크 – 특허 소송은 특허 리스크의 좋은 지표이며, 이 데이터는 통합되고 정렬되어야 합니다.
  • 기술 – 기업은 기술 동향을 고려하고 해당 관점을 통해 특허를 분석하는 능력이 필수적입니다.
  • SEPs – SEP로 선언된 특허 데이터베이스가 있지만 이 데이터는 관련 표준에 대한 매핑으로 향상될 수 있습니다.

요약하자면, AI가 중요하지만 출발점은 WHY입니다. 해결하려는 문제를 알고 있다면 이것이 필요한 데이터에 대한 가이드가 될 수 있습니다. 특허 분야에서 모든 데이터가 동일한 것은 아닙니다. 표면적으로 동일한 데이터 세트를 다루는 경우에도 품질에 집중하세요. 불완전하거나 부정확한 데이터 세트를 사용하는 경우 AI는 아무런 도움이 되지 않습니다. 특허 분석의 세계에서 “rubbish-in”은 항상 하나의 잘못된 결과만 낳습니다. 이는 데이터를 수동으로 검토하든 GenAI의 최신 기술을 사용하든 마찬가지입니다.

About Nigel

Nigel Swycher is co-founder and CEO of LexisNexis Cipher – His background is in in law, where he led the IP practice at leading law firm Slaughter and May.

For many years, the IAM 300 has recognized Nigel as a leader in IP strategy.

Join the AI-Insider program to shape the future of AI in IP Solutions

Members of the PatentSight+ AI-Insider program will lead the advancement of artificial intelligence in intellectual property and help revolutionize the way high-value strategic insights can be gained from
AI-powered IP search and analytics.

AI-Insider_Program
  • Exclusive Access: Get early access to information on our latest AI products.
  • Early insights: Shape the future of AI solutions by feedback in focus groups.
  • Be on the Inside Track: Gain privileged access to resources, events, and updates.

이 게시물이 도움이 되었나요?