AIセマンティック検索は、複雑な検索式を作成しなくても、探したい技術のキーワードや文章、特許番号を入力するだけで、簡単に類似の特許を検索できます。
AIセマンティック検索の特徴は、Patentfieldに収録されている膨大な特許公報のタイトル/請求の範囲/明細書/出願人/発明者等の情報がAIによって事前に学習されています。それにより、特許公報内に出現するキーワードの意味を学習しています。
例えば、「ソーラーパネル」というキーワードは、「太陽電池パネル」や「太陽光発電パネル」と類似する意味として学習されており、「 ソーラーパネル」または「ソーラーパネル」を含む文書で検索すると、「太陽電池パネル」や「太陽光発電パネル」などが含まれる文書を検索することができます。
より詳細には、Patentfieldに収録されている公報は、AIによって関連する技術分野ごとに独自にクラスタリングされています。そのため、技術的に近い公報は同じ又は類似のクラスタに属することになります。AIセマンティック検索を実行すると、まず検索キーワードや文章等に近いクラスタを探し、技術的に近いクラスタを30個(オプション設定で変更可)抽出します。その抽出したクラスタの中から、検索キーワードに類似する上位の公報を抽出しています。そのため、技術的に近い公報が検索結果に表示されるようになります。
言葉の意味を加味してAIが検索してくれるので、検索キーワードや文章の意味に沿った結果が表示され、ユーザーの検索意図や目的に近い特許公報が上位に表示され、検索の効率化を図ることができます。
AIセマンティック検索は、日本語・英語に対応しており、例えば英語でキーワード入力した場合は、US/EP/WO(英語のみ)の文献について、類似公報を検索することができます。
なお、AIがどのようなキーワードを類似する意味として学習しているかをPatentfield内で確認することができます。「詳細検索画面」の「類似キーワード」で、キーワードを入力すると、そのキーワードと類似する意味合いをもつキーワードを検索することができます。
出願番号、公開/特許番号を入力することで、入力した特許番号に類似する特許を検索することができます。番号を入力した際には、その公報の「タイトル/要約/請求の範囲/明細書/審査官キーワード」の全文が入力されたものとみなします。
番号入力の際は、下図のような番号形式で入力すると候補となる公報番号がサジェストされますので、表示された公報を選択することで、入力が可能です。
入力サジェストの機能については、こちらをご参照ください。
公報番号で検索する際には、原則、DOCDB番号形式で入力します。DOCDB番号形式の詳細は、こちらをご参照ください。
なお、日本の公報番号については、特許庁形式(特願、特開)でも入力できます。
app_id:JP20090253196@CL
複数の公報番号を入力してAIセマンティック検索を行うこともできます。複数の公報番号を入力する場合は、下記例のように、スペースを空けて入力します。公報番号は、「app_id」「pub_id」等をつけずに、単純に番号を入力するだけでも検索が可能です。
app_id:JP20090253196 app_id:JP20100123456
JP20090253196 JP20100123456
複数の公報番号を入力した場合は、2つの公報の全文を合成した文章として、類似する特許文献を検索します。
文章又は公報番号を入力後、右クリックで「特徴語抽出」を選択すると、入力文章又は公報全文から特徴キーワードとスコアを抽出して表示させることができます。
「特徴語抽出」の横にある数字をプルダウンから選択すると、抽出する特徴キーワードの数を変更することができます。
抽出された特徴キーワード&スコアをカスタマイズして、特徴キーワードを自由に追加・削除したり、スコアの重み付けを変更することができます。
例えば、調査テーマに関係しない不要なキーワードを削除することで、検索のノイズを低減することができます。
また、スコアの数字(機能阻害剤:29.90423→50.000)を変更することで、そのキーワード(機能阻害剤)+類似キーワードが登場する公報は、検索結果の上位に表示させることができます。
https://assets.patentfield.com/static/semantic_filter.pdf
件数:セマンティック検索後の母集合の最大件数(デフォルトでは10,000件です。)
検索クラスター数:セマンティック検索する際に自動的に抽出する集合(クラスタ)数
検索ワード数:セマンティック検索する際に自動的にOR検索に使うワード数(入力した文章から抽出された特徴語を検索ワードとして利用します)
検索IPC数:セマンティック検索する際に自動的に使うIPC数(検索集合のうち件数の多い上位IPCをN件取得して検索条件に追加します)
IPC種別:自動的に使うIPCの種類(サブクラス、メイングループなど)