AIセマンティック検索

AIセマンティック検索

概要

AIセマンティック検索は、複雑な検索式を作成しなくても、探したい技術のキーワードや文章、特許番号を入力するだけで、簡単に類似の特許を検索できます。

AIセマンティック検索の特徴は、Patentfieldに収録されている膨大な特許公報のタイトル/請求の範囲/明細書/出願人/発明者等の情報がAIによって事前に学習されています。それにより、特許公報内に出現するキーワードの意味を学習しています。

 例えば、「ソーラーパネル」というキーワードは、「太陽電池パネル」や「太陽光発電パネル」と類似する意味として学習されており、「 ソーラーパネル」または「ソーラーパネル」を含む文書で検索すると、「太陽電池パネル」や「太陽光発電パネル」などが含まれる文書を検索することができます。

より詳細には、Patentfieldに収録されている公報は、AIによって関連する技術分野ごとに独自にクラスタリングされています。そのため、技術的に近い公報は同じ又は類似のクラスタに属することになります。AIセマンティック検索を実行すると、まず検索キーワードや文章等に近いクラスタを探し、技術的に近いクラスタを30個(オプション設定で変更可)抽出します。その抽出したクラスタの中から、検索キーワードに類似する上位の公報を抽出しています。そのため、技術的に近い公報が検索結果に表示されるようになります。

言葉の意味を加味してAIが検索してくれるので、検索キーワードや文章の意味に沿った結果が表示され、ユーザーの検索意図や目的に近い特許公報が上位に表示され、検索の効率化を図ることができます。

海外文献のセマンティック検索

AIセマンティック検索は、日本語・英語に対応しており、例えば英語でキーワード入力した場合は、US/EP/WO(英語のみ)の文献について、類似公報を検索することができます。

日本語のキーワードや、日本語で記載された公報番号(JP/WO)を入力した場合は、日本語公報しかヒットしません。
英語のキーワードや、英語で記載された公報番号(US/EP/WO)を入力した場合は、英語公報しかヒットしません。

操作方法

AIセマンティック検索の操作方法は、こちらをご参照ください。
AIセマンティック検索のポイントや検索のコツについては、こちらをご参照ください。

類似キーワードの検索

なお、AIがどのようなキーワードを類似する意味として学習しているかをPatentfield内で確認することができます。「詳細検索画面」の「類似キーワード」で、キーワードを入力すると、そのキーワードと類似する意味合いをもつキーワードを検索することができます。




公報番号によるAIセマンティック検索

出願番号、公開/特許番号を入力することで、入力した特許番号に類似する特許を検索することができます。番号を入力した際には、その公報の「タイトル/要約/請求の範囲/明細書/審査官キーワード」の全文が入力されたものとみなします。

番号入力の際は、下図のような番号形式で入力すると候補となる公報番号がサジェストされますので、表示された公報を選択することで、入力が可能です。
入力サジェストの機能については、こちらをご参照ください。

なお、公報番号で検索する際には、下記2パターンの入力方法に対応しています。

JP201000012345  #公報番号のみを入力
app_id:JP201000012345  #app_id:で指定する

なお、番号の後に@CLをつけることにより、入力した公報番号の「請求の範囲」と類似する文献を検索することもできます。比較対象は、選択した対象特徴量により公報のどの部分と比較するかが変わります。詳細は、上部スライドのP5を参照ください。

app_id:JP20090253196@CL


複数の公報番号を入力した検索方法

複数の公報番号を入力してAIセマンティック検索を行うこともできます。複数の公報番号を入力する場合は、下記例のように、スペースを空けて入力します。公報番号は、「app_id」「pub_id」等をつけずに、単純に番号を入力するだけでも検索が可能です。

app_id:JP20090253196 app_id:JP20100123456
JP20090253196 JP20100123456

複数の公報番号を入力した場合は、2つの公報の全文を合成した文章として、類似する特許文献を検索します。

特徴語抽出

文章又は公報番号を入力後、右クリックで「特徴語抽出」を選択すると、入力文章又は公報全文から特徴キーワードとスコアを抽出して表示させることができます。
「特徴語抽出」の横にある数字をプルダウンから選択すると、抽出する特徴キーワードの数を変更することができます。

抽出された特徴キーワード&スコアをカスタマイズして、特徴キーワードを自由に追加・削除したり、スコアの重み付けを変更することができます。
例えば、調査テーマに関係しない不要なキーワードを削除することで、検索のノイズを低減することができます。
また、スコアの数字(機能阻害剤:29.90423→50.000)を変更することで、そのキーワード(機能阻害剤)+類似キーワードが登場する公報は、検索結果の上位に表示させることができます。

スコアの数字を変更する際には、検索クエリにおける他のキーワードのスコアとの相対的な関係で重みを設定します。
例えば、下図では、SPAST:36.78354が最もスコアが高いですが、機能阻害剤のスコアを50とすることで、SPASTより重要度を高く(重みを高く)して検索できます。


サブキーワード

AIセマンティック検索の検索結果で、類似概念を広くとらえすぎていてノイズが多いと感じる場合は、下図の赤枠内のフィールドに、文書に現れるキーワードを補助的に追加して下さい。
サブキーワードのフィールドにキーワードを入力すると、まず「サブキーワードに入力されたキーワード」で全文検索が実行されて、全文中にそのキーワードが含まれる母集合が作成され、その母集合の中でセマンティック検索が実行されます。


フィルター(詳細)内でのAIセマンティック検索

詳細検索画面の「フィルター(詳細)」で、セマンティック検索のフィルターを追加することもできます。フィルター内でのセマンティック検索により、全文検索コマンド検索結果で絞り込んだ母集合に対し、セマンティック検索の類似度順でソートすることもできます。

AIセマンティック検索とフィルター(詳細)を併用して使用する場合は、入力フィールドによって、論理演算の優先順位がありますのでご注意ください。優先順位の適用によって、想定している検索結果にならない可能性があります。詳細については、こちらをご参照ください。
 
フィルター併用時のセマンティック検索の考え方

https://assets.patentfield.com/static/semantic_filter.pdf

セマンティック検索オプション

件数:セマンティック検索後の母集合の最大件数(デフォルトでは10,000件です。)
検索クラスター数:セマンティック検索する際に自動的に抽出する集合(クラスタ)数
検索ワード数:セマンティック検索する際に自動的にOR検索に使うワード数(入力した文章から抽出された特徴語を検索ワードとして利用します)
検索IPC数:セマンティック検索する際に自動的に使うIPC数
IPC種別:自動的に使うIPCの種類(サブクラス、メイングループなど)









    • Related Articles

    • AIセマンティック検索の検索結果に対して、さらにフィルターをかけたい

      セマンティック検索モードでは、複数の入力フィールドの適用優先順位があり、「1.サブキーワード>2.フィルター(詳細)>3.検索入力フィールド」の順になっています。 そのため、下記図の入力例では、まず2.フィルタ「公開日2020-04-15以下」が適用され、そのフィルター条件の中でセマンティック検索が実行されます。 ...
    • AIセマンティック検索結果のハイライト表示

      AIセマンティック検索の検索結果で、ハイライトが表示されます。 AIセマンティック検索では、入力した文章・公報番号に対して、類似度の高い公報を検索することができます。 ハイライトでは、入力した文章・公報番号に対して、どのワードに反応してヒットしているのか、AIの検索結果を視覚的に把握することができます。 ハイライトの設定変更 詳細検索画面の「セマンティック検索オプションの表示」をクリックすると、セマンティック検索時のオプション設定欄が表示されます。 ...
    • プレ調査(事前調査/予備調査/サンプル抽出)のためのAIセマンティック検索

      概要 特許出願前調査や侵害防止調査(クリアランス調査)などの本格的な特許調査や外部に調査依頼を行うにあたって、 「あたりをつける」ために、まず自分でプレ調査(企業によって様々な呼び方がありますが、事前調査/予備調査/サンプル抽出/etc)を行うことがあると思います。 このプレ調査で、サンプルとなる公報2、3件を抽出して、本格調査での検索式を作成したり、外部に調査を依頼するにあたって調査観点や調査内容を伝えやすくなります。 開発者や研究者が、自身が開発した製品や発明のプレ調査を行うことも重要です。 ...
    • AIセマンティック検索で関連性の高い特許に絞り込んでいく方法

      AIセマンティック検索は、原則10,000件ヒットするようになっています。 AIセマンティック検索の検索結果に対して、特許分類やキーワードを組み合わせることで、関連性の高い特許に件数を絞り込みできますが、適切な特許分類を選定する、関連キーワードを漏れなく抽出するには専門的な知識が必要だったり、時間がかかります。 専門知識がなくとも時間をかけずに効率的に、特許分類の選定や関連キーワードを抽出する方法について解説します。 【対象】 特許検索に不慣れな方 特許出願前に効率よく先行文献を調査したい方 ...
    • マップ操作によるフィルタリング

      マップ操作によるフィルタリング方法 マップを作成して、下図のようにマップ分析で得られたバブルチャートのバブル「3」(下図赤枠内)をクリックすると、当該クリックした条件でフィルターがかかり、バブルで表示されている当該3件だけが検索結果にヒットします。 AIセマンティック検索でのフィルタリング方法 AIセマンティック検索で上記方法でフィルタリングすると、3件ではなく、下図のように想定していない2165件がヒットします。 ...