セマンティックスコア

セマンティックスコア

セマンティックスコアは、タイトル、請求の範囲(出願時/付与時)、明細書等を機械学習で学習させた文書の特徴量により、キーワード、任意の文書または特定の特許文献の番号で類似度でスコアリングします。キーワードではなく予め学習させた単語の意味で類似度を計算するため、太陽電池とソーラーパネルといった似たような意味のキーワードが含まれる文書であれば、どちらも高い類似度になります。

セマンティック検索の機能とは違い、特許分類やキーワードで検索式を作った後の検索結果の母集団を絞り込まず類似度スコアのみが反映されます(ただし、計算量の関係上、検索結果が10万件を超える場合、類似度上位に絞り込まれます)。

探したい任意の自然文書または特定の文献から類似度が高い順にスコアリングすることにより、教師データなどを用意せずともすぐにお探しの技術内容に近い特許文献から調査することができます。

例えば、「検索エンジン」というキーワードで検索した場合、検索した母集団には、文書に含まれるキーワードの検索効率化に関するもの、画像の検索に関するもの、など様々な文献が含まれます。この母集団の中で、特に「動画検索の効率向上」に関するものを調べたい場合、セマンティックスコアの欄に「動画検索の効率向上」と入力することにより、この技術に関連する技術文献を効率的に調べることができます(検索例)。

セマンティックスコアは、詳細検索画面より設定することができます。検索方法の選択はセマンティック検索以外を選択して下さい。
















1. 特徴量セレクトメニュー
セマンティックスコアの計算対象となる特徴量を選択します。「タイトル/要約/請求の範囲/明細書/審査官キーワード」または「タイトル/要約/請求の範囲」が選択できます。特に権利範囲である請求の範囲で似ているものを効率的に調べたい場合は、「タイトル/要約/請求の範囲」を選択してください。

2. セマンティックスコア条件入力フィールド
類似度計算の条件となるキーワード、文書または特許文献の番号を入力します。番号を入力する場合、出願番号の場合、AN:JP20010123456またはapp_id:JP20010123456と入力します。公開番号の場合、PN:~またはpub_id:~、特許番号の場合、EN:~またはexam_id:~を入力します。番号は複数入力することができます。なお、このフィールドでは論理演算式は使えません。

・フィルター併用時のセマンティック検索の考え方

https://assets.patentfield.com/static/semantic_filter.pdf

    • Related Articles

    • 活用ガイド

      Patentfieldを使用した調査や分析等について、効果的な使い方や活用方法、便利な機能等について解説しています。 2値分類による関連特許の自動仕分け  研究開発テーマに関連して、先行技術調査、侵害予防調査、出願前調査、継続調査(SDI)など開発ステップの進行に応じて、継続的に特許調査を実施する場合に、AI分類予測の「2値分類」機能を使用することで、特許調査を効率化することができます。 ...
    • 類似文書検索

      類似文書検索(=AIセマンティック検索)は、複雑な検索式を作成しなくても、探したい技術のキーワードや文章、特許番号を入力するだけで、簡単に類似の特許を検索できます。 AIセマンティック検索の概要については、こちらをご確認ください。 類似文書検索でできること(例) ・キーワードや文章、公報番号での類似文章検索 ・フィルター条件(サブキーワード)からの類似文章検索 ・セマンティックスコア(類似度)による並び替え 基本操作 ...
    • 検索結果の分類設定

      検索結果に対する分類予測の設定が行えます。 1.オプション 1-1.都度更新しない 「都度更新しない」にチェックを入れると、結果一覧画面や「教師データ」タブのクエリ種別を指定して教師データの追加/削除を行っても、「編集を保存」を押さない限り教師データとモデルデータが更新されません。 教師データの数が増えた際に、1件ずつ教師データを追加すると待ち時間が長く気になる場合、チェックを入れることで1件毎の待ち時間がなくなります。 ...
    • 詳細検索画面

      詳細検索画面(Advanced search)は、以下のいずれかの方法により開くことができます。 ・ヘッダーの詳細検索ボタン ・トップページの「詳細検索&スコア設定」ボタン 詳細検索画面では、3つの検索種別(全文検索・セマンティック検索・コマンド検索)を切り替えて、日付や出願人、特許分類、リーガルステータス、中間手続きコードなど100種類以上のフィルターや集計処理、PFスコアなどが設定できます。 1. 検索種別切替 ...
    • 関連キーワード

      検索結果画面の左横に、検索結果に関連するワード(関連キーワード)が自動抽出されます。 関連キーワードは、データベース全体のレア度を考慮した特徴的なワードと頻度、文書長等に基づいて自動抽出し、一般的なワードは上位に上がりにくくなっています。 マップの集計条件で選択可能な「特徴キーワード」は、「関連キーワード」と同じロジックを用いて抽出しています。 検索結果画面における関連キーワードは、検索結果の1ページあたりの表示範囲(10件〜100件)に基づいて抽出しています。 ...