特徴キーワードを利用した用途探索方法

特徴キーワードを利用した用途探索方法

Patentfieldの機能のひとつである特徴キーワードは、各公報内のテキストから特徴的なキーワードを抽出して表示等ができます。
この特徴キーワードを利用した技術の用途探索手法について解説します。



1.探索したい技術テーマのキーワードで検索を実行します。

今回の事例では、「グルタチオン」をテーマに検索します。



特許検索になれている方は、詳細検索のフィルター(詳細)等で、検索条件を設定ください。

2.検索結果画面の左下「関連キーワード」の赤枠部分をクリックします。




3.ポップアップで表示された「関連キーワード」の対象特徴量を「技術分野(JP)」を選択します。




関連キーワードに表示されているキーワードのリストは、検索結果の母集団51,354件のすべての公報から抽出された「特徴キーワード」が200個表示されています。
キーワード横にあるスコア(治療 103560.84)は、特徴スコアの合算値です。特徴スコアが高いほど、母集団のすべての公報において、頻度が高く登場していて、かつ特徴的であることを表します。
(グルタチオン関連の特許出願には、「治療」というキーワードがよく使用されていることを意味し、治療用途としてグルタチオンが利用されている可能性が高いことを示唆しています。)

特徴スコアは、各公報が持つ特徴キーワードの特徴スコア(治療 13.96)を指します。
関連キーワードのリストの表示されている特徴スコア(治療 103560.84)は、母集団51,354件の公報に登場する特徴キーワード「治療」の特徴スコアをすべて合算した値です。



対象特徴量は、公報の明細書/要約/特許請求の範囲のうち、どの部分から特徴キーワードを抽出するか指定できます。選択可能な、対象特徴量はこちらをご参照ください。
対象特徴量「技術分野(JP)」は、明細書の【技術分野】の項目だけから特徴キーワードを抽出します。
技術分野は、その発明の属する技術分野が端的に記載されているため、冗長なキーワードを省いて、どういう分野で探索テーマの技術(グルタチオン)が利用されているのかを把握できます。

「取得ワード総数(最大:1000)」は、関連キーワードのリストで抽出する特徴キーワードの数を増減できます。デフォルトは、200です。
取得数を増やすほど、レアな用途の探索にも活用できますが、関連性の低いワードも抽出されますので、ご注意ください。
用途探索では、取得ワード数が多いほど、用途関連のキーワードを発見できる可能性があるので、1000に設定するのがお勧めです。

「文献毎抽出ワード数(最大:200)」は、各文献から抽出する特徴キーワードの数を増減できます。デフォルトは、50です。
抽出数を増やすほど、レアなキーワードを抽出できる可能性がありますが、特徴スコアが低いキーワードも抽出されるため、ノイズのキーワードが増加します。

4.抽出されたリストの中から気になる用途関連のキーワードを選択します。




キーワードを1回クリックすると、青色のマークがつきます。青色のマークがついた状態で、関連キーワードのポップアップ画面を削除して、検索結果画面に戻り、詳細検索画面を開きます。
検索条件のフィルター(詳細)に、さきほど選択したキーワードが追加されています。この状態で、「検索」を実行すると、グルタチオン関連で「美白剤」というキーワードが含まれている特許に絞りこんで検索ができます。



絞り込んだ検索結果3722件がヒットしたので、実際に公報の内容を確認することで、グルタチオンを美白剤として、どのように使用しているのか把握できます。


ヒットした検索が多くて全部見れない場合は、詳細検索画面に戻り、フィルター(詳細)のフィルター条件を「特徴キーワード(JP:技術分野)」に変更して、検索を実行します。


検索結果が220件まで減りました。


前の検索結果に戻る場合は、画面左上の矢印マークで、1つ前の操作に戻ることができます。



以上の手順により、特徴キーワードを使用して用途探索に活用することができます。

    • Related Articles

    • 関連キーワード

      検索結果画面の左横に、検索結果に関連するワード(関連キーワード)が自動抽出されます。 関連キーワードは、データベース全体のレア度を考慮した特徴的なワードと頻度、文書長等に基づいて自動抽出し、一般的なワードは上位に上がりにくくなっています。 マップの集計条件で選択可能な「特徴キーワード」は、「関連キーワード」と同じロジックを用いて抽出しています。 検索結果画面における関連キーワードは、検索結果の1ページあたりの表示範囲(10件〜100件)に基づいて抽出しています。 ...
    • 特徴キーワード

      Patentfieldでは、公報中の文章から特徴的なキーワードを抽出して表示することができます。 特徴キーワードは、公報中におけるキーワードの出現回数と、データベース全体で比較したときのキーワードのレア度、文書長等に基づいて自動抽出しています。 特徴キーワードは、下表で示す対象範囲(対象特徴量)ごとに表示&ダウンロードが可能です。 対象範囲 *括弧内が特徴キーワードの抽出範囲 対象国 特徴キーワード(タイトル/要約/請求の範囲/明細書/審査官キーワード) JP/PCTJP/US/EP/WO ...
    • 特徴キーワードを利用した特定2社間の強み・弱みの分析

      Patentfieldの機能のひとつである特徴キーワードは、各公報内のテキストから特徴的なキーワードを抽出して表示等ができます。 この特徴キーワードを利用した特定2社間の強味・弱みの分析手法について解説します。 1.分析したい2社の出願人名で検索を実行します。 今回の事例では、京都大学と大阪大学で検索します。 2.マップの集計項目で「特徴キーワード」を選択します。 ...
    • 等高線チャート

      可視化の軸で「特徴キーワード」を選択すると「等高線チャート」で可視化ができます。(クロス集計なしの場合) 等高線チャートは母集団の特徴キーワードを集計し、母集団の中で出現回数が多い特徴キーワードを表示します。 出現回数が多いほど青色が濃く表示されます。 マップ中のキーワード同士の距離は、キーワード同士の共起関係を表しで、同一公報内でキーワード同士が多く出現している公報が多いほど、距離が近くなります。 マップに描画されるキーワード数はデフォルトで10件です。 ...
    • AI分類予測で予測スコアが表示されない、すべての公報に同じスコアが表示される

      AI分類予測で予測スコアが表示されない、またはすべての公報に同じスコアが表示されるケースがあります。 AI分類予測では、各公報が持っている「特徴キーワード」(特徴量)を利用して、予測計算を行います。 DOCDBベースの公報や、直近2,3日に発行されたばかりの最新公報などは、特徴キーワードが収録されていません。 その場合は、内部的に0という特徴量で計算しようとしますので、なにかしらの結果が返ってきます。 この場合の予測結果は信頼性に欠けますので、ご注意ください。 ...