可視化

可視化

可視化機能は、教師データおよび予測データの特徴量を主成分分析(PCA)という手法を用いて、2次元のマップ上にプロット(可視化)したものです。
X軸・Y軸は各特許の類似度を表しており、マップ全体を見ることで、各特許の類似度(ドットの位置)と分類ラベル(色)の分布傾向を視覚的に把握することができます。



グラフの読み方

マップ上のドット(点)や色、位置は、それぞれ以下の情報を表しています。
ドットの形状
◇(ひし形): 教師ラベルのデータ
〇(丸): 予測ラベルのデータ

ドットの色
青: 分類ラベル「1」
赤: 分類ラベル「-1」

ドットの位置(X軸・Y軸)
マップ上で位置が近いドットほど、互いの特徴量が類似している(=似ている特許である)ことを示します。

Alert
軸に表示されている数値は、分布を表現するために便宜上表示されているだけで、数値自体に特段の意味はありません。ドット間の相対的な位置関係や分布の傾向をご覧ください。

分布の解釈と注意点

解釈の目安
マップ上で青(1)と赤(-1)のドット群が綺麗に分かれている(混ざり合っていない)場合、それは「教師データや予測データの傾向が、特徴量によって明確に分離できている」傾向がある、と解釈できることがあります。

ご利用上の注意点
このグラフは、実際には複雑なデータ分布を、2次元のマップ上に圧縮して表示しています。
そのため、仮に「青と赤が綺麗に分かれていない(混ざって見える)」場合でも、必ずしも「モデルの精度が低い」ことを意味する訳ではありません。
高次元の空間では分離できていても、2次元に圧縮した結果、重なって見える場合があるためです。

この可視化機能は、あくまでもデータ全体の傾向を大まかに把握するための「目安」としてご覧ください。
    • Related Articles

    • 競合企業の可視化・分析方法

      Patentfieldでは、検索結果と同時にパテントマップが表示されるようになっています。最大3軸でマップ作成が可能で、分析したい軸を選択するだけで、簡単にマップを作成することができます。パテントマップによって、膨大な特許情報を可視化することができ、特定の傾向を把握できたり、新たな課題や問題点を発見することができます。 パテントマップで可視化したい内容によって、分析対象となる母集合や、分析軸が異なります。 ...
    • AI分類予測

      概要 AI分類予測は、予めユーザーがセットした教師データに基づいて、任意の検索結果や母集合について、AIが分類を予測してくれます。例えば、任意の検索結果について、【自社事業に関連する/しない】といった分類や、SDIの新着公報について、【どの開発テーマに関連するか】等、今まで人が公報を読み込んで仕分けしていた作業を、数秒以内でAIが自動で分類し、大幅な作業効率を図ることができます。 ...
    • 技術動向の可視化・分析方法

      パテントマップで「技術動向」を可視化するには、分析対象となる母集合を、特許分類やキーワードを組み合わせて作成する必要があり、特許検索に不慣れな方にとってはハードルの高いものとなっていました。PatentfieldのAIセマンティック検索機能を利用することで、検索式を作成することなく、簡単な操作で母集合を作成することができます。 ...
    • かんたん3ステップAI分類予測

      トップページ より、以下のフォーマットで教師データファイルと予測データファイルを用意するだけで、すぐにAI分類予測を行うことができます。 1. 教師データファイル読込 以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。 サンプル教師データファイル 2. 予測データファイル読込 ...
    • AI分類予測の教師データサンプル

      以下の教師データサンプルを利用して、AI分類予測機能をお試しいただけます。 2値分類_教師データサンプル.csv 多値分類_教師データサンプル.csv 予測データサンプルを利用することで、AI分類予測の精度検証機能や交差検証機能をお試しいただけます。 2値分類_予測データサンプル.csv 多値分類_予測データサンプル.csv