AI分類予測
AI分類予測の教師データサンプル
以下の教師データサンプルを利用して、AI分類予測機能をお試しいただけます。 2値分類_教師データサンプル.csv 多値分類_教師データサンプル.csv 予測データサンプルを利用することで、AI分類予測の精度検証機能や交差検証機能をお試しいただけます。 2値分類_予測データサンプル.csv 多値分類_予測データサンプル.csv
交差検証(クロスバリデーション)を使用した教師データの汎化性評価
AI分類予測では、教師データの性能を評価するためのパラメータチューニング機能が備わっています。 精度検証機能を利用することで、下図のように、全体の精度と各ラベルの精度が表示され、構築済み教師データの精度を測定することができます。 精度検証機能では、特定のデータに対する精度(上図では、85.7%)を測定することはできますが、他のデータに対しても同等の精度がでるかどうかは分かりません。 検証用のデータセットを複数用意して検証することもできますが、データセットを用意する手間がかかります。 ...
可視化
可視化機能は、教師データおよび予測データの特徴量を主成分分析(PCA)という手法を用いて、2次元のマップ上にプロット(可視化)したものです。 X軸・Y軸は各特許の類似度を表しており、マップ全体を見ることで、各特許の類似度(ドットの位置)と分類ラベル(色)の分布傾向を視覚的に把握することができます。 グラフの読み方 マップ上のドット(点)や色、位置は、それぞれ以下の情報を表しています。 ドットの形状 ◇(ひし形): 教師ラベルのデータ 〇(丸): 予測ラベルのデータ ドットの色 青: ...
検索結果の分類設定
検索結果に対する分類予測の設定が行えます。 1.オプション 1-1.都度更新しない 「都度更新しない」にチェックを入れると、結果一覧画面や「教師データ」タブのクエリ種別を指定して教師データの追加/削除を行っても、「編集を保存」を押さない限り教師データとモデルデータが更新されません。 教師データの数が増えた際に、1件ずつ教師データを追加すると待ち時間が長く気になる場合、チェックを入れることで1件毎の待ち時間がなくなります。 ...
AI教師データの一括取り込み
AI教師データを一括で取り込みする手順を解説します。 1. 教師データとして分類付与済み番号リストを用意 以下のようにA列に公報番号、B列に任意のラベル名を付与した番号リストのcsvファイルを用意します。カンマ区切りかタブ区切り、どちらでも構いません。 2値分類:1 or -1を付与 多値分類:任意のラベル名を付与 多ラベル分類:任意のラベル名を付与(複数ラベルを付与する場合は、C列、D列と足してください) ...
かんたん3ステップAI分類予測
トップページ より、以下のフォーマットで教師データファイルと予測データファイルを用意するだけで、すぐにAI分類予測を行うことができます。 1. 教師データファイル読込 以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。 サンプル教師データファイル 2. 予測データファイル読込 ...
AI分類予測の入力番号フォーマット
【日本公報の番号フォーマット】 番号フォーマットは複数サポートしており、特願2001-1、特開2004-123456、特許6123456などが使えます。お持ちの番号フォーマットが対応していない場合はお問い合わせ下さい。 JP20060290111 # EPODOC形式出願番号(JPYYYYNNNNNNN),多能性幹細胞 特願2010-122389 # 特願形式(特願YYYY-N),多能性幹細胞 WO2013176233 # WO形式,多能性幹細胞 特許5544573 ...
AI分類予測
概要 AI分類予測は、予めユーザーがセットした教師データに基づいて、任意の検索結果や母集合について、AIが分類を予測してくれます。例えば、任意の検索結果について、【自社事業に関連する/しない】といった分類や、SDIの新着公報について、【どの開発テーマに関連するか】等、今まで人が公報を読み込んで仕分けしていた作業を、数秒以内でAIが自動で分類し、大幅な作業効率を図ることができます。 ...