AI分類予測
AI分類予測の教師データサンプル
以下の教師データサンプルを利用して、AI分類予測機能をお試しいただけます。 2値分類_教師データサンプル.csv 多値分類_教師データサンプル.csv 予測データサンプルを利用することで、AI分類予測の精度検証機能や交差検証機能をお試しいただけます。 2値分類_予測データサンプル.csv 多値分類_予測データサンプル.csv
交差検証(クロスバリデーション)を使用した教師データの汎化性評価
AI分類予測では、教師データの性能を評価するための精度検証機能が備わっています。 精度検証機能を利用することで、下図のように、全体の精度と各ラベルの精度が表示され、構築済み教師データの精度を測定することができます。 精度検証機能では、特定のデータに対する精度(上図では、85.7%)を測定することはできますが、他のデータに対しても同等の精度がでるかどうかは分かりません。 検証用のデータセットを複数用意して検証することもできますが、データセットを用意する手間がかかります。 ...
可視化
可視化機能は、教師データおよび予測データの特徴量を主成分分析を用いて、2次元マップで表現したものです。 X軸・Y軸は教師データ/予測データに登録されている各特許の類似度を表しており、これにより各特許の類似度(ドットの位置)と分類ラベルの傾向(色)の分布を把握することができます。 ※軸の数値は便宜上表示されているだけで、特段意味はありません。 各ドットは、◇は教師ラベル、〇は予測ラベルを表しています。 (◇の線と中の色が異なる場合、教師ラベルと予測結果が異なることを表しています)
検索結果の分類設定
検索結果に対する分類予測の設定が行えます。 1.オプション 1-1.都度更新しない 「都度更新しない」にチェックを入れると、結果一覧画面や「教師データ」タブのクエリ種別を指定して教師データの追加/削除を行っても、「編集を保存」を押さない限り教師データとモデルデータが更新されません。 教師データの数が増えた際に、1件ずつ教師データを追加すると待ち時間が長く気になる場合、チェックを入れることで1件毎の待ち時間がなくなります。 ...
パラメータチューニング
機械学習では、ハイパーパラメータと呼ばれるチューニングしなければいけないパラメータがいくつか存在します。教師データが少ないうちは自動的にパラメータ調整を行いますが、教師データが1000件を超えると 自動でパラメータ調整は行われません。 正解ラベルがわかっている教師データの一部を教師データに追加せずに予測データに追加することにより、未知データ(教師データとして与えていないデータ)に対する精度(正解率)を検証しながらパラメータを調整することができます。 1. C コスト(誤分類許容度) ...
AI教師データの一括取り込み
AI教師データを一括で取り込みする手順を解説します。 1. 教師データとして分類付与済み番号リストを用意 以下のようにA列に公報番号、B列に任意のラベル名を付与した番号リストのcsvファイルを用意します。カンマ区切りかタブ区切り、どちらでも構いません。 2値分類:1 or -1を付与 多値分類:任意のラベル名を付与 多ラベル分類:任意のラベル名を付与(複数ラベルを付与する場合は、C列、D列と足してください) ...
かんたん3ステップAI分類予測
トップページ より、以下のフォーマットで教師データファイルと予測データファイルを用意するだけで、すぐにAI分類予測を行うことができます。 1. 教師データファイル読込 以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。 サンプル教師データファイル 2. 予測データファイル読込 ...
AI分類予測の入力番号フォーマット
【日本公報の番号フォーマット】 番号フォーマットは複数サポートしており、特願2001-1、特開2004-123456、特許6123456などが使えます。お持ちの番号フォーマットが対応していない場合はお問い合わせ下さい。 JP20060290111 # EPODOC形式出願番号(JPYYYYNNNNNNN),多能性幹細胞 特願2010-122389 # 特願形式(特願YYYY-N),多能性幹細胞 WO2013176233 # WO形式,多能性幹細胞 特許5544573 ...
AI分類予測
概要 AI分類予測は、予めユーザーがセットした教師データに基づいて、任意の検索結果や母集合について、AIが分類を予測してくれます。例えば、任意の検索結果について、【自社事業に関連する/しない】といった分類や、SDIの新着公報について、【どの開発テーマに関連するか】等、今まで人が公報を読み込んで仕分けしていた作業を、数秒以内でAIが自動で分類し、大幅な作業効率を図ることができます。 ...