教師データ設定

教師データ設定

AI分類予測は、予めユーザーがセットした教師データに基づいて、任意の検索結果や母集合について、AIが分類を予測してくれます。

例えば、任意の検索結果について、【自社事業に関連する/しない】といった分類や、SDIの新着公報について、【どの開発テーマに関連するか】等、
今まで人が公報を読み込んで仕分けしていた作業を、AIが自動で分類し、大幅な作業効率を図ることができます。

AI分類予測を実行するために、教師データを設定する必要があります。
Warning
AI分類予測では、入力した教師データに基づいて分類予測を行います。
教師データは、出願番号/公報番号またはテキストデータを、最大1万件まで入力することができます。
入力した教師データに基づいて、機械学習させた独自のモデルを生成し、最大10万件までの任意の検索結果について分類予測を実施し、予測スコアを算出します。

<教師データ設定方法>

AI分類予測の「教師データ設定」をクリック


AI分類予測機能を使うには、まず作業グループを作成する必要があります。
作業グループを新しく作成する場合は、画面上部「作業グループを追加」を選択します。
Notes
作業グループを作成することで、開発テーマ・開発プロジェクトごとに情報を保存・管理することができ、
過去の調査結果や教師データを、開発テーマごとに保存しておくことできます。
(ペンマークをクリックすることで、作業グループ名を変更できます。)

例えば、開発企画段階の調査結果を教師データとして保存しておくことで、開発中期・後期に再調査する際に、
保存した教師データを活用することで、開発テーマに関連する公報を効率的に差分検索することができます。


<AI分類予測の種類>

AI分類予測には3つの種別があります。

【2値分類】 関係するか/しないか(〇か✖)の2つの振り分け予測ができます。
 自社技術に関係するかどうか、開発テーマに関係するかどうか等の観点で振り分けし、関係する公報だけを効率的にスクリーニングすることができます。

【多値分類】 複数のラベルを作成して、どのラベルに一番近いかの振り分け予測ができます。
 技術要素・課題・効果等の観点で複数のラベルに振り分けし、特定の技術要素・課題・効果だけを選別してスクリーニングしたり、
 検索結果の母集合について、どの技術要素が多いのかを分析することができます。

【多ラベル分類】 複数のラベルを作成して、複数のラベルの振り分け予測ができます。
 基本的には多値分類と同じような使い方ができます。多ラベルの場合は、例えば技術要素で振り分ける際に、
 要素Aと要素Bのどちらにも該当する場合に、両方の要素A・Bを振り分けることができます。














<教師データの入力方法>

教師データの入力方法について、下記リンク記事も合わせてご参照ください。

【2値分類】の教師データ入力方法

 教師データには、調査テーマに関連するものに「1」、関連しないものに「-1」を付与します。
 *AI分類予測では、入力した教師データに基づいて分類予測を行います。

 教師データを入力する方法は、主に2つがあります。
 ・CSVファイルを読み込ませて一括で入力する
 ・検索結果画面から入力する

●CSVファイルを読み込ませて一括で入力する場合
 「ファイルから読み込み」を選択し、「ファイルを選択/ドラッグ&ドロップ」を選択して、読み込ませたいCSVファイルを選択します。
 CSVファイルには、A列に公報番号、B列に付与したいラベル「1」または「-1」を入力しておきます。



●検索結果画面から入力する場合
 検索結果画面の公報画面の下部「AIラベル」項目の、「+UP」をクリックとすると「+1」、「-DOWN」をクリックとすると「-1」の教師データが付与されます。


入力方法として、教師データを直接入力する方法もあります。直接入力する場合、「一括編集」を選択します。



教師データを入力した後に、「編集を保存」を選択します。教師データの入力は、
A列に公報番号、B列に付与したいラベル「1」または「-1」を入力したCSVファイルのデータを貼り付けて入力することができます。


【多値分類】の教師データ入力方法

多値分類では、まず振り分けたい「ラベル」を作成します。
ラベルの名称を記入して、右にある「+」をクリックすると、ラベルを作成できます。
例では、「多能性幹細胞」「ネットワーク・システム」「光学」「化合物」というラベルを作成しています。

教師データには、さきほど作成したラベルに相応しい特許の公報番号を入力します。

教師データを入力する方法は、2値分類と同様に主に2つがあります。
・CSVファイルを読み込ませて一括で入力する
・検索結果画面から入力する

●CSVファイルを読み込ませて一括で入力する場合
 「ファイルから読み込み」を選択し、「ファイルを選択/ドラッグ&ドロップ」を選択して、読み込ませたいCSVファイルを選択します。
 CSVファイルには、A列に公報番号、B列に付与したいラベルを入力しておきます。



●検索結果画面から入力する場合
 検索結果画面の公報画面の下部に「AIラベル」という項目があり、 「教師」の赤枠部分をクリックすると、
 作成したラベルのリストが表示されるので、公報の内容を確認のうえ、一番相応しいラベルを選択します。

【多値ラベル】の教師データ入力方法

多値ラベルでは多値分類と同様の入力手順となります。

●CSVファイルを読み込ませて一括で入力する場合
 「ファイルから読み込み」を選択し、「ファイルを選択/ドラッグ&ドロップ」を選択して、読み込ませたいCSVファイルを選択します。
 CSVファイルには、A列に公報番号、B列,C列,D列に付与したい複数ラベルを入力しておきます。

多ラベル分類 入力例(CSVファイルの一括インポート)

    • Related Articles

    • AI分類予測

      概要 AI分類予測は、予めユーザーがセットした教師データに基づいて、任意の検索結果や母集合について、AIが分類を予測してくれます。例えば、任意の検索結果について、【自社事業に関連する/しない】といった分類や、SDIの新着公報について、【どの開発テーマに関連するか】等、今まで人が公報を読み込んで仕分けしていた作業を、数秒以内でAIが自動で分類し、大幅な作業効率を図ることができます。 ...
    • AI分類予測の教師データサンプル

      以下の教師データサンプルを利用して、AI分類予測機能をお試しいただけます。 2値分類_教師データサンプル.csv 多値分類_教師データサンプル.csv 予測データサンプルを利用することで、AI分類予測の精度検証機能や交差検証機能をお試しいただけます。 2値分類_予測データサンプル.csv 多値分類_予測データサンプル.csv
    • 教師データを1件ずつ設定する方法

      AIラベル設定画面から教師データを1件ずつ設定する方法 1.AIラベル設定画面を開き、画面中段の「クエリ種別」を選択します。  *クエリ種別と異なる番号形式を入力(クエリ種別「出願番号」:公開番号や登録番号を入力)すると、適切に公報番号が認識されないのでご注意ください。 2.「クエリ」に教師データにする公報番号またはテキストを入力します。 3.教師データに対応するラベルを入力します。 ※2値分類では「1」または「-1」を選択してください。(「0」は教師データとして認識されません) ...
    • 作業グループ共有設定

      概 要 標準プランでは、作業グループを他のアカウントと共有することができません。 『作業グループ共有設定』オプションにより、作業グループを他のアカウントと共有することができます。 作業グループ共有設定により、以下の情報を他のユーザーと共有できます。 ・保存した検索条件の共有 ・ユーザー評価/タグ/ノートの共有 ・AIラベル/教師データの共有 ・監視設定(ウォッチング)の共有 ・Emailアラート(SDI配信)の共有 【利用例】 ...
    • かんたん3ステップAI分類予測

      トップページ より、以下のフォーマットで教師データファイルと予測データファイルを用意するだけで、すぐにAI分類予測を行うことができます。 1. 教師データファイル読込 以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。 サンプル教師データファイル 2. 予測データファイル読込 ...