かんたん3ステップAI分類予測

かんたん3ステップAI分類予測

トップページ より、以下のフォーマットで教師データファイルと予測データファイルを用意するだけで、すぐにAI分類予測を行うことができます。














1. 教師データファイル読込

以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。

サンプル教師データファイル


2. 予測データファイル読込

以下のような1列目に予測したい番号を付与した番号リストを用意します。原則、2列目は不要ですが、教師番号のリストと同様に2列目にラベルを付与することも可能です。この場合、AIが予測した結果との精度検証に用いることができます。

サンプル予測データファイル

      特開平7-149737
      特開平7-165579
      特開2002-78792
      特開2018-163436
      再表2017-104724
      特開2018-151775
      特開2018-145113
      特開2018-141892
      特開2018-143025
      特開2006-276388
   

3. 分類予測

分類予測のボタンをクリックすることにより予測データの番号リストで検索し、教師データに基づいて予測データの文献の分類を予測します。予測結果をエクセルでエクスポートすることもでき、エクセルエクスポートでは、予測ラベルのみではなく、予測ラベル候補を確度の高い順で最大5つ出力することもできます。


4. 教師データセット(作業グループ)

教師データを複数種類保持することができます。新しく教師データを読み込む場合は、作業グループを追加を選択してください。


5. AI設定フォーム

詳細な設定が可能なAIラベル設定フォームが開きます。詳細な説明は こちら を参照して下さい。

    • Related Articles

    • AI分類予測

      概要 AI分類予測は、予めユーザーがセットした教師データに基づいて、任意の検索結果や母集合について、AIが分類を予測してくれます。例えば、任意の検索結果について、【自社事業に関連する/しない】といった分類や、SDIの新着公報について、【どの開発テーマに関連するか】等、今まで人が公報を読み込んで仕分けしていた作業を、数秒以内でAIが自動で分類し、大幅な作業効率を図ることができます。 ...
    • AI分類予測の精度を上げたい

      AI分類予測の精度検証機能やパラメータチューニングを使用することで、精度向上が期待できます。 精度検証用のデータを用意できない場合には、交差検証機能をご利用ください。 交差検証(クロスバリデーション)機能では、構築済み教師データの汎用性を評価することができます。 精度検証機能の詳細は、下記のスライド資料をご参照ください。
    • AI分類予測の入力番号フォーマット

      【日本公報の番号フォーマット】 番号フォーマットは複数サポートしており、特願2001-1、特開2004-123456、特許6123456などが使えます。お持ちの番号フォーマットが対応していない場合はお問い合わせ下さい。 JP20060290111 # EPODOC形式出願番号(JPYYYYNNNNNNN),多能性幹細胞 特願2010-122389 # 特願形式(特願YYYY-N),多能性幹細胞 WO2013176233 # WO形式,多能性幹細胞 特許5544573 ...
    • 検索結果一覧画面と公報の詳細ページでAIスコア(AI予測スコア)が異なる

      AI分類予測は母集団によって相対的にAIスコアが変化します。 検索結果一覧画面ではヒットした出願を母集団として各特許にAIスコアが付与されますが、公報詳細ページのAIスコアは「母集団がその出願のみ」と理解できるため、検索結果一覧画面のAIスコアとは異なります。 なお、エクセルダウンロードにおいて「AI予測スコア」をダウンロードする場合、全チェックなどで対象公報にチェックを入れた状態でエクセルダウンロードを行うと、 チェックが入った出願を対象(母集団)としてAIスコアが付与されます。 ...
    • AI教師ラベル一括読み込み手順

      このページは、AI教師ラベルを一括読み込みする手順に関する説明です。AIラベル設定画面の説明は こちら をご参照ください。 1. 教師データとして分類済み番号リストを用意 以下のような1列目に番号、2列目に任意のラベル名を付与した番号リストを用意します。多値分類の場合、任意のラベル名、2値分類の場合、1か-1を付与します。カンマ区切りかタブ区切り、どちらでも構いません。 エクセルのようにタブ区切りの場合は、下図の要領でリストを作成してください。 サンプル教師データファイル ...