チューニングで利用する対象特徴量を最大10個まで選択できます。
対象特徴量は、「(人が判断する際に)どの項目を読んで判断するか」を目安に選択してみてください。
また、「タイトル/要約/請求の範囲/明細書/審査官キーワード」と「タイトル/要約/請求の範囲/明細書/審査官キーワード(セマンティック)」など、
項目によっては「~(セマンティック)」と付いたものがありますが、「~(セマンティック)」は「類似キーワード」も加味して分類予測を行います。
「~(セマンティック)」が付いている項目と付いていない項目をそれぞれ選択することもお勧めです。
なお、「C : コスト(誤分類許容度)」「Sigma : カーネルパラメータ」「2値優先ラベル」といったハイパーパラメータはチェックが入った状態をお勧めします。
「精度」「適合率」「再現率」「F値」から選択ができます。
一般的に、「(ノイズが多くなってもいいので)漏れを少なくしたい」場合は、「再現率」、
「(多少漏れても良いが)できるだけノイズを減らしたい」場合は「適合率」を選択することをお勧めします。
設定完了後、「チューニング開始」をクリックすると、チューニングが実行されます。