機械学習で用いられる評価指標をまとめて紹介

評価指標のアイキャッチ 機械学習

はじめに

機械学習モデルのパフォーマンスを測るには、目的に応じた適切な評価指標を選ぶことが重要です。分類モデルと回帰モデルでは、それぞれ異なる評価指標が使われるため、この記事ではそれらを整理して紹介します。

評価指標は多くありますが、その中で適切な指標を選択し、モデル評価することはビジネス判断には非常に重要です。これらのモデルや評価指標にについて、経験豊富な方とマンツーマンで学習していくのもオススメです。

分類モデルの評価指標

正解率(Accuracy)

正解率(Accuracy)は、モデルがどれだけ正しく予測できたかを示す最も基本的な指標です。正しく予測されたサンプルの割合を示しますが、データにクラスの偏りがある場合は適切でないこともあります。

Precision, Recallどちらにも使われますが、TP、FP、FN、TNは予測と実測がどれだけマッチしたかを分けた値になります

予測結果/実際予測: 陽性予測: 陰性
実際: 陽性 (Positive)True Positive (TP)False Negative (FN)
実際: 陰性 (Negative)False Positive (FP)True Negative (TN)
$$ \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} $$

Precision(適合率)

適合率(Precision)は、モデルが正例だと予測したうち、実際に正例であった割合を示します。

$$ Precision = \frac{TP}{TP + FP} $$
分類精度指標「適合率」、「再現率」、「F値」の使い方
はじめに分類問題において、モデルの性能を評価するためには、適合率(Precision)、再現率(Recall)、そしてF値(F1-Score)といった指標が重要です。これらの指標は、モデルがどの程度正確に予測を行っているかを評価す...

Recall(再現率)

再現率(Recall)は、実際の正例のうち、モデルがどれだけ正しく検出できたかを示す指標です。医療分野など、正例を見逃してはいけないケースで重要になります。

$$ Recall = \frac{TP}{TP + FN} $$
分類精度指標「適合率」、「再現率」、「F値」の使い方
はじめに分類問題において、モデルの性能を評価するためには、適合率(Precision)、再現率(Recall)、そしてF値(F1-Score)といった指標が重要です。これらの指標は、モデルがどの程度正確に予測を行っているかを評価す...

F値(F1スコア)

F値は、PrecisionとRecallの調和平均で、両者のバランスを取った指標です。PrecisionとRecallのどちらかが大きく偏っている場合、このスコアは低くなります。

$$ \text{F1-Score} = \frac{2 \times Precision \times Recall}{Precision + Recall} $$
分類精度指標「適合率」、「再現率」、「F値」の使い方
はじめに分類問題において、モデルの性能を評価するためには、適合率(Precision)、再現率(Recall)、そしてF値(F1-Score)といった指標が重要です。これらの指標は、モデルがどの程度正確に予測を行っているかを評価す...

ROC – AUC

ROC – AUCは、ROC曲線(Receiver Operating Characteristic Curve)の下の面積を指し、モデルの分類性能を評価します。AUCが1に近いほど、モデルの予測性能が高いことを示します。

分類予測の評価に用いられるROC曲線とAUCの解説と有用性
はじめにROC(Receiver Operating Characteristic)曲線とAUC(Area Under the Curve)は、機械学習や統計分析において、分類モデルの評価と比較に広く使用される重要な指標です。この...

Log Loss

Log Lossは、モデルが予測した確率と実際のクラスラベルとの誤差を評価する指標です。モデルが正しいクラスに高い確率を割り当てるほどLog Lossは小さくなります。\( n \)はデータポイントの数、\( y_i \)​は実測値、\( p_i \)​ははモデルが予測したクラス1である確率です。

$$ Log Loss = -\frac{1}{n} \sum_{i=1}^{n} (y_i \log(p_i) + (1 – y_i) \log(1 – p_i)) $$
分類タスクの評価指標「Log Loss」とは?計算方法や特徴を理解しよう
はじめに機械学習の分類タスクにおいて、モデルの性能を評価するための指標は多岐にわたります。その中でも、「Log Loss(対数損失)」は、モデルがどれだけ正確にクラスの確率を予測できているかを評価するための重要な指標です。本記事で...

回帰モデルの評価指標

RMSE(Root Mean Squared Error)

RMSE(二乗平均平方根誤差)は、MSEの平方根を取ったもので、誤差の単位が元のデータと同じになるため、解釈しやすいです。\( n \)はデータポイントの数、\( y_i \)​は実測値、\( \hat{y_i} \)​はモデルによる予測値です。

$$ \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i – \hat{y}_i)^2} $$
評価指標RMSE(平均二乗誤差)とは。MAE(平均絶対誤差)との違いも解説
はじめに機械学習や統計学において、モデルの性能を評価するための指標は極めて重要です。その中でも、RMSE(Root Mean Square Error、平均二乗誤差)はよく使われる評価指標の一つです。本記事では、RMSEと...

MAE(Mean Absolute Error)

MAE(平均絶対誤差)は、実際の値と予測値の差の絶対値を平均したもので、誤差の影響を均等に扱います。外れ値に対してMSEほど敏感ではありません。\( n \)はデータポイントの数、\( y_i \)​は実測値、\( \hat{y_i} \)​はモデルによる予測値です。

$$ MAE = \frac{1}{n}\sum_{i=1}^{n} {|y_i – \hat{y_i}}| $$
評価指標RMSE(平均二乗誤差)とは。MAE(平均絶対誤差)との違いも解説
はじめに機械学習や統計学において、モデルの性能を評価するための指標は極めて重要です。その中でも、RMSE(Root Mean Square Error、平均二乗誤差)はよく使われる評価指標の一つです。本記事では、RMSEと...

MAPE(Mean Absolute Percentage Error)

MAPE(平均絶対パーセント誤差)は、実際の値と予測値の誤差をパーセンテージで表したものです。誤差の絶対値を取っているため、予測がどれだけ外れているかを直感的に理解できる指標です。特にビジネスシーンなどで、誤差の大きさを相対的に評価したいときに便利です。\( n \)はデータポイントの数、\( y_i \)​は実測値、\( \hat{y_i} \)​はモデルによる予測値です。

$$ MAPE = \frac{100}{n} \sum_{i=1}^{n} | \frac{y_i – \hat{y_i}}{y_i} | $$
回帰モデルの評価指標「MAPE」とは?注意点も合わせて紹介
はじめに回帰モデルの評価はモデルの性能を正確に理解し、改善のための手がかりを得る上で重要です。その中でも、MAPE(Mean Absolute Percentage Error)は一般的に使用される指標の一つです。本記事で...

R2(決定係数)

R2は、モデルがデータの分散をどれだけ説明できるかを示す指標です。1に近いほど、モデルの予測力が高いことを示します。\( n \)はデータポイントの数、\( y_i \)​は実測値、\( \hat{y_i} \)​はモデルによる予測値、\( \bar{y} \)​は実測値の平均値です。

$$ R^2 = 1 – \frac{\sum_{i=1}^{n} (y_i – \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i – \bar{y})^2} $$
決定係数R2とは。使い方を理解しよう
はじめに決定係数(R2) とは、回帰分析においてモデルがデータどれだけ説明できるかを示す指標です。R2の値は 0から1 の範囲にあり、 1に近いほどモデルがデータをよく説明していることを意味します。決定係数を含め、様々なモ...

まとめ

分類モデルと回帰モデルの評価指標をまとめて紹介しました。多くの指標がありますが、一個一個理解しビジネス活用することが重要だと思います。

コメント

Copied title and URL