G検定に出てくる用語 その②
猛暑が続きます。
G検定用メモ その②
テストに英語が出るわけではありません。
【機械学習の具体的手法】
linear regression 線形回帰
simple regression analysis 単回帰分析
multiple regression analysis 重回帰分析
explanatory variable 説明変数
target variable 目的変数
multicollinearity マルチコ、多重共線性
correlation coefficient 相関係数(負の相関、正の相関、無相関)
Perceptron パーセプトロン
入力ベクトル(x1, x2, x3...)
w = weight 重み
u = 総入力
クラスを判定
*重みを調整して、直線で2クラスに分類するのに使われる
論理ゲート
SVM, support vector machine サポートベクターマシン
教師あり学習を用いるパターン認識モデルの1つ
2つのクラスを線形分離
境界に最も近いサンプルとの距離(マージン)
hyperparameter ハイパーパラメータ
kernel method カーネル法
カーネル関数を使う
線形分離できないデータでも、カーネル法を組み合わせると決定境界を求めることができる
decision tree 決定木
よく使われる分類アルゴリズム
不純度=クラスの混じり具合
Gini index ジニ係数
entropy エントロピー
決定木+ bagging バギング= random forest ランダムフォレスト
バギングはモデル平均化手法の一種
Logistic regression ロジスティック回帰
線形回帰を分類問題に応用したアルゴリズム
対数オッズ、log 対数
ロジット変換、logit ロジット
regularization 正則化:過学習を抑制
standardization 標準化:データの平均meanを0にし、標準偏差を1に変換
rescales data to have a mean of 0 and a standard deviation of 1 (unit variance)
normalization 正規化:スケーリング
rescales the values into a range of [0,1]
clustering クラスタリング
k-means 法
cluster クラスタ(まとまり)
重心