G検定に出てくる用語 その②

猛暑が続きます。

G検定用メモ その②
テストに英語が出るわけではありません。


【機械学習の具体的手法】


linear regression 線形回帰
 simple regression analysis 単回帰分析 
 multiple regression analysis 重回帰分析

explanatory variable 説明変数
target variable 目的変数

multicollinearity マルチコ、多重共線性
correlation coefficient 相関係数(負の相関、正の相関、無相関)




Perceptron パーセプトロン
入力ベクトル(x1, x2, x3...)
w = weight  重み 
u = 総入力
クラスを判定

*重みを調整して、直線で2クラスに分類するのに使われる
論理ゲート




SVM, support vector machine サポートベクターマシン
教師あり学習を用いるパターン認識モデルの1つ
2つのクラスを線形分離

境界に最も近いサンプルとの距離(マージン)
hyperparameter ハイパーパラメータ





kernel method  カーネル法
カーネル関数を使う
線形分離できないデータでも、カーネル法を組み合わせると決定境界を求めることができる





decision tree 決定木
よく使われる分類アルゴリズム

不純度=クラスの混じり具合
Gini index ジニ係数
entropy エントロピー

決定木+ bagging バギング= random forest ランダムフォレスト

バギングはモデル平均化手法の一種





Logistic regression ロジスティック回帰
線形回帰を分類問題に応用したアルゴリズム

対数オッズ、log 対数
ロジット変換、logit ロジット


regularization 正則化:過学習を抑制

standardization 標準化:データの平均meanを0にし、標準偏差を1に変換 
rescales data to have a mean of 0 and a standard deviation of 1 (unit variance)

normalization 正規化:スケーリング
rescales the values into a range of [0,1]






clustering クラスタリング

k-means 法
cluster クラスタ(まとまり)
重心





kNN 法 k Nearest Neighbor 
各クラスのデータ数の偏りがなく、クラスがよく分かれているときに使われる





w = weight  重み 
b = bias  バイアス  



2年前の今頃、アメリカに出張していたようです。週末は、山や川でリラックス♪







このブログの人気の投稿

2024年9月の英会話イベント(広島県福山市)

薪ストーブのイベントでコケモモのジャム

曲がり角をまがったさきにあるのは…『赤毛のアン』