G検定に出てくる用語　その②

- 7月 24, 2024

猛暑が続きます。

G検定用メモ　その②

テストに英語が出るわけではありません。

【機械学習の具体的手法】

linear regression 線形回帰

　simple regression analysis 単回帰分析　

　multiple regression analysis 重回帰分析

explanatory variable 説明変数

target variable 目的変数

multicollinearity マルチコ、多重共線性

correlation coefficient　相関係数（負の相関、正の相関、無相関）

Perceptron　パーセプトロン

入力ベクトル（x1, x2, x3...）

w = weight 重み

u = 総入力

クラスを判定

＊重みを調整して、直線で2クラスに分類するのに使われる

論理ゲート

SVM, support vector machine　サポートベクターマシン

教師あり学習を用いるパターン認識モデルの1つ

2つのクラスを線形分離

境界に最も近いサンプルとの距離（マージン）

hyperparameter　ハイパーパラメータ

kernel method カーネル法

カーネル関数を使う

線形分離できないデータでも、カーネル法を組み合わせると決定境界を求めることができる

decision tree 決定木

よく使われる分類アルゴリズム

不純度＝クラスの混じり具合

Gini index ジニ係数

entropy エントロピー

決定木＋ bagging バギング＝ random forest ランダムフォレスト

バギングはモデル平均化手法の一種

Logistic regression ロジスティック回帰

線形回帰を分類問題に応用したアルゴリズム

対数オッズ、log 対数

ロジット変換、logit ロジット

regularization　正則化：過学習を抑制

standardization　標準化：データの平均meanを0にし、標準偏差を1に変換

rescales data to have a mean of 0 and a standard deviation of 1 (unit variance)

normalization　正規化：スケーリング

rescales the values into a range of [0,1]

clustering　クラスタリング

k-means 法

cluster クラスタ（まとまり）

重心

kNN 法　k Nearest Neighbor

各クラスのデータ数の偏りがなく、クラスがよく分かれているときに使われる

w = weight 重み

b = bias バイアス

2年前の今頃、アメリカに出張していたようです。週末は、山や川でリラックス♪

このブログを検索

Tomoko’s Thoughts ＆英会話・イベント情報（広島県福山市）

G検定に出てくる用語　その②

このブログの人気の投稿

奈良の「飛鳥・藤原の宮都」が世界遺産に登録

乙4合格後の手続き（広島県）

無限城は英語で　劇場版「鬼滅の刃」無限城編第一章猗窩座再来

G検定に出てくる用語 その②

このブログの人気の投稿

奈良の「飛鳥・藤原の宮都」が世界遺産に登録

乙4合格後の手続き（広島県）

無限城は英語で 劇場版「鬼滅の刃」無限城編 第一章 猗窩座再来

G検定に出てくる用語　その②

無限城は英語で　劇場版「鬼滅の刃」無限城編第一章猗窩座再来