猛暑が続きます。 G検定用メモ その② テストに英語が出るわけではありません。 【機械学習の具体的手法】 linear regression 線形回帰 simple regression analysis 単回帰分析 multiple regression analysis 重回帰分析 explanatory variable 説明変数 target variable 目的変数 multicollinearity マルチコ、多重共線性 correlation coefficient 相関係数(負の相関、正の相関、無相関) Perceptron パーセプトロン 入力ベクトル(x1, x2, x3...) w = weight 重み u = 総入力 クラスを判定 *重みを調整して、直線で2クラスに分類するのに使われる 論理ゲート SVM, support vector machine サポートベクターマシン 教師あり学習を用いるパターン認識モデルの1つ 2つのクラスを線形分離 境界に最も近いサンプルとの距離(マージン) hyperparameter ハイパーパラメータ kernel method カーネル法 カーネル関数を使う 線形分離できないデータでも、カーネル法を組み合わせると決定境界を求めることができる decision tree 決定木 よく使われる分類アルゴリズム 不純度=クラスの混じり具合 Gini index ジニ係数 entropy エントロピー 決定木+ bagging バギング= random forest ランダムフォレスト バギングはモデル平均化手法の一種 Logistic regression ロジスティック回帰 線形回帰を分類問題に応用したアルゴリズム 対数オッズ、log 対数 ロジット変換、logit ロジット regularization 正則化:過学習を抑制 standardization 標準化:データの平均meanを0にし、標準偏差を1に変換 rescales data to have a mean of 0 and a standard deviation of 1 (unit variance) normalization 正規化:スケーリング rescales ...