機械学習

機械学習

[機械学習のはじめ方] Part32: 活性化関数の選び方(ReLU, Tanh, Sigmoid)

はじめに:活性化関数って何? 🤔 ニューラルネットワークの学習ステップへようこそ!今回は、ネットワークの学習能力を左右する重要な要素、「活性化関数」について学びます。特に代表的な「ReLU」「Tanh」「Sigmoid」の3つに焦点を当て、...
機械学習

[機械学習のはじめ方] Part31: 多層パーセプトロン(MLP)と誤差逆伝播

はじめに:単純パーセプトロンを超えて 前回学んだ「単純パーセプトロン」は、ニューラルネットワークの最も基本的な形でしたね。しかし、単純パーセプトロンは線形分離可能な問題しか解けないという限界がありました。現実の問題はもっと複雑で、単純な直線...
機械学習

[機械学習のはじめ方] Part30: 単純パーセプトロンの理論

1. はじめに:パーセプトロンとは? 🤔 ニューラルネットワークと深層学習の世界へようこそ!このステップでは、その最も基本的な構成要素であるパーセプトロンについて学びます。 単純パーセプトロンは、1957年にフランク・ローゼンブラットによっ...
機械学習

[機械学習のはじめ方] Part29: t-SNE・UMAPの違いと使い分け

はじめに:なぜ次元削減が必要なの? 🤔 機械学習で扱うデータは、たくさんの特徴量(=次元)を持つことがあります。例えば、顧客データなら年齢、性別、購入履歴、Webサイトの閲覧履歴など、数十、数百の特徴量があることも珍しくありません。このよう...
機械学習

[機械学習のはじめ方] Part28: PCA(主成分分析)の考え方と可視化

たくさんの情報(特徴量)を持つデータを、大切な情報を保ったまま次元を減らすテクニックを学びましょう!🤔 なぜ次元削減が必要なの?PCAって何? 機械学習で扱うデータは、たくさんの特徴量(説明変数)を持つことがあります。例えば、顧客データなら...
機械学習

[機械学習のはじめ方] Part27: DBSCANと密度に基づくクラスタリング

はじめに: なぜ密度ベース? 🤔 みなさん、こんにちは!機械学習の旅、Step 5へようこそ!今回は教師なし学習の中でも、特にユニークなアプローチをとる「クラスタリング」の手法、DBSCAN (Density-Based Spatial C...
機械学習

[機械学習のはじめ方] Part26: 階層クラスタリングとデンドログラム

データ間の類似度に基づいて段階的にグループ化する手法を学びます。はじめに:階層クラスタリングとは? こんにちは!機械学習の旅へようこそ。今回は、教師なし学習の中でも代表的な手法の一つである「階層クラスタリング」について学んでいきましょう。 ...
機械学習

[機械学習のはじめ方] Part25: k-meansクラスタリングと初期値の影響

1. k-meansクラスタリングとは? k-meansクラスタリング(k平均法)は、最も広く使われている教師なし学習アルゴリズムの一つです。 その目的は、与えられたデータセットを、事前に指定した数(k)個の互いに素なグループ(クラスタ)に...
機械学習

[機械学習のはじめ方] Part24: 特徴量の重要度と選択

モデルの性能と解釈性を向上させるための重要なステップはじめに:なぜ特徴量の重要度と選択が大切なの? 🤔 機械学習モデルを構築する際、手元にあるすべてのデータ(特徴量)をそのまま使うのが常に最善とは限りません。特徴量の中には、モデルの予測に大...
機械学習

[機械学習のはじめ方] Part23: グリッドサーチとランダムサーチ

機械学習モデルの性能は、「ハイパーパラメータ」と呼ばれる設定値によって大きく左右されます。最適なハイパーパラメータを見つける作業は「ハイパーパラメータチューニング」と呼ばれ、モデルの精度を最大限に引き出すために非常に重要です。今回は、ハイパ...