受講期限:無制限 | 受講料金:0円(無料) |
対象:初心者 | 環境:オンライン / ローカル |
コース概要
- 機械学習の概要(教師あり学習 / 教師なし学習)
- 線形回帰の概要
- 線形回帰モデルとは?
- コスト関数への理解
- 最急降下法への理解
- 特徴量の正規化
- 計算式のベクトル化
- プログラミング実習(単回帰分析)
- プログラミング実習(重回帰分析)
- ブラウザとインターネットで実行可能(Google Colab利用)
機械学習の最も初歩的な手法「線形回帰」を学ぼう
本コースは機械学習の初心者を対象とした、「線形回帰」を学ぶコースです。機械学習には解決する問題やデータの特性に応じて、様々な手法が存在します。線形回帰は数多くある機械学習の手法の中で「最も幅広く活用されている手法」の一つです。本コースは機械学習初学者へ向けた基本的な内容となっています。
線形回帰とは?
線形回帰とは、統計学の「回帰分析」の一種となります。回帰分析を説明する一つの例として、身長と体重の関係を考えてみましょう。一般的に身長が増えると、体重も増えます。このように、とある値(身長)が与えらた時に、それと相関関係のある値(体重)を説明・予測することを「回帰分析」と呼びます。
では、回帰分析に属する「線形回帰」とはなんでしょうか?先の「体重」「身長」の例で考えてみましょう。100人の男性の体重・身長のデータが与えられたとして、それらの2つのデータの関係性は「身長が増えれば体重も増える」のが判るかと思います。この身長と体重の「関係」を直線で表すのが線形回帰です。
本コースでは、線形回帰のより詳しい概要や数学的理解、さらに最適化アルゴリズムなどをPythonを使ってスクラッチからコーディングを行なっていきます。
線形回帰で出来ること
線形回帰は最も基本的な機械学習の手法の一つですが、様々な分野や業態で活用されています。線形回帰のイメージが解りやすいよう、2つの事例をご紹介します。
物件の条件から家賃を予測する
上記のデータは、とある地域の賃貸物件の条件と家賃です。賃貸物件は様々な条件で家賃が決まってきます。例えば、物件の専有面積が広ければ広いほど一般的には家賃が高くなる傾向にあり、逆に築年数は高ければ高いほど家賃は安くなる傾向にあります。
このようなデータをアルゴリズムを使って学習することで、これらの条件(専有面積や築年数)から家賃の予測をすることが可能です。
売り上げの予測
「売り上げの予測」でも、線形回帰は活用されます。上記のデータは、とあるアイスクリーム屋さんのデータで、「最高気温」や「降水量」などの気候条件と、その日の売上高のデータです。
一般的に「最高気温が高くて雨が降っていないと売り上げは高い」というデータごとの関係性を学習し、将来の天気予報のデータから売り上げを予測することが可能になる訳です。
これらはごく一部の活用事例ですが、線形回帰は他にも人事採用で活用されたりなど、活用できる範囲は非常に幅広いです。
実践的なプログラミング実習
本コースの前半は線形回帰の概要や数学的理解などを深める講座となっており、後半はPythonと実際のデータセットを使った、プログラミング実習が含まれています。プログラミング実習の特徴をご紹介します。
ブラウザ上で実行可能
Google社が無料で提供をしているGoogle Colab(グーグル・コラボ)を利用することで、ブラウザとインターネットから環境構築を行うことなく実行することが可能です。ただし、各パッケージの環境構築や管理は大変な作業ではありますが、機械学習エンジニアとして必要な知識と考えています。コース内の「環境構築」のチャプターでは、ローカルでの環境構築方法も紹介しています。
機械学習ライブラリーを使いません
機械学習ライブラリーとは「Scikit-learn(サイキット・ラーン)」やGoogleが提供する「TensorFlow(テンソルフロー)」など、機械学習の様々な手法や便利なツールを提供するライブラリーです。これらの機械学習ライブラリーを使うことで、劇的に機械学習の作業を改善することが可能です。ただし、本コースではより深い理解を得るため、これらの機械学習ライブラリーは使用せず、スクラッチでコーディングを行なっていきます。
*注* モデル訓練を行う上で必要な補助的なライブラリー(例:NumpやPandas)などは使います。
このコースの対象者
- これから機械学習を学ぼうと考えている方
- 既に機械学習を勉強しているが統計の基本に不安のある方
受講資格
(必須)Pythonの基礎知識
(必須)自身で環境構築が行える方
(推薦)線形代数及び統計の初歩的な知識
(推薦)Numpy、Pandas、Matplotlibの初歩的な知識
原則として、Pythonの初歩的な知識がある前提となっています。推薦事項は必須ではありませんが、初歩的な知識があると、よりスムーズに受講が可能です。下記の「機械学習 準備編」の無料コースをご参照下さい。
- Numpy 入門(無料)
- Matplotlib 入門(無料)
- Pandas 入門(無料)
- 線形代数 入門(無料)
- 統計 入門 (前編)(無料)
- 統計 入門 (後編)(無料)
コース詳細
機械学習準備編 統計 入門 (後編) | ||
---|---|---|
Chapter 1 コース概要と紹介 | --:-- | |
Chapter 2 Pythonのインストールと環境構築 | --:-- | |
Chapter 3 機械学習とは? | 10:16 | |
Chapter 4 教師あり学習 | 08:22 | |
Chapter 5 教師なし学習 | 05:24 | |
Chapter 6 線形回帰の概要 | 14:41 | |
Chapter 7 線形回帰モデル | 08:46 | |
Chapter 8 コスト関数 | 13:39 | |
Chapter 9 コストとパラメーター | 16:17 | |
Chapter 10 コスト関数とグラフ | 14:37 | |
Chapter 11 最急降下法 | 07:14 | |
Chapter 12 偏微分と学習率 | 13:55 | |
Chapter 13 コスト関数と最急降下法 | 09:43 | |
Chapter 14 プログラミング実習(単回帰分析) | 07:56 | |
Chapter 15 データの読み込みと確認 | 06:49 | |
Chapter 16 コスト関数の作成 | 08:46 | |
Chapter 17 最急降下法の作成 | 07:56 | |
Chapter 18 線形回帰 モデル構築 | 09:57 | |
Chapter 19 重回帰分析とモデル | 14:56 | |
Chapter 20 コスト関数と最急降下法 | 08:58 | |
Chapter 21 正規化 | 12:36 | |
Chapter 22 プログラミング実習(重回帰分析) | 12:47 | |
Chapter 23 特徴量の正規化 | 09:21 | |
Chapter 24 重回帰分析のコスト関数 | 13:37 | |
Chapter 25 重回帰分析の最急降下法 | 09:45 | |
Chapter 26 モデルを使って予測 | 10:22 |
レビュー
リリースしたとのプロモーションメールを頂いたので受講しました。機械学習の入門書を読んでいて数式などは正直難しくよく理解していなかったのですが、こちらのコースを受けて理解が深まりました。動画内で少し聞き取りづらい部分はありますが、このボリュームと内容の濃さで無料はすごいです。
講師からの返答
フィードバック、ありがとうございます!動画内のオーディオですが、改善できる部分は改善してまいります!
同僚から勧められて受講しました。Web系エンジニアとして4年のキャリアで仕事では主にphp使っています。Pythonは軽く触れたことがあるレベルでした。機械学習はずぶの素人です。序盤のチャプターは概要的な説明でサクサク勧められましたが、数式が出てきてから一気に難しくなりました。ただしコース内でもしつこいほど言われますが、とりあえず100%理解できなくても進めるのが吉です。その後のコーディング実習で数式を交えながらコーディングしていくので文系の私でも非常に分かりやすかったです。下手な機械学習入門書を読むより、断然おすすめです。
講師からの返答
フィードバック、ありがとうございます!線形回帰の続編としてスクラッチで最小二乗法と最急降下法をコーディングするチュートリアルも公開しましたので是非ご検討くださいませ!
講師紹介
本コース「線形回帰 入門」はcodexa(コデクサ)の機械学習エンジニアチームにて製作・監修を行いました。アメリカでデータ分析の実績を積んだデータサイエンティストから、Webエンジニアから機械学習エンジニアへ転向をした人まで幅広い層が所属しています。上級者の一方的な講義ではなく、「初心者がいかに理解しやすいか」を目標としています。日経ソフトウェアへの記事執筆(2019年1月号)。