機械学習を含む人工知能を扱えるITエンジニアの人材不足は深刻で、GoogleやAppleなどのIT大手の会社は挙って人材獲得競争を行なっています。
米大手人材サービスのglassdoorによると、アメリカでの機械学習エンジニアの平均年収は$120,931(約1350万円)となっています。未経験者〜1年までの機械学習エンジニアの年収でも、$100,551(約1121万円)と非常に高額です。
対して、日本のリクルートTech総研が実施した30代前半のエンジニアの年収調査では、システム開発(Web・オープン系)の平均年収で512万円というデータがあります。
冒頭でも触れた通り、これから機械学習エンジニアの不足は明らかであり、より一層、給料の高騰が期待できるわけです!現在、ソフトウェアエンジニアとして活躍されている方々も、キャリアップを目指して機械学習を勉強されている方も多いはずです。
そこで、本記事ではソフトウェアエンジニアから機械学習エンジニアへのステップアップを目指す際に、読むべき機械学習入門書を紹介させていただきます!これから、機械学習を勉強してみようかなとお考えのエンジニアさんは、是非参考にして頂ければと思います。
この記事の目次
現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法
金額:¥ 4,180円
著者:増田 秀人
購入:Amazonで購入はこちら
弊社codexaに所属しているメンバーが執筆したpandasの入門書籍です。機械学習の世界では「機械学習エンジニアの仕事の8割は前処理に費やされる」と言われています。そしてその多くは「pandas」 を使ったものです。pandasはデータ分析や機械学習の実装で最も使われるライブラリと言っても過言ではありません。データの読み込みを行い、欠損値や重複するデータなどの対処、さらに多岐にわたるデータ分析の処理を行うことが可能です。本書は「pandas」を用いて、前処理の基本について、あますところなく解説した書籍です。初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。また、最近話題のKaggleなどのデータ分析競技でもpandasは多くの方が使っています。pandasの理解が深まることで、データ前処理や上位解法を紐解く際に大いに役に立ちます。
こんな人におすすめ
- これから機械学習 / データ分析を学びたいと考えている方
- Kaggleなどのデータ分析競技に挑戦してみたい方
レビュー
- 弊社メンバーが執筆した書籍のためレビューは無しとします
やさしく学ぶ 機械学習を理解するための数学のきほん ~アヤノ&ミオと一緒に学ぶ 機械学習の理論と数学、実装まで~
金額:¥2,786円
著者:LINE Fukuoka株式会社 立石 賢吾
購入:Amazonで購入はこちら
対話形式で非常にゆるく書かれており、また他の書籍と比べても数学の初歩的な説明が非常に濃く、理解しやすいです。この1冊を読んで機械学習エンジニアとして実務を行うのは厳しいとは思いますが、機械学習の数学の入り口として読むのには最適な一冊です。また、他の入門書を購入したけど・・数学的なハードルが高すぎてイマイチ理解ができなかった・・という方にも向いている一冊です。
こんな人におすすめ
- 数学が苦手な方が一番最初に読むべき一冊!
- 他の機械学習入門書を読んでみたけど・・イマイチ理解できなかった方
レビュー
- 機械学習入門の初めての一冊決定版と言っても過言ではないくらい、非常に易しく説明がされています。
- カバーしている範囲は限定的で、また実務的な要素も少ないので、こちらの書籍で取り掛かりを掴んで、他の入門書へステップアップされるのが良いかと思います
- 機械学習の勉強を挫折された方には特におすすめ!
Python機械学習プログラミング 達人データサイエンティストによる理論と実践
金額:¥4,320円
著者:Sebastian Raschka
購入:Amazonで購入はこちら
米Amazonの機械学習の書籍としてベストセラーとなった書籍です。全体的に非常にバランスが良い印象です。回帰・画像・分類と、初歩的な機械学習の内容を幅広くカバーしています。ただし、ある程度の数学的な知識が前提となっているため、入門書の1冊目として読む場合は少しハードルが高いかもしれません。
こんな人におすすめ
- 理系出身で線形代数や基礎的な数学の知識があるエンジニアの方
- 機械学習の入門書をすでに読まれており、2冊目以降として、より深い理解をしたい方
レビュー
- ハイパーパラメーターのチューニングなど実務的な内容をカバーしているのは非常に良い点かと思います。
- 機械学習の入門書としては、正直少し難しすぎるのでは?と思う部分もあります。事前に機械学習向けの線形代数や統計入門などの知識があるとスムーズに読めるかと思います。
- Pythonの初歩的な知識があることを前提として書かれていますので、Pythonまたはプログラミングをやったことがない方は、まずはPythonに触れてから書籍を読まれた方が良いかも。
- アルゴリズムの説明を図解で解説はしているものの、初歩的な数学の知識は必要です。
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
金額:¥3,672円
著者:Andreas C. Muller
購入:Amazonで購入はこちら
機械学習エンジニアの大きな武器の一つ「Scikit-learn」を使った機械学習の入門書となります。Scikit-learnですが、Pythonの機械学習のためのオープンソースライブラリで、実務的にも世界中の機械学習エンジニアに広く深く使われています。機械学習の基本となるロジスティック回帰や線形回帰などのアルゴリズムを備えており、簡単に実装ができることから非常に人気の高いライブラリの一つです。
本書ですがScikit-learnを使って機械学習の基本を丁寧に解説されており、 Scikit-learnを学ぶことが可能です。加えて、機械学習の予測モデルの構築において非常に重要な「特徴量エンジニアリング」や「モデルの評価と改善」など、実務ですぐんでも使える内容がカバーしています。
こんな人におすすめ
- 機械学習の入門書をすでに読まれており、2冊目以降として、より深い理解をしたい方
- すぐにでも実務レベルで機械学習を使う必要がある方
- 数学/統計などの基本的な知識がある方
レビュー
- 本書ですが「入門書」とありますが、内容としては非常に実務的な項目をカバーしており、機械学習の入門書として一押しです!
- カバーしている項目も実務的かつ網羅的です。機械学習の小難しいアルゴリズムや数学的理解よりも、まずは実装をやってみたいという方に向いている書籍です。
まとめ
まだまだ日本語で読める機械学習入門書は数が非常に限られています。また、機械学習入門書と書かれている書籍でも、実際の内容は線形代数や統計など、前提知識のハードルが高く、決して初心者に易しいと言えない入門書も多数存在しているのも事実です。
今回は数学的なハードルを取り下げてくれる機械学習入門書、さらにScikit-learnなどのライブラリを使って実装メインで解説した書籍をご紹介させていただきました。
また、codexa(コデクサ)では機械学習入門者向けのチュートリアルの記事も公開しています。タイタニックの生存者予測やAmazon SageMakerを使った銀行マーケティング予測など、Pythonの知識があればすぐにでも機械学習に触れることが出来るチュートリアルも公開しています!是非、こちらも併せてご覧ください。
以上、「エンジニアが機械学習を学ぶために読むべき厳選書籍3冊」となります。