■■内容紹介
リアルな機械学習が、データ活用プロジェクト成功の鍵。2万人が読んだ『Python実践データ分析100本ノック』に続編が登場!
■狙い
本書は、実際のビジネスの現場を想定した100の例題を解くことで、小規模ではありますが継続的にデータ分析や機械学習を回す仕組みを構築していきます。
本書の100本ノックを解くことで、パソコン1台で施策を意識した仕組みが構築でき、データ活用プロジェクトを社内外に浸透・定着させ、文化を醸成するための最初の一歩を踏み出せるようになるはずです。本書だけでは、大規模なシステムや、様々なツールを使えるようにはなりませんが、データ活用プロジェクトを立ち上げ、きっちりと定着化させていきたいと思っている読者の方には、最初の一歩としてきっと役に立つのではないでしょうか。
■構成
本書は、データ分析システムと機械学習システムの二部構成です。
第1部ではデータ分析を行い、その結果を施策につなげるための仕組みを構築します。
データの加工から始まり、まずは探索的にデータを可視化します。また、データ可視化のダッシュボードを作成し、様々な角度から分析できるよう工夫します。そこで得られた知見は、施策につながるExcel形式のレポートとして表現します。最後に、データが継続的に更新できるようにフォルダ構成等を整理し、小規模な仕組みとして仕上げます。
第2部では、機械学習のモデルと、そのモデルを施策につなげる仕組みを構築します。
機械学習用のデータ加工の後に、機械学習モデルの構築や評価を行います。その後、機械学習の予測結果を施策につなげるレポーティングを実施します。そして、継続的にデータが更新されることを想定した「機械学習システム」を構築します。
■■目次
■第1部 データ分析システム
第1章 分析に向けた準備を行う10本ノック
第2章 データを可視化し分析を行う10本ノック
第3章 可視化の仕組みを構築する10本ノック
第4章 レポーティングする仕組みを構築する10本ノック
第5章 分析システムを構築する10本ノック
■第2部 機械学習システム
第6章 機械学習のためのデータ加工をする10本ノック
第7章 機械学習モデルを構築する10本ノック
第8章 構築した機械学習モデルで新規データを予測する10本ノック
第9章 小規模機械学習システムを作成する10本ノック
第10章 機械学習システムのダッシュボードを作成する10本ノック
■■練習するライブラリ:データ加工(Pandas)/可視化(Matplotlib、seaborn、OpenPyXL)/機械学習(scikit-learn)