【Python】データ分析はJupyter Notebookがオススメ。環境構築するためにAnacondaをインストール【人工知能】

Double-decker bus in Hokkaido

こんにちは、書川(カキカワ)です。

非エンジニアでも、データから定量的な課題を生み出し解決策を提案出来るようになれる。

.散らかった複数のデータをまとめて分析や解析したい。

・ノイズの多いデータを綺麗に効率よく数値化したい。

・数値化したデータの視認性を高くして分かりやすく伝えたい。

このような要望があっても、どのようにしたらいいのか分からない人は多いのは事実。

また、ピボットテーブルやVlookUpなどを使えるに越した事はないが必須項目としている古い企業の考えは捨てて、セルの編集やグラフ作成などの非生産的な事務作業に時間を割かれないようにしたい。

少しプログラミングの知識とアイデアがあれば、情報の集積やクレンジングを自動化出来るようになる。

これからはExcelではなくPythonで分析。

なぜ、ピボットテーブルやVlookUpで数値をまとめるのをお勧めしないのかを説明すると、あくまでもデータの平面的で二次元までの要素しか見ることが出来ないから。

Excelのマクロ(VBA)を扱えるなら、すでに自動化をしているだろうけれど、処理するデータが多ければ多いほどに処理速度は遅くなる。

実際にVBAを使っていたけれど、データの前処理以外では不便に感じるほどPythonの処理速度は申し分ない。

いますぐに、パソコンでPythonを使えるように環境構築をすることを勧める。

Pythonって何?

Python(パイソン)についてよく分からない方もいるだろう。

Pythonは、「少ないコード量でシンプルにプログラミングをかける。」「量が少ないので、書くことも読むことも分かりやすい。」という特徴がある。

出来ることが多すぎるから全ては書けない。機械学習やディープラーニングを行う現場ではPythonで書かれている事が多い。シリコンバレーではもちろん、日本でも人気急上昇中。

そのPythonのツール、「Jupyter Notebook(ジュピターノートブック)」を活用する。

Anaconda(アナコンダ)をインストールする

アナコンダは、データサイエンティストや機械学習用ツールのプラットフォーム

Anacondaをインストールをすると、簡単に「Python3」も「Jupyter Notebook」もインストールが出来る。

Anacondaの公式サイト

Install anaconda

Anacondaは好きな場所にインストールする。

Installing anaconda on Mac

ターミナル使ってファイルやフォルダの管理を行う。

ターミナルを開き、画像のように「jupyter notebook」を入力してエンターを押すとjupyter notebookが開く。

Open Terminal on Mac

このように表示されたらJupyterNotebookを扱うための環境構築は完了。

Check Jupyter notebook in browser

データ分析はPandasを使えればExcelやCSVの取り扱いを倍以上の作業効率化が出来る。

Udemyなら動画でPythonを学ぶことも出来る。本よりも動画を観ながら手を動かして学ぶ方がイメージが付きやすいから挫折はし難いと感じる。

Python 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイルを学ぶオンライン講座

エクセルやCSVを取り込んでから自由に要素をいじる実例が載っている本だから、より現場でのイメージは付きやすい。