【Python】環境構築のためにAnacondaをインストール。データ分析はJupyter Notebookがオススメ。【機械学習】

こんにちは、書川(カキカワ)です。

非エンジニアでも、課題に対して分析したデータから解決策を生み出して分かりやし可視化して提案が出来るようになれます。

  • ・数値化したデータの視認性を高くして分かりやすく伝えたい。
  • ・ノイズの多いデータを綺麗に効率よく数値化したい。
  • ・散らかった複数のデータをまとめて分析や解析したい。

このような要望があっても、どのようにしたらいいのか分からない人は多いのは事実です。

また、ピボットテーブルやVlookUpなどを使えるに越した事はないけれど、セルの編集やグラフ作成などの非生産的な事務作業に時間を割かれないようにしたいです。

BIツールがあればもっとも、楽かもしれませんね。

少しプログラミングの知識とアイデアがあれば、情報の集積やクレンジングが非常に簡単に出来るようになります。

これからはExcelではなくPythonで分析。

分析手法に対してとやかく言うつもりはありません。ピボットでもVlookでも手早く分かりやすい分析結果をアウトプット出来ればみんな幸せです。

大きなデータのクレンジングや集計、可視化はPythonでした方が早いですが、細かい作業は断然、エクセルやスプレッドシートで行ったほうが僕は楽です。

ただ一つ言えるのは、Excelのマクロ(VBA)を扱えるなら、すでに自動化をしているだろうけれど、20カラム、5万行を超えるシートを処理すると処理速度が遅すぎてイライラしてしまうので、Pythonが早いです。

いますぐに、パソコンでPythonを使えるように環境構築をすることをお勧めします。

Pythonって何?

Pythonは、「少ないコード量でシンプルにプログラミングをかける。」「量が少ないので、書くことも読むことも分かりやすい。」という特徴があります。

出来ることが多すぎるから全ては書けないですね。機械学習やディープラーニングを行う現場ではPythonやRで書かれている事が多いことでよく知られていると思うます。

僕はPythonのツール、「Jupyter Notebook(ジュピターノートブック)」を活用します。
データサイエンティストの間でよく使われていることでよく知られています。

Anaconda(アナコンダ)をインストールする

アナコンダは、Python専用のデータサイエンティストや機械学習ツールのプラットフォームです。
Anacondaをインストールをすると、簡単に「Python3 」も「Jupyter Notebook」もインストールが出来ます。

Anacondaの公式サイト

Install anaconda

■Anacondaは好きな場所にインストールしてください。

Installing anaconda on Mac

ターミナル使ってファイルやフォルダの管理を行う。

ターミナルを開き、画像のように「jupyter notebook」を入力してエンターを押すとjupyter notebookがブラウザで開きます。

Open Terminal on Mac

このように表示されたらJupyterNotebookを扱うための環境構築は完了。

Check Jupyter notebook in browser

データ分析はPythonのライブラリPandasを使えればExcelやCSVの取り扱いを倍以上の作業効率化が出来ます。

Udemyなら動画でPythonを学ぶことが出来ます。先日はRのコースも受講するため動画を購入しました!
本よりも動画を観ながら手を動かして学んだ方がイメージが付きやすいから僕には最適な学び方だと感じます。

Pythonの講座はコチラ

Python 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイルを学ぶオンライン講座

時期によっては、本一冊の値段よりも安くUdemyのコースを購入できるセールを頻繁にしているので、ぜひUdemyをチェックしてみてくださいね。

そんな感じです。


Asset
20 Posts
Bygone
28 Posts
Coding
14 Posts