機械学習

【初心者】データ可視化の超強力ツール【データポータル】を15分で使えるように解説する

Kaggleとかやってるとデータの可視化(EDA)が大切っていうけど、Pythonでどうコーディングすればいいかわかんないな・・あー、めんどくさい・・

 

こう思う人も多いのではないでしょうか。

機械学習を使う前段階のデータへの理解はすごく大切ですが、初心者だと

 

こういう可視化がしたいだけなのに、Pythonでの書き方が分からない・・・!!

こう思ってストレスがたまることってかなりありますよね。

 

Hawaii
今日はコーディング不要で、直感的に操作ができるデータポータルの使い方を紹介します。

 

データポータルがどういうものかは詳しくは後ほど紹介しますが、Googleが提供しているデータ可視化のツールです。

意外にデータポータルを知っている方は少ないと思うのですが、今回紹介するやり方であれば無料で利用でき、非常に便利です!

 

Hawaii
実は私は仕事でデータポータルをよく使っています。なのでデータポータルを使うメリットも紹介していきますね。

 

本記事をお読みいただくと以下がわかります。

・データポータルを使うメリットが分かる

・Python等のコーディングが不要なデータポータルの使い方が分かる

 

本記事の目次は以下の通りです。

1.自己紹介

以前は全くの異業種(人材マネジメント)に7年程勤めていました。

私立四年制の文系出身で、勉強でも仕事でも、統計やプログラミング・AIといった領域には無縁の世界でした。

 

しかし仕事でプロジェクトリーダーにアサイン頂いたことをきっかけに統計・プログラミングの学習を始め、データサイエンスの分野に興味を持ちました

その結果、2020年4月からビジネス寄りのデータサイエンティスト(AIコンサルタント)として未経験転職を果たしました。

 

 

Hawaii
転職して9か月目になり、最近は少しずつ仕事の幅も増えてきました。今日は仕事でも割と使っているデータポータルについて解説していきます。

2.データポータルとは

データポータルとはGoogleが利用しているマーケティングプラットフォームで、ダッシュボードの作成やレポートの作成をおこなうことができます。

(以前はデータスタジオという名前だったようです。)

 

Hawaii
データポータルを利用するメリットを紹介していきます。

 

データポータルを利用するメリット

(1)操作が簡単(直感的にわかりやすい)

(2)無料で使える

(3)サービス間の連携が抜群

(4)【番外編】お客さんにも使ってもらえる

 

(1)操作が簡単(直感的にわかりやすい)

これは後ほどの実際の使い方紹介でお分かりいただけると思うのですが、操作がめちゃくちゃシンプルです。

しかも、データポータルを使ったことがない人でも、

 

なんとなくここをこうすればグラフが作れそう・・

 

ということが直感的にわかりやすく、非常に魅力的だと思います。

 

Hawaii
私も何も見ずに使い始め、どうしてもわからない細かい部分はネットで調べたりしています。

 

(2)無料で使える

個人で利用する場合、非常に大きなメリットですよね。

データ可視化の有名なツールは有料であることが多いので、これだけ色んなことができて無料という点でデータポータルは本当にすごいと思います。

 

■注意点

データポータルをBigQueryといった他サービスと連携し、BigQuery上のデータを加工する場合はクエリを走らせる料金がかかるようなので注意してください。

今回紹介する、csvファイルをアップロードしてデータポータルを利用する範囲では料金はかかりません。

 

(3)サービス間の連携が抜群

データポータルはcsvファイルだけでなく、Googleのあらゆるサービスと連携することができます。

すべてを紹介できないくらい多くのサービスと連携することができます。

たとえばGoogleスプレッドシートやBigQuery、MySQLとも連携できるようです。

 

Hawaii
私は普段の業務ではBigQueryとの連携がメインです。

 

(4)【番外編】お客さんにも使ってもらえる

Hawaii
番外編ですが、私がデータポータルを実務で使ったメリットを現場のデータサイエンティストという視点からもお伝えしますね。

 

データポータルは先ほどお伝えしたように直感的に操作がしやすいので、お客さん自身も操作ができるのが大きなメリットだと感じます。

たとえばデータサイエンティストが自分の手元でPythonでコーディングしてデータを可視化したとしても、次回また可視化するときは同じ人が操作する必要がありますよね。

なぜならお客さんは基本Pythonは使えないので、急にデータを見たいとなった場合に不便に感じるお客さんが多いです。

 

Hawaii
そんなとき、データポータルで1回データを作っておけば、基本的にはデータが更新されるたびに可視化されたデータも更新されるので、お客さんが自分で「更新」を押せばすぐに最新のデータを見ることができます。

 

あとは、直感的に使い方がわかりやすいメリットもあるのでお客さん自身でもデータポータルを作ることができ、非常に喜ばれました。

 

まとめ

以上、データポータルを利用するメリットを4つ紹介してきました。

 

データポータルを利用するメリット

(1)操作が簡単(直感的にわかりやすい)

(2)無料で使える

(3)サービス間の連携が抜群

(4)【番外編】お客さんにも使ってもらえる

 

Hawaii
(4)はメリットを実感できる人は少ないかもしれないですが、現場では非常に有用なツールです。皆さんの今の職場でも取り入れてみると重宝される可能性が高いと思うので、是非次から紹介するデータポータルの使い方を参考にしてみてください!

もちろん、実際に実務でデータポータルを使う場合は機密情報の取り扱い等、事前に十分に確認をしてから使うようにしてくださいね!

 

3.データポータルの使い方(Kaggleのタイタニックを例に)

今回はKaggleのタイタニックの訓練データ「train.csv」を使ってデータポータルで可視化していこうと思います!

もしKaggleのタイタニックに挑戦したことがない方は、上のリンクから「Data」タブに進み一番下のDownLoad ALLをクリックし、ダウンロードされたデータの中の「train.csv」をお手元にご用意ください。

 

手順1:データポータルにアクセス

Google検索で「dataportal」と検索し、以下のサイトをクリックします。

もしくはこちらからも飛べます。

 

すると以下の画面になるので、「データポータル」をクリックします。

手順2:レポート作成の準備

以下の画面の「作成」をクリックします。

以下の選択肢が出てくるので、「レポート」を選択します。

データポータルを初めて使う場合は以下の画面が出てくるので、「使ってみる」を選択します。

同意画面が出てくるのでチェックを入れて「同意する」を選択します。

データポータルからのお知らせを受け取りますか?という案内が表示されますが、いいえで大丈夫です。

 

以下のような画面になるので、下の方までスクロールします。

一番下までスクロールすると「ファイルのアップロード」があるのでこちらを選択します。

「承認」を押します。

以下の画面になるので、先ほどの「train.csv」をドラッグしてアップロードします。

「レポートに追加」を選択します。

ここまで操作すると自然と以下の画面が表示されます。これで下準備完了です!!

なんとなく、タイタニックのデータのNameごとの人数(Record Count)テーブルが表示されているようですね。これ自体には何の意味もないので、次から簡単なデータ可視化を試してみましょう!

 

手順3:レポート作成

よし、データ可視化をしてみるか。今回はタイタニック号の乗客の生死を予測したいから、まずは性別で何か差が出てないか見てみよう。

 

こう思った場合、まずは「グラフを追加」から「棒グラフ」を選択してみましょう。

(すみません、下のキャプチャだと棒グラフが写っていないのですが、「グラフを追加」を押すと上の方に「棒グラフ」があります)

すると、デフォルトでは以下の様な棒グラフが出てくると思います(違っていても気にしないでください)。

これだと、ディメンションがName、内訳がSexになってしまっているので少し操作していきましょう。

右側に表示されている「使用可能な項目」をスクロールして下の方にある「Survived」をディメンションの「Name」の上までドラッグ&ドロップしましょう。

 

この1操作だけで、生死別の性別の構成比がわかります!!

Hawaii
0が死亡、1が生存なので生存者には女性が多いことがわかりますね。

 

この情報が今のちょっとした操作でわかるってすごいですよね。私は最初めちゃくちゃ驚きました。

この棒グラフを同じ時間内でPythonで描いてって急に言われても初心者にとっては難しいと思うので、データポータルの威力は本当にすごいと思います。

 

手順4:少し装飾する

この後もグラフを追加していくので、少しだけ見やすくしていきましょう。

グラフのタイトルを追加しようと思うので、以下の画面から長方形を選択します(もちろんお好みでいいですよ)。

 

そしてさっき作ったグラフの上に長方形を描画します。

色は右側の「長方形のプロパティ」から変えられるので、試しに青にかえてみましょう。

さらに、先ほど長方形を選んだ以下のタブの赤枠にある「テキスト描画」を選択し、長方形の上でドラッグしてみましょう。

 

テキスト描画の中に「性別別の生存割合」と書いてみましょう。以下のようになり、文字の色やフォントの大きさは右側の「テキストのプロパティ」で変えられます。

ここでは文字を白に、フォントを20pxに変えておきます。

そして、このデータが全部で何行あるかもぱっとわかりたいので、「グラフを追加」から以下のスコアカードを選択します。

すると、以下のようにRecord Countとして今回の「train.csv」の行数である「891」が表示されます。(背景の青は先ほど同様、長方形を後ろに入れて青く塗りつぶしています)

 

以上の装飾を加えると、以下のようなレポートができあがります!

※性別別の生存割合と同じやり方で、Pclass別の生存割合も作ってみました。

これだけでも十分ですが、「少しだけ見栄えをかっこよくしたい」という方は上のキャプチャの右側にある「テーマとレイアウト」の「テーマ」からすきなイメージ色を選ぶことができます。

たとえばこれを黒にすると、このように「なんかおしゃれ・・!」なレポートのできあがりです(ピンクが少しチカチカしますが)。

 

今回は性別別・Pclass別の生存割合を棒グラフで可視化しただけですが、データポータルではあらゆるグラフをマウス1つで簡単に操作することができます!

4.まとめ

いかがでしたでしょうか。

データポータルの基本的な使い方を紹介してきました。

 

もちろん、機械学習を実装する場合はこのデータ可視化の後にPythonでコーディングしないといけないので「プログラミングができなくていい」というわけでは全くありません

ただ、初心者の頃はデータの可視化1つでもコーディングの仕方が分からず躓いて挫折していくケースが非常に多いと思います。

 

Hawaii
私自身も可視化のやり方がわからず、ものすごくストレスに感じていました。

 

この意味でデータポータルはマウス操作で簡単にデータが可視化できますし、皆さんの実務でも比較的簡単に使えるようになるのではと思っています。

私自身も実務でデータポータルはよく使っていますので、是非気軽にデータポータルを試してみてください!

 

また、今回はマウス操作だけで使えるデータポータルの使い方を紹介しましたが、その後に機械学習を実装するには、先ほど書いたようにPython等のプログラミング知識が必要になります。

しっかりPythonを学んでいきたい方は、以下の記事でおすすめのudemy講座を紹介しているので是非チェックしてみてください。

 

Hawaii
さらに、Pythonだけでなく機械学習の知識を深く身に着けたい方はプログラミングスクールの受講がおすすめです。テックアカデミーのPython+AI講座を受講した私の体験談のリンクも載せておきますので、こちらも是非お読みください。

 

 

最後までお読みいただきありがとうございました。

 

未経験からデータサイエンティストに転職するためのロードマップ販売中

未経験からデータサイエンティストに転職した私のノウハウを凝縮したロードマップをnoteで販売中です(1,280円)。

巷にあふれる「勉強法」だけでなく、「勉強した内容をどのように実務で実践し」「転職ではどのような点が評価されたのか」といった入手困難な情報を、「私のリアルな実体験」としてお届けしています。

わずか4日間で60名超の方に購入頂きました!

ロードマップの無料部分を見てみる

-機械学習

© 2021 データサイエンス はじめの一歩 Powered by AFFINGER5