世界は、まだ”Exploratory”を知らない。

世界はまだExploratoryを知らない_アイキャッチ

主語が大きすぎましたね。わたしです、わたしが、最近まで”Exploratory”(エクスプロラトリー)を知らなかったんです。

みなさまは、Exploratoryのことをご存知ですか?

名前を聞いたことはあるけど、使ったことはない。そんなところかなと思います。名前も聞いたことがない? それはいけませんね。

Exploratory使用歴1週間のわたしが説明するなら、これは、何なんだろう…。BIツールとも違うしなあ。データの特徴を把握できて、ちょっとしたデータ加工ができて、可視化ができて、機械学習にも取り組めるツールです。正直まだ十分に把握できていないので、データサイエンスツール、としておきましょう。

この度わたしは、Exploratoryのデータサイエンス・ブートキャンプに参加して、その活用方法を学んできました! そこでこのツールについて、少しでもわかったことを共有できればと思います。

新しい分析ツール?RのGUIツール?なにそれ?

最初に、少し前の話をさせてください。

昨年(2019年)の冬くらいからでしょうか、周囲から「Exploratoryって知ってる?」という声が聞こえるようになってきたのは。今までなかった分析ツールなんだ、裏側はRだけどプログラミングせずに直感的に操作していけるんだ、などといろんな話が流れてきます。

正直わたしは「でもR書けばよくない?」と思って聞き流していたんですよね。やりたいことがあって、それを実現するためのRの書きかたはネットで調べたら出てきて、じゃあ勉強して書けばいいじゃないですか。わざわざ別のツールを間にはさむ必要ある?って思って。

しかもツールの使いかたもまた習得しないといけないし。ただでさえPostgreSQLとかTreasure DataとかTableauとかDomoとかGoogle Analyticsとかいろんなツール使ってるんだから、もうお腹いっぱいなんですよ。

そんな感じで、Exploratoryのことはずっと食わず嫌いの状態でした。

もしかしてExploratory、便利じゃない?

そんなわたしが、「Exploratoryアリじゃん?」って感じたのは、今年(2020年)11月末にExploratoryの実演を見たときからです。

わたしが所属する部署向けに説明会をしてもらったのですが、正直忙しいし内職しながら聞いとこ、くらいの気持ちで参加していました。ところが途中から、たぶん一番前のめりになって話を聞いていたと思います。

大まかな使いかたを聞いてみると…

手元にあるデータをExploratoryに読ませて、サマリビューでデータの様子をざっと確認する。

exploratory_サマリビュー
(こちらを含め、以下の画像はExploratoryデータサイエンス・ブートキャンプ時のデータを使用したものです。画像の掲載許可をいただいています)

さらに、ちょっとした集計や除外処理やデータ型の変更などなら、Excelよりも簡単にストレスなくその場でパパッとできる。あれこれ試してみるハードルがめちゃ低い。

exploratory_データの設定

んで、そのままスムーズに可視化へ。チャートタブを開いて、どんなものにしたいのか選んで、数ステップでキレイな図表が完成。クロス集計なんかもすぐできる。

exploratory_ヒストグラム

さっきデータ加工したけど、やっぱなしにしよう。元のままで出してみよう。っていうときも、「ステップ」の部分で前の状態まですぐに戻れる。Gitですね。

exploratory_ステップ機能

へえー…。まあ、これらのことなら他のツールでもできるのもあるけど…。Exploratoryはシンプルで使いやすくて、ストレスがないんですよね。うん。使いやすい。これは使いやすいと認めるしかない。

アリじゃない?Exploratory!

わたしが!ブートキャンプに参加します!!!

説明会ですっかりExploratoryのことが好きになったわたしは、「今度のExploratoryデータサイエンス・ブートキャンプ、うちからあと1人参加できるけど、誰か行きたい?」という上司の呼びかけに一番高く手を上げました(実際はチャットだったので見えないけど)。

「(えー、私も参加したいんですけど…)」という他のメンバーの不満の顔が目に浮かんでくるようでしたが、ええい、今回はわたしに参加させてくれ! そのあと社内向けにExploratoryの勉強会も開催するから! という強い気持ちと主張でなんとか参加権を得ました。

わたしなんかはデータ整備がメイン業務の下っ端だし、今は景気が大変な時期なので、なかなか有料の社外研修を受けさせてもらうのも大変で…。めったにないこの機会、大事にしたい…!

Nana

ちなみに、わたしがやると言ってしまった社内向けの勉強会は、来年(2021年)2月に、「Exploratoryのプロフェッショナルであるわたしが、みなさまにExploratoryの実務での活用方法を伝授しますよ!」という宣伝で実施されることになっています。大丈夫なのか。

Exploratoryデータサイエンス・ブートキャンプのスケジュールは…

見てください。これが今年(2020年)12月に参加したExploratoryデータサイエンス・ブートキャンプのスケジュールです。

exploratory_ブートキャンプ_1日目スケジュール
exploratory_ブートキャンプ_2日目スケジュール
exploratory_ブートキャンプ_3日目スケジュール

わかりますか?単純にツールの使いかたを教えるセミナーじゃないんです。統計と機械学習の基礎からやるんです。

しかも、朝の9時から夕方の18時まで、がっつり1日取り組む勉強会です。それを3日間!あらゆる業務をこのブートキャンプの前後に移動させないといけませんが、それでも参加する価値はあります。

ちなみに講師は、Exploratory社のCEOである西田さんです。ブートキャンプ前のオリエンテーション(事前にExploratoryの説明やブートキャンプの概要・進めかたなどの紹介があります)で、最初この人の顔を見て声を聞いて、「あれ、どこかで見たような…そしてこの声…聞いたことある」と思ったら、ちょっと前にTokyo.Rに出てた人でした。今年(2020年)9月くらいだったと思います。

めちゃくちゃ良い声だな、ってTokyo.Rのときに思ってたんですけど、やっぱりブートキャンプで聞いても西田さんは良い声でした。この声を3日間シャワーのように浴びられる、それだけでも十分価値があるのではないでしょうか。

で、実際にブートキャンプに参加してどうだったのか?

先に、3日間参加した感想を伝えると、「Exploratoryほとんどわからない」。

いや、ブートキャンプでの講義がわかりにくかったんじゃなくて、すごくわかりやすかったです。Exploratoryで実現できることがたくさんあるとわかって、Exploratory歴1週間の今の自分だとぜんぜん使いこなせていないこともわかって、これは今から業務でがっつり使いながら活用方法を身につけていくしかないなと思いました。

ブートキャンプに参加して、やっとExploratoryを活用するスタート地点に立てたので、ここからがんばるぞ!という気持ちです。

というか、Exploratoryを使いこなせるようになれば、今までと仕事の取り組みかたが変わってくるなと思っていて。

わたしだったら、とても大きなデータは抽出時にSQLで軽く処理はするとして…そのあとはいったんExploratoryに入れてデータを見て、あれこれ試していく。データ整備でいっぱいいっぱいになっていたのが、分析や予測にも力を入れられるようになる。これってすごくないですか? Exploratoryで、未来が変わってくるんじゃないでしょうか。

ちなみに、ブートキャンプ前にチームごとの事前ミーティングもあり(参加者をいくつかのチームに分けて、各チームにExploratory社の人がメンターとして入ってくれます)、ブートキャンプ中もチーム単位でメンターの細やかなサポートがあります。

講義資料(PDF)も録画動画も共有してもらえるし、復習するのにも困りません。手厚いサポートがありがたかったです。

Nana

Exploratoryを使って…

  • データの特徴を知ることができる。
  • データとデータとの相関を見てみることができる。
  • データのグループ化や新しいカラムの追加など、データ加工ができる。
  • バーチャートや箱ひげ図や密度曲線やエラーバーなどをつくって可視化できる。
  • 地図上にデータを表示させて、傾向を確認できる。
  • データとデータに有意な差があるのかどうか見て確認できる。
  • t検定ができる。カイ二乗検定ができる。
  • 線形回帰でデータを分析できる。
  • 決定木でデータを分析できる。
  • ロジスティック回帰やランダムフォレストで予測ができる。
  • K-Meansによるクラスタリングができる。
  • Prophetによる時系列予測ができる。

これが3日間でわかって、操作できるようになったことです。そして、その仕組みというか、統計や機械学習の理論もブートキャンプでひと通り学んでいます。

まあ、例えば統計の部分は、わたしも大学で勉強していましたが(そしてほぼ忘れましたが)、3日じゃ理解するのが難しいですよね。それを今回すごくコンパクトにわかりやすく解説されていたので、復習できてよかったです。もう一度勉強し直そうと思えました。

ただ、わかりやすいということは、細かな部分・ややこしい部分を省いている、っていうことでもあるので。だから、ちゃんと習得したかったら、やっぱり自分で本を読んだり論文を読んだり実践したりするべきですね。

ちなみにExploratory社さんは、データサイエンスの知見の共有・普及にも力を入れてらっしゃるので(ほぼ毎週何らかのセミナーがあるようです)、そういう機会も活用しながら勉強し続けたいです。過去のセミナーの内容・動画なども公開されているものがあるので、少しずつ見ていきたいなと思っています。

まとめ:Exploratory、これから来るかもしれない。

どうですか、ここまで長文読んでみて、Exploratoryに触ってみたくなりましたか? ブートキャンプに参加してみたくなりましたか? おもしろいですよー!

わたしはこの素敵なデータサイエンスツール、Exploratoryのことをもっともっと知りたいなと思っています。Exploratoryについて、わかったことや活用方法をまたこのブログに書いていきますね!

さっそく実務で使いはじめていますが、ふだんよく扱う大きさのデータを入れると動作が重くなるので、「どこまでSQLで処理して、どこからExploratoryでやろうかな」といろいろ試しているところです。

Exploratoryは30日間無料で試せるので、気になった人はぜひ公式サイトからダウンロードして使ってみてください!

Exploratory公式サイト

https://ja.exploratory.io/

(30日間のフリートライアルには、アカウント作成が必要です。名前・メールアドレス・パスワードの設定でOK。気軽に試せます。支払い情報の登録は不要)