主語が大きすぎましたね。わたしです、わたしが、最近まで”Exploratory”(エクスプロラトリー)を知らなかったんです。
みなさまは、Exploratoryのことをご存知ですか?
名前を聞いたことはあるけど、使ったことはない。そんなところかなと思います。名前も聞いたことがない? それはいけませんね。
Exploratory使用歴1週間のわたしが説明するなら、これは、何なんだろう…。BIツールとも違うしなあ。データの特徴を把握できて、ちょっとしたデータ加工ができて、可視化ができて、機械学習にも取り組めるツールです。正直まだ十分に把握できていないので、データサイエンスツール、としておきましょう。
この度わたしは、Exploratoryのデータサイエンス・ブートキャンプに参加して、その活用方法を学んできました! そこでこのツールについて、少しでもわかったことを共有できればと思います。
目次
◆ 新しい分析ツール?RのGUIツール?なにそれ?
最初に、少し前の話をさせてください。
昨年(2019年)の冬くらいからでしょうか、周囲から「Exploratoryって知ってる?」という声が聞こえるようになってきたのは。今までなかった分析ツールなんだ、裏側はRだけどプログラミングせずに直感的に操作していけるんだ、などといろんな話が流れてきます。
正直わたしは「でもR書けばよくない?」と思って聞き流していたんですよね。やりたいことがあって、それを実現するためのRの書きかたはネットで調べたら出てきて、じゃあ勉強して書けばいいじゃないですか。わざわざ別のツールを間にはさむ必要ある?って思って。
しかもツールの使いかたもまた習得しないといけないし。ただでさえPostgreSQLとかTreasure DataとかTableauとかDomoとかGoogle Analyticsとかいろんなツール使ってるんだから、もうお腹いっぱいなんですよ。
そんな感じで、Exploratoryのことはずっと食わず嫌いの状態でした。
◆ もしかしてExploratory、便利じゃない?
そんなわたしが、「Exploratoryアリじゃん?」って感じたのは、今年(2020年)11月末にExploratoryの実演を見たときからです。
わたしが所属する部署向けに説明会をしてもらったのですが、正直忙しいし内職しながら聞いとこ、くらいの気持ちで参加していました。ところが途中から、たぶん一番前のめりになって話を聞いていたと思います。
大まかな使いかたを聞いてみると…
手元にあるデータをExploratoryに読ませて、サマリビューでデータの様子をざっと確認する。

さらに、ちょっとした集計や除外処理やデータ型の変更などなら、Excelよりも簡単にストレスなくその場でパパッとできる。あれこれ試してみるハードルがめちゃ低い。

んで、そのままスムーズに可視化へ。チャートタブを開いて、どんなものにしたいのか選んで、数ステップでキレイな図表が完成。クロス集計なんかもすぐできる。

さっきデータ加工したけど、やっぱなしにしよう。元のままで出してみよう。っていうときも、「ステップ」の部分で前の状態まですぐに戻れる。Gitですね。

へえー…。まあ、これらのことなら他のツールでもできるのもあるけど…。Exploratoryはシンプルで使いやすくて、ストレスがないんですよね。うん。使いやすい。これは使いやすいと認めるしかない。
アリじゃない?Exploratory!
◆ わたしが!ブートキャンプに参加します!!!
説明会ですっかりExploratoryのことが好きになったわたしは、「今度のExploratoryデータサイエンス・ブートキャンプ、うちからあと1人参加できるけど、誰か行きたい?」という上司の呼びかけに一番高く手を上げました(実際はチャットだったので見えないけど)。
「(えー、私も参加したいんですけど…)」という他のメンバーの不満の顔が目に浮かんでくるようでしたが、ええい、今回はわたしに参加させてくれ! そのあと社内向けにExploratoryの勉強会も開催するから! という強い気持ちと主張でなんとか参加権を得ました。
Nana
ちなみに、わたしがやると言ってしまった社内向けの勉強会は、来年(2021年)2月に、「Exploratoryのプロフェッショナルであるわたしが、みなさまにExploratoryの実務での活用方法を伝授しますよ!」という宣伝で実施されることになっています。大丈夫なのか。
見てください。これが今年(2020年)12月に参加したExploratoryデータサイエンス・ブートキャンプのスケジュールです。



わかりますか?単純にツールの使いかたを教えるセミナーじゃないんです。統計と機械学習の基礎からやるんです。
しかも、朝の9時から夕方の18時まで、がっつり1日取り組む勉強会です。それを3日間!あらゆる業務をこのブートキャンプの前後に移動させないといけませんが、それでも参加する価値はあります。
ちなみに講師は、Exploratory社のCEOである西田さんです。ブートキャンプ前のオリエンテーション(事前にExploratoryの説明やブートキャンプの概要・進めかたなどの紹介があります)で、最初この人の顔を見て声を聞いて、「あれ、どこかで見たような…そしてこの声…聞いたことある」と思ったら、ちょっと前にTokyo.Rに出てた人でした。今年(2020年)9月くらいだったと思います。
めちゃくちゃ良い声だな、ってTokyo.Rのときに思ってたんですけど、やっぱりブートキャンプで聞いても西田さんは良い声でした。この声を3日間シャワーのように浴びられる、それだけでも十分価値があるのではないでしょうか。
先に、3日間参加した感想を伝えると、「Exploratoryほとんどわからない」。
いや、ブートキャンプでの講義がわかりにくかったんじゃなくて、すごくわかりやすかったです。Exploratoryで実現できることがたくさんあるとわかって、Exploratory歴1週間の今の自分だとぜんぜん使いこなせていないこともわかって、これは今から業務でがっつり使いながら活用方法を身につけていくしかないなと思いました。
ブートキャンプに参加して、やっとExploratoryを活用するスタート地点に立てたので、ここからがんばるぞ!という気持ちです。
というか、Exploratoryを使いこなせるようになれば、今までと仕事の取り組みかたが変わってくるなと思っていて。
わたしだったら、とても大きなデータは抽出時にSQLで軽く処理はするとして…そのあとはいったんExploratoryに入れてデータを見て、あれこれ試していく。データ整備でいっぱいいっぱいになっていたのが、分析や予測にも力を入れられるようになる。これってすごくないですか? Exploratoryで、未来が変わってくるんじゃないでしょうか。
講義資料(PDF)も録画動画も共有してもらえるし、復習するのにも困りません。手厚いサポートがありがたかったです。
Nana
Exploratoryを使って…
- データの特徴を知ることができる。
- データとデータとの相関を見てみることができる。
- データのグループ化や新しいカラムの追加など、データ加工ができる。
- バーチャートや箱ひげ図や密度曲線やエラーバーなどをつくって可視化できる。
- 地図上にデータを表示させて、傾向を確認できる。
- データとデータに有意な差があるのかどうか見て確認できる。
- t検定ができる。カイ二乗検定ができる。
- 線形回帰でデータを分析できる。
- 決定木でデータを分析できる。
- ロジスティック回帰やランダムフォレストで予測ができる。
- K-Meansによるクラスタリングができる。
- Prophetによる時系列予測ができる。
これが3日間でわかって、操作できるようになったことです。そして、その仕組みというか、統計や機械学習の理論もブートキャンプでひと通り学んでいます。
まあ、例えば統計の部分は、わたしも大学で勉強していましたが(そしてほぼ忘れましたが)、3日じゃ理解するのが難しいですよね。それを今回すごくコンパクトにわかりやすく解説されていたので、復習できてよかったです。もう一度勉強し直そうと思えました。
ただ、わかりやすいということは、細かな部分・ややこしい部分を省いている、っていうことでもあるので。だから、ちゃんと習得したかったら、やっぱり自分で本を読んだり論文を読んだり実践したりするべきですね。
ちなみにExploratory社さんは、データサイエンスの知見の共有・普及にも力を入れてらっしゃるので(ほぼ毎週何らかのセミナーがあるようです)、そういう機会も活用しながら勉強し続けたいです。過去のセミナーの内容・動画なども公開されているものがあるので、少しずつ見ていきたいなと思っています。
◆ まとめ:Exploratory、これから来るかもしれない。
どうですか、ここまで長文読んでみて、Exploratoryに触ってみたくなりましたか? ブートキャンプに参加してみたくなりましたか? おもしろいですよー!
わたしはこの素敵なデータサイエンスツール、Exploratoryのことをもっともっと知りたいなと思っています。Exploratoryについて、わかったことや活用方法をまたこのブログに書いていきますね!
さっそく実務で使いはじめていますが、ふだんよく扱う大きさのデータを入れると動作が重くなるので、「どこまでSQLで処理して、どこからExploratoryでやろうかな」といろいろ試しているところです。
Exploratoryは30日間無料で試せるので、気になった人はぜひ公式サイトからダウンロードして使ってみてください!
(30日間のフリートライアルには、アカウント作成が必要です。名前・メールアドレス・パスワードの設定でOK。気軽に試せます。支払い情報の登録は不要)