あなたの行動はすべてお見通し!? – BigDataとPredictive Analytics

predictive

Big Data関連のスタートアップが調子いい。先日Think Big Analyticsというマウンテンビューベースの会社(まだ社員にして50人にも満たない)がエンジェル投資家から約3億円を調達。先月にはZettasetというHadoopのマネジメントおよびセキュリティー周りを手がけるソフトウェア会社が10億円を調達した。

Big Dataの行く先を各社どこに見据えているのか、それは精度の高いPredictive analyticsだ。(日本語だと「予測分析」?)
このテクノロジーに、Fortune 100にのるような企業が手を伸ばし始めているとのこと。

http://www.networkworld.com/news/2013/020513-big-data-startup-attracts-fortune-266425.html?page=1

ほんの2ー3年前までBig Dataといっても積極的な活用例などあまり見受けられなかったのだが、この予測分析の精度の高さが華々しく証明されたのが、昨年行われたアメリカ大統領選であった。

How Obama’s Campaign Used Big Data to Win the Election
http://it.tmcnet.com/topics/it/articles/2012/11/19/316443-how-obamas-campaign-used-big-data-w-the.htm

オバマ陣営はデータサイエンティストのNate Silver氏を迎え、ツイッターからFB, ブログのコメントや公式サイトのアクセス統計、ありとあらゆるソースからデータを収集。どこにキャンペーンをうち、どの層にどんなメッセージを伝えるか、かなりData Drivenで選挙活動を最適化。そして結果は見ての通りだ。

さらについ先日行われたグラミー賞でも面白いトライアルがあった。日本ではまだサービスが展開されていないがSpotifyという音楽ストリーミングサービスで現在世界を席巻している会社がある。(本社はスウェーデン)

この会社、落ち日にあったスウェーデンの楽曲売上を30%も増大させてしまうくらいインパクトがあった。CD販売による売上モデルをストリーミング配信モデルで音楽業界を塗り替えてしまったのだ。(http://musically.com/2012/07/13/spotify-sweden-ifpi-figures/)

アクティブ会員数2000万人、有料会員者数500万人のSpotifyはHadoopをベースに使ったBig Dataユーザーとしても有名。そこで彼らは自分たちのデータを元にグラミー賞受賞者を予測するというチャレンジを行った。(http://www.spotify.com/us/blog/archives/2013/02/05/grammys/

そして気になる結果は以下のとおり。

comparison

6部門のうち、4部門を当てることに成功。もちろん完璧といえる結果ではないが、4勝2敗は評価していいと思う。

また、Yahoo! Japanでも面白い試みがされていた。
http://searchblog.yahoo.co.jp/2013/01/yahoobigdata_Influenza.html

分析対象はインフルエンザの拡散の様子をBig Dataを使って予測分析。拡散の様子が都道府県レベルまで落とし込まれている。こうした地理情報が掛け合わさることでマーケターの人なら思わずわくわくしてしまいそうだ。

もちろんPredictive Analyticsは100%の確率で見通すものではない。ただ少なくとも3年先5年先が見通しづらい世の中で、不確定性を取り除くことができるだけでもかなり意思決定に貢献できる。例えば当たるか当たらないかわからないプランが10個あり、そのうち1つを選ばないといけないという状況と、Predictive Analyticsによって10個が3個に絞れたとすれば、1つ選ぶにしてもかなり選択の状況が変わる。

日本ではどうしても100%の正解を求めるという空気があるため、Predictive Analyticsの話をすると、「では100%予測してほしい」という声が聞こえてきそうだが、本質を間違えてはいけない。あくまで不確実性を最小にし、やるかやらないかの決断は人間がするもの。上記のとおりここ最近のBigData解析レベルはかなり上がってきた。これまで「経験と勘」だけが頼りだったところに、データを持ち込むことで当たる確率がグンとあがるところまで着ているのだ。

Predictive Analyticsは答えは教えてくれない。しかし変化が激しい世界の中で機敏に反応する時の大きな助けになってくれる。

さて、気をつけなければいけないのは、「だったらウチも全て数値化だ」と勢い込んでしまうこと。数値化したから全てがうまくいくわけではないということは勘違いしないでほしい。

例えばイングランドプレミアリーグの名門リバプールFCは、2010-11シーズンにまるで映画”Money Ball”のように徹底したデータ化を実施。年俸は割安だが実際はハイレベルな選手をデータを元に見つけ出しチームを構築。しかし、これは完全に失敗に終わった。リーグ優勝どころか6位に沈む。これはマネーボールで描かれていたオークランド・アスレチックスとは対照的だ。(http://epltalk.com/2012/06/06/why-moneyball-will-not-work-in-soccer/

サッカーと野球の競技の違いを考えると、野球はどちらかというとチーム個々人が独立した働き方をする。例えばバッターは打つ、ピッチャーは投げる、内野は拾ってベースを踏む、外野はキャッチしてから内野に返す。もちろん、打つにしても内角・外角といった球種の傾向等細かい部分はあるが、データが静的でシンプルな分データ化しやすい。一方サッカーはあるポジションの選手が別のポジションに移ってプレーする一方、パスばかり、シュートだけ、ということはない。また一人の選手の動きは敵と味方の選手の動きに依存する。なのでリバプールのデータサイエンティストはそうした文脈をモデル化するのに失敗したようだ。

こんな話を知ってか知らずか、うちの会社のデータサイエンティスト(女性)が面白い事を言っていた。

“Data is just like a miniskirt – you can imagine some with them but it hides the most important things if you do not use it right.”

(データはミニスカートのようなもの。正しく使わないとある程度のことは想像できても、
最も重要な部分が見えそうで見えない。)

「データを制するものがビジネスを制す」という流れは今後も加速するだろう。ただ、その扱い方をよく学んでおかないと、データによって逆に手玉にとられる。今年はデータサイエンスを学ぶテーマの1つに付け加えた。

________________________________________________________________________

ビッグデータのトレンドをわかりやすく解説してるスライドがあったのでご参考まで。
http://www.slideshare.net/bigdatalandscape/big-data-trends

広告

コメントを残す

コメントを投稿するには、以下のいずれかでログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中