a lonely miner

統計データに基づくGoogle各種サービスの生存予測

先日Prismaticを眺めていたら,興味深い記事を見つけたので紹介.

Google Readerの停止がアナウンスされたのは記憶に新しいですね.はじまりあるものは,すべて終わりもあるもの.実際,最近のGoogleはビジネスにならないと判断したプロダクトを大胆に切っていっているような印象をうけます.

この記事では,これまでGoogleが運営してきた350のサービス/プロダクトのデータを,疫学統計でよく用いられる(らしい)Coxモデルとよばれる統計モデルによって解析し,どのようなサービスが今後停止されるおそれが高いのか,分析を行っています.

特徴量

特徴量として用いているのは以下のような情報.詳細な基準は元記事を参照いただくとして,簡単に抜粋してみます.

  • プロダクト名をクエリとしたGoogleのヒット数(そのまま使うのは不公平なので,サービスのリリース時期に応じて補正を加えているそうです)
  • プロダクトのタイプ.サービスなのか,プログラムなのか,モノ(Chrome Bookとか)なのか,それ以外(SoCとかI/Oのようなイベント等)なのか
  • そのプロダクトが,直接Googleに収入をもたらしているか
  • そのプロダクトが,FLOSSであるか,またはFLOSSに直接関係したものであるか
  • そのプロダクトは,他社から買収したもの,またはそれをもとにしたものであるか
  • そのプロダクトが,ソーシャルな要素を含んでいるか
  • そのプロダクトは,Googleが2005年以前にリリースされたものであるか

元記事の著者はこれらの情報をまとめたCSVファイルを公開してくださっていますが,そのままではちょっと見にくいので,Google Docsに転載&ちょっと整形してみましたのでよろしければご覧ください.ライセンスは元記事のとおり,CC0で.

分析結果

このデータをCoxモデルにフィットさせた結果,以下のような要素がシャットダウンのリスクを低減させることが分かったそうです.

  1. Googleが他社から買収したプロダクトではないこと
  2. FLOSSではないこと
  3. Googleに直接収益をもたらすこと
  4. ソーシャルネットワークと関係ないこと
  5. Google検索でのヒット数が多いこと
  6. 2005年以前にリリースされたものであること

2番,4番の要素がちょっと意外.

その結果,以下のようなプロダクトがシャットダウンのリスクが高い,という予測を行っています.

  1. Schemer
  2. Boutiques
  3. Magnifier
  4. Hotpot
  5. Page Speed Online API
  6. WhatsonWhen
  7. Unofficial Guides
  8. WDYL search engine
  9. Cloud Messaging
  10. Correlate

あまり聞いたことないプロダクトが並びます.あれ,Google Boutiquesって閉鎖したんじゃなかったっけ?Google Correlateも,生きていたのが意外です. 逆にシャットダウンのリスクが低いプロダクトは以下の通り.

  1. Search
  2. Translate
  3. AdWords
  4. Picasa
  5. Groups
  6. Image Search
  7. News
  8. Books
  9. Toolbar
  10. AdSense

まぁこちらは妥当な感じ.PicasaやToolbarは微妙な感じもしますが.

元記事には,いくつかの有名プロダクトの5年生存率を計算した表もありますので,そちらもあわせてご覧ください.Google Glassの5年生存率は37%,とか,ちょっぴりセンセーショナルな結果もあります.

まとめ

350ものGoogleプロダクトのデータを用いて,どのようなサービスがシャットダウンのリスクが高いのか分析を行った記事を紹介しました.

特徴量としては,ここに挙げられているもの意外にもさまざまなな要因が考えられるとは思いますが,分析の切り口として面白いものではあると思います.ソーシャルものは苦手だとか,FLOSSには消極的になりつつあるとか,何となく感じていたGoogleの企業としての特徴がデータからも透けてみえるのが興味深い.

個人的には,Google Code Searchのシャットダウンが痛かった...いまだによい代替を見つけられずにいます.

Comments