テクノロジーの民主化とオープンデータの重要性

MySpaceに次いで世界第2位の規模を誇るSNS、Facebookの、Wall(掲示板のようなもの)への書き込みにおいて、「雇われた」(hired)という単語と「laid off」(クビになった)というフレーズが何回出現したかを数え、時系列グラフにした人がいる(The 463の記事)。Facebook用のアプリケーション、Facebook Lexiconを使ったものだ。自分でも調べてみたい人は、ここを見ると良い。

Facebookによるお手軽雇用調査

グラフを見ると、どうやらhiredが書かれる頻度がピークに達したのが昨年6月、そこから出現頻度は急降下、底を打ったのが年末から今年に入ったあたり、そして現在は下げ止まったものの低空飛行中、という傾向が見える。また、従来ずっと低かったlaid offの出現頻度が急上昇し始めたのが去年の10月、2月くらいにピークを迎え、でも4月以降は逓減傾向、というのも分かる。なぜか両者とも年末は急減しているというのがちょっと面白い。せっかく休みになっても掲示板だの何だのに書き込むくらいしかすることがない一部の寂しい日本人とは違い、海外では休暇は家族や友人とリアル・ワールドで充実した生活を送るということなんでしょう、たぶん。

冗談はともかく、昨年末からアメリカの経済がえらいことになっていたのは誰でも知っていることだが、新規雇用という面では去年6月のあたりですでにだいぶおかしくなっていたらしいということや、今年4月以降はやや雇用が落ち着いて底入れの兆しがあるというのは、あまり自明ではない知見なのではないかと思う。

まあ、単語やフレーズが出現する文脈については考慮に入れていないはずなので、「I’m not hired」とか言う言い回しがあったらどうするんだとか、大学生限定だった昔よりはいくらかばらけているにしても、Facebookのユーザというのはそれなりにコンピュータに造詣が深い専門職かホワイトカラーの人が多いはずで、今本当に失業問題がシリアスになってきているのは製造業のブルーカラーなんじゃないのかとか、けちをつけようと思えばいくらでもつけられるわけだが、わざわざ官庁のウェブサイトや大学の図書館を訪ねて一所懸命労働統計を漁ったりしなくても、お手軽に、そしてより即時的に(ちゃんとした統計が出るのは速報値でも一、二ヶ月後だったりする)、ネット上だけで何か気の利いたことが調べられ、分析できるというのは、良い時代になったものではないか。また、このあたりを見ると、もっとまともな雇用指標を見たプロの見解ともそれなりに一致しているようである。

データを「解放」せよ

ところで、なぜこういうことが可能になったかと言えば理由は簡単で、Facebookがデータの取得やアプリケーションの作成を一般に開放しているからだ。例えばMixiではこうは行かない。厳密に言えば、Mixiも交渉次第で生データは出してくれるのだが、たいがいの人はそこまで面倒なことはしたくないでしょう。手軽にすぐ出来るというところが重要なのである。

Facebookどころか、アメリカでは国を挙げてデータへのアクセシビリティを高めていて、最近ではData.govなどというサイトまで始めた。膨大な量の公的データを、機械処理に適した様々なフォーマットで、ここから簡単に手に入れることができる。相当な時間を費やして調べてもどこに何のデータがあるのやら判然としない(おまけに分かったところで利用のハードルがやたら高かったりする)日本のお寒い状況とは雲泥の差だし、今後この差はどんどん開いていくだろう。これは、経済学にしろ経営学にしろ、あるいは社会学にしろ、「データ処理学」の色彩を強めつつある社会科学において、彼我の差を、今まで以上に確定的なものとしてしまうに違いない。

ところで、海外ではオープンソースがとうとう当たり前の話になって、もはやオープンソースにするかしないかは議論の中心ではない。ソフトウェアはすべからくオープンソースにするのがデフォルトであり、問題は「どう」オープンソースにするかに移っている。裏を返せば、利用が自由なソースコードはもう十分に存在するのである。よほど特殊な用途で無い限り、何かをこなすコードが欲しければ、断言してもよい、すでにどこかに、オープンソースとして在る。今後のコーディングは、本質的にすべて「車輪の再発明」だと言っても過言ではない。

すなわち、ソースコードそのものはもはや希少でも何でもないのである。そして、ものの価値の根拠が結局のところ希少性に立脚するとすれば、ソースコードの相対的な価値は低下傾向にあるとも言える。では現在何が希少で価値が高いのかと言えば、それはデータだ。オープンなデータ、特に実世界の動きを反映したものが、少なくとも日本では、全く不足しているのである。

そういえば、最近になって梅田望夫氏が現在の日本のインターネットのあり方についてああだこうだと嘆いていた(ITmediaの記事)。まあ、散々煽っておいてお前が言うなという気分は私もあるのだが、確かに彼が言うように、特に日本では、せっかく高い技術的能力を持っていても、社会的にインパクトがあるというか、社会を良くするという方向にはあまり関心が向かわずに、女の子を踊らせるとか、ネギを振らせるとか、そういう正直どうでも良い方向にふらふらと行ってしまう傾向が強いような気がしないでもない。まあ、別に行っても良いんですけど。

高度な技術でくだらないことをやるというのは、長年にわたってハッカー文化の一部だったし、面白くないことを変な使命感でやってもしかたがない。だからそれはそれで大変結構なことなのだが、どうせ同じ労力をかけるなら、社会的に良い影響のある「高尚なこと」を、多くの高尚ならざる人があまり手間暇かけずに楽しくできるというふうにするのが好ましいのではないかと思う。というより、本来テクノロジーというのは、そういう風に人々をエンパワーする方向で機能すべきものだと私は思うのである。梅田氏は「“上の人”が隠れて表に出てこない、という日本の現実」が残念だと言う。私はどちらかというと、本質的に高尚なことを、くだらない人たちがくだらない動機で手軽に楽しくやってのける、そういった人口の裾野を広げるほうが重要だと思うのだ。大体、本当に「上の人」なんて大していやしないのだから。

その意味で、コンピュータの能力を活かすという点から言っても一番有望なのは、リアル・データを用いた分析の垣根を下げるということではないかと思う。そこらへんのブログを見ても分かる通り、何か社会に対してもの申したいという人は実に多い。しかし、その多くは残念ながら大して根拠のある主張ではないし、ゆえに説得力もない。おおかた単なる思い込みか愚痴である。ところが先のFacebookの例を見ても分かるように、データとその大体の扱い方さえ分かっていれば、素人がそれをああだこうだといじって面白いグラフを描くだけでも見えてくることは多い。もしかすると、そこから見えたことは専門家すら見落としていた正鵠を射ているかもしれないのである。そのためにも、とりあえずは信頼できる大量のデータに手軽に接することができる環境作りが必要だと私は思う。そうすれば、データを手軽に処理する手段も、自ずから今以上にいろいろと出てくるだろう。

ただ、大昔にも書いた通り、データをオープンにするインセンティヴは、コードをオープンにするインセンティヴよりも遙かに弱いのではないかと私は考えている。アメリカでは、オバマ政権がOpen Government構想というのを掲げたせいで、割とトップダウンでデータの公開が進んでいると聞くが、日本ではこうした政治のイニシアチブは期待薄である。よって、やはり私たち一人一人が声を上げていくしかない。そんなわけで、今後はオープンデータの概念をどう普及させていくか、そのための戦略を考えることが重要となってくると私は考えている。

投稿者: mhatta

A rapidly-aging old-school geek in Japan.