グーグルとクラウド(雲)の叡知 - BusinessWeek(4)

<1、4、5>

In late 2006, as he shuttled between the Googleplex and Seattle preparing for Google 101, Bisciglia used his entrepreneurial skills to piece together a sprawling team of volunteers. He worked with college interns to develop the curriculum, and he dragooned a couple of Google colleagues from the nearby Kirkland (Wash.) facility to use some of their 20% time to help him teach it. Following Schmidt's advice, Bisciglia worked to focus Google 101 on something students could learn quickly. "I was like, what's the one thing I could teach them in two months that would be useful and really important?" he recalls. His answer was "MapReduce."

2006年の後半に、グーグルプレックスとシアトルのあいだをグーグル101の準備のために往来していたとき、ビシーリアは持ち前のアントレプレナー的スキルを使って、まとまりの悪いボランティアのチームをひとつにまとめた。彼は大学生のインターンと一緒にカリキュラムを作る仕事をした。さらにグーグルの同僚をふたり、近所のカークランド(ワシントン州)の施設から、20%時間の一部を使って教師の手伝いをしてくれと無理に引っ張ってきた。シュミットの助言どおり、ビシーリアはグーグル101を学生が短時間で習うことのできるものに注力した。「わたしは、自分が2か月で学生に教えられて、役立ち、ほんとうに大事なものは何かと考えました」と彼は回想する。彼の回答は「マップリデュース」だった。

Bisciglia adores MapReduce, the software at the heart of Google computing. While the company's famous search algorithms provide the intelligence for each search, MapReduce delivers the speed and industrial heft. It divides each task into hundreds, or even thousands, of tasks, and distributes them to legions of computers. In a fraction of a second, as each one comes back with its nugget of information, MapReduce quickly assembles the responses into an answer. Other programs do the same job. But MapReduce is faster and appears able to handle near limitless work. When the subject comes up, Bisciglia rhapsodizes. "I remember graduating, coming to Google, learning about MapReduce, and really just changing the way I thought about computer science and everything," he says. He calls it "a very simple, elegant model." It was developed by another Washington alumnus, Jeffrey Dean. By returning to U-Dub and teaching MapReduce, Bisciglia would be returning this software "and this way of thinking" back to its roots.

ビシーリアはマップリデュースを心底慕っている。それはグーグルのコンピューティングの中核となるソフトウェアだ。会社の有名な検索アルゴリズムが個々の検索への情報を供給するとしたら、マップリデュースは速度や工業的重量を届ける。個々のタスクを数百、あるいは数千ものタスクに分け、多数のコンピュータに流し込む。ほんの1秒にも満たない時間に個々の情報の小玉が戻ってくるので、マップリデュースはほぼ無限の作業を実行できるように見える。授業が近づいてくると、とビシーリアは熱狂的に語る。「思い出しますよ、自分が卒業してグーグルにやってきてマップリデュースについて習うと、コンピュータ・サイエンスや何やかやについて考え方ががらっと変わってしまったのです」と彼は言う。彼はそれを「ごく単純で、優雅なモデル」と呼ぶ。それはもう一人のワシントン大学卒業生ジェフリー・ディーンが開発した。U-Dubに戻ってマップリデュースを教えることで、ビシーリアはこのソフトウェアと「この考え方」をその原点に立ち戻ることになる。

There was only one obstacle. MapReduce was anchored securely inside Google's machine―and it was not for outside consumption, even if the subject was Google 101. The company did share some information about it, though, to feed an open-source version of MapReduce called Hadoop. The idea was that, without divulging its crown jewel, Google could push for its standard to become the architecture of cloud computing.

障害がひとつだけあった。マップリデュースはグーグルのマシンの内部に安全に固定されている――そして部外での消費には使えない。たとえ目的がグーグル101であっても。ただし、会社は一部の情報を部外にも共有していた。目的はオープンソース・ヴァージョンのマップリデュースであるハドゥープを育てるためだ。このアイディアはグーグルの家宝を漏らすことなく、グーグルがクラウド・コンピューティングの唯一の内部構造となるための基準を推し進めることのできるものだった。

The team that developed Hadoop belonged to a company, Nutch, that got acquired. Oddly, they were now working within the walls of Yahoo, which was counting on the MapReduce offspring to give its own computers a touch of Google magic. Hadoop remained open source, though, which meant the Google team could adapt it and install it for free on the U-Dub cluster.

ハドゥープを開発したチームはナッチという会社に属しており、買収された。奇妙なことに現在このチームはヤフーの領地で働いている。これによってヤフーはマップリデュースの子孫に頼って、自社のコンピュータをグーグルの魔法の近くに差し出してしまっている。もっともハドゥープはオープンソースのままで、グーグルのチームがそれを適合させて自由にU-Dubのコンピュータ群にインストールできるというわけだ。

Students rushed to sign up for Google 101 as soon as it appeared in the winter-semester syllabus. In the beginning, Bisciglia and his Google colleagues tried teaching. But in time they handed over the job to professional educators at U-Dub. "Their delivery is a lot clearer," Bisciglia says. Within weeks the students were learning how to configure their work for Google machines and designing ambitious Web-scale projects, from cataloguing the edits on Wikipedia to crawling the Internet to identify spam. Through the spring of 2007, as word about the course spread to other universities, departments elsewhere started asking for Google 101.

グーグル101が冬期の授業要覧に現れるなり、学生が履修登録にわっと押しかけた。当初、ビスシグリアとグーグル同僚たちは教えようとした。だがやがて彼らは仕事をU-Dubの専門の教育者に譲り渡した。「あの人たちの話し方のほうがずっと明瞭です」とビシーリアは言う。数週間学生はグーグルのマシンに自分の仕事をどのように覚えこませるかを習う。また野心的なウェブ・スケール・プロジェクトの設計を習う。たとえばウィキペディアの編集を目録したり、インターネットをクロールしてスパムを特定する。2007年の春のあいだ、文字通りコースはほかの大学にも広がっていき、ほかの学科もグーグル101への問い合わせを始めた。

Many were dying for cloud knowhow and computing power―especially for scientific research. In practically every field, scientists were grappling with vast piles of new data issuing from a host of sensors, analytic equipment, and ever-finer measuring tools. Patterns in these troves could point to new medicines and therapies, new forms of clean energy. They could help predict earthquakes. But most scientists lacked the machinery to store and sift through these digital El Dorados. "We're drowning in data," said Jeannette Wing, assistant director of the National Science Foundation.

その多くが喉から手が出るほどクラウドのノウハウやクラウド・コンピューティングの力を欲しがった――とくに科学研究のために。実用的なすべての分野で、科学者は膨大な新しいデータの山と格闘しており、センサー群、分析装置、最高級の測量機器から問題が発生している。これらの貴重な発見の様式は新しい医学や療法、またクリーン・エナジーの新しい方式にも適用できる。地震予測にも役立った。だがほとんどの科学者は保存するマシン装置を持っていないし、デジタルのエル・ドラード(宝の山)を精選することにも欠いている。「わたしたちはデータに溺れているのです」とジャネット・ウィング(米国科学財団のアシスタント・ディレクタ)が言う。

BIG BLUE LARGESSE

ビッグ・ブルーの贈り物

The hunger for Google computing put Bisciglia in a predicament. He had been fortunate to push through the order for the first cluster of computers. Could he do that again and again, eventually installing mini-Google clusters in each computer science department? Surely not. To extend Google 101 to universities around the world, the participants needed to plug into a shared resource. Bisciglia needed a bigger cloud.

グーグルのコンピューティングへの渇望がビシーリアを苦境に置いた。彼は好運にも最初のコンピュータ群の注文を押し切った。彼は何度も何度もそれをできるのか、最後にはミニ・グーグル群を個々のコンピュータ・サイエンス学科にインストールできるのか? ほぼ不可能だろう。グーグル101を世界中の大学に拡大するためには、関係者が共有する資源に繋がれている必要がある。ビシーリアはさらに大きなクラウドを必要としている。
(part 4 of 5)
<1、4、5>