クール始動 -- この検索スタートアップはほんとうにグーグルをしのぐか?(3)

<1 2 3 4>

So Long, PageRank?

さよなら、ページランク?

Cuil is making a big push that it ranks pages by content, rather than popularity. The idea here is to poke at how Google is commonly viewed to just reward pages that have the most PageRank value.

クールは人気ではなくコンテントによってページの順位づけをするというのを大きく売り文句にしている。このアイディアはグーグルがページランク価値をもったページを優遇するという評判で一般に通っているという事実を、突き出すねらいがある。

The problem is that PageRank is just part of the way Google ranks pages. It looks at a variety of other factors, so that ranking is not just a popularity contest (see What Is Google PageRank? A Guide For Searchers & Webmasters for more about this).

問題はページランクがグーグルがページの順位づけをする方法の一部にすぎないことだ。グーグルはほかにもさまざまな要因を見ており、順位づけは単なる人気コンテストにはなっていない(「グーグル・ページランクとはなにか? 検索者やウェブ管理者むけガイド」が詳しいので参照)

The other issue is that despite the PR pitch, Cuil is indeed using popularity to rank results, as far as I can tell.

ほかの問題はPR文句とは裏腹に、クールはじっさい順位づけの結果に人気を取り入れている、とわたしは言わせていただく。

For example, in a search for [harry potter], the Harry Potter & The Order Of The Phoenix movie web site comes up first on Cuil. This is out of thousands of possible pages. How on earth can Cuil know just from the content on the page itself that the movie site should be in the top results, especially in a web environment where people can (and will) custom tailor content to mislead search algorithms?

たとえば、[ハリー・ポッター]の検索をすると、『ハリー・ポッターと不死鳥の騎士団』映画ウェブサイトがクールの第一位に出る。これは数千ものページから選んだのだ。どうやったらクールはこの映画サイトのページ自身のコンテントが最上位の結果に出てくるような判断をできるのだろうか、そもそもここは多くの人が検索アルゴリズムをミスリードするような小細工のかかったコンテントをつくれる(そうするだろう)ウェブ環境なのだが?

The answer is link analysis -- counting links and effectively seeing who is pointed at the most. The twist is that it is done by measuring the links from pages relevant to what someone search on.

その答えはリンク分析だ -- リンクを集計してみて誰がいちばんポイントを得るに至ったかを見る。その仕掛けは誰かが検索しているものと関連が強いとみられるページからのリンクに重みをつけるというものだ。

Let's go back to the [harry potter] search. When you do that at Cuil, it finds all the pages that it thinks are related to those two words. This means pages that use those words, as well as pages that have other words on them, such as "harry potter books" or "gryffindor." It figures out these relationships by seeing what type of words commonly appear across the entire set of pages it finds. Since "gryffindor" appears often on pages that also say "harry potter," it can tell these two words (well, three words -- but two different query terms) are related.

さて[ハリー・ポッター]検索に戻ろう。クールで検索した場合、この2単語に関連すると思われるページをすべて見つけてくる。これはつまりそれ以外のことば、たとえば「ハリー ポッター ブックス」だとか「グリフィンドール」といった単語も含まれているということだ。クールはこういった関連を、クールの知っているページ全体のなかで一般にどのような用途で出てくるのかを判断することによってはじき出す。「グリフィンドール」のことばが「ハリー・ポッター」と書かれたページのなかに頻繁に出てくるので、クールはこの2単語(というか、3単語 -- だが2つのべつの検索要求用語)が関連していると判断する。

Cuil then looks at the entire set to see which pages are linked to from them. Those with many or important links are likely to do better. Since the Harry Potter movie page has a lot of links pointing at it, it comes up higher in the results. Cuil even has a name for this -- IdeaRank.

クールはそこで全体をみてどのページがほかのページからリンクされているかを判断する。リンクが多い、あるいは大事なリンクがあるものが、上に来やすい。ハリー・ポッター映画のページはそこに向けたリンクがたくさんあるので、検索結果で上位に来るのだ。クールはご丁寧に名前までつけている -- アイディアランク。

If this sounds familiar to some people, that's because this particular flavor of link analysis was popularized by Teoma, which was later acquired by Ask. When Teoma appeared, it tried to distinguish itself against Google by saying it analyzed only the "subject-specific" links to do ranking. This is still played up at Ask today:

どこかで聞いたような話だという人がいるとしたら、それはこの手のリンク分析がテオマ(その後アスクに買収された)によって広められたからだろう。テオマは出てきたころ、グーグルとの差別をするために「内容重視」のリンクだけを順位づけの分析に使うと言った。これはいまでもアスクに採用されている。

Our ExpertRank algorithm goes beyond mere link popularity (which ranks pages based on the sheer volume of links pointing to a particular page) to determine popularity among pages considered to be experts on the topic of your search. This is known as subject-specific popularity. Identifying topics (also known as "clusters"), the experts on those topics, and the popularity of millions of pages amongst those experts -- at the exact moment your search query is conducted -- requires many additional calculations that other search engines do not perform. The result is world-class relevance that often offers a unique editorial flavor compared to other search engines.

わたしたちのエキスパートランク・アルゴリズムは単なるリンク人気(そのページに向けられたリンク総量でページを順位づけするもの)とはちがって、あなたの検索したトピックについて専門だと思われるページのなかから人気を決定します。これは内容重視人気といいます。トピック(「クラスターズ」ともいいます)、このトピックの専門、専門のなかでの数百万ものページの人気 -- あなたの検索要求が実行された瞬間の -- を決定するには、ほかの検索エンジンがやらないようなさらに大量の計算を必要とします。その検索結果は世界規模での関連があるので、ほかの検索エンジンとくらべて独自の読まれ方ができます。

Fair to say, despite Ask's supposed improved analysis, it never trounced Google. Moreover, there are plenty who assume -- including myself -- that Google itself does subject-specific link analysis.

公平にいって、アスクが分析を改良したからといって、グーグルをうならせたことはない。さらにいえば、ほかにも数多くの人が -- わたしも含めて -- グーグル自身がコンテント重視のリンク分析をすでにやっているとみているだろう。

So the rank by content twist at Cuil? As I've said, more twist than substance. But the content analysis is used in other ways, as I'll get into next.

それではクールのコンテント仕掛けの順位づけは? すでにいったとおり、実があるというより仕掛けだ。だがコンテント分析はほかの使いみちもある。以後そこに踏み込む。

Three Column "Magazine" Display

3カラムの「マガジン」表示

Probably the most dramatic difference between Cuil and Google is how Cuil runs search results across three columns, rather than all in a straight line:

おそらくクールとグーグルのもっとも大きなちがいは、クールが検索結果を3カラムにわけて表示しており、一列にならべて表示していないことにあるだろう。

It's appealing in one sense that you can see more results all that once. In fact, Cuil said in user testing, the display had an impact on which results was seen as "number one." Some viewed the result in the top left corner as most important -- others go to the one in the top left. When all nine results can be seen on a large screen, some assume the one if the middle is best.

ひとつには一度に見られる結果がより多いことを訴えられるのだろう。じっさい、クールはユーザ検証で、その表示によって、どれが結果の「第一位」かという見方に影響を与えたと言う。ある人は左上がいちばん大事だと見るが -- ほかの人は上段左にあるものだという。9つの結果がひとつの大画面で見られるとき、ある人は中央がいちばんだという。

In the top right corner, there a "Related Searches" box that allows you to refine your search and drill into specific topics:

右上には「関連検索」ボックスがあり、そこから検索をやりなおしてもっと詳しいトピックに入り込むことができる。

Vivisimo a long-time pioneer and Yahoo recently tapping into this to some degree with its Yahoo Search Assist service.

ヴィヴィジモが長い間先駆者で、ヤフーが最近になってヤフー検索アシスト・サーヴィスに部分的に取り入れている。

Somewhat related to this, "tabs" appear at the top of the search page listing related searches:

それに少し関連して、「タブ」が検索ページ上部にあり、関連検索のリストになっている。

Select one of these tabs, and you get back results on that particular topic. Tabs that appear reflect how popular those phrases are on the web.

このタブからひとつ選ぶと、そのトピックの検索結果に切り替わる。出てきたタブには、その語句がウェブでどのくらい人気なのかが示される。

Underneath the display, Cuil is also working to do what it views as a twist. It's trying to diversify the results by topic, so that in the case of Harry Potter, for example, you might get pages about the book as well as the movie and the author, rather than just results that are all about the book.

表示下部に、クールは工夫してその仕掛けらしきものを置いている。これはトピックの検索結果を広げて、たとえばハリー・ポッターの場合は、映画や著者だけでなく本のページも見つけることができる。結果すべてが本というのではなく。

"We're trying to choose pages that aren't all on the same topic and show you the diversity of the web," said Patterson.

「同じトピックについてだけしか出てこないページを出すのではなく、ウェブの幅広さを見てもらえるように努力しています」とパタソンは言う。

Again, however, it's not like a Google search lacks diversity. A search on Harry Potter there also brings back different types of results.

だがくりかえすが、グーグル検索が幅広さをもっていないというわけではない。ハリー・ポッターの検索といってもほかの種類の結果にも飛んでいけるのだ。

Actually, a far more dramatic example of results diversity is what someone like Hakia does. Unlike Cuil, which divides pages into topics based on word patterns, Hakia is doing real semantic analysis -- trying to understand what words actually mean and what pages are about. As a result, it groups results for [harry potter] into various categories such as:

じっさい、それよりはるかに幅広い検索結果の例は、「ハキア」がやっている。クールとはちがって、ハキアは単語の組み合わせでトピックごとにページを分け、ほんもののセマンティックな分析をやっている -- どの単語がじっさい大事で、どのページにそれがあるのかを理解しようとしている。結果として、[ハリー・ポッター]の検索結果は幅広い分類になっている。以下のとおり:

* The Books
* Headlines
* News & Interviews
* The Soundtrack
* The Games
* Photographs & Pictures
* Blogs & Fan Sites
* Myths & Controversies
* Merchandise

  • 書籍
  • 見出し
  • ニューズとインタヴュー
  • サウンドトラック
  • ゲーム
  • 写真と絵
  • ブログとファン・サイト
  • 謎と議論
  • 関連商品

Over at Mahalo, you get similar groupings -- though these are done through human work rather than through concept analysis.

マハロでも、同じような分類が出てくる -- もっともこれはコンセプト分析というよりは人間の手仕事の結果というべきだが。

Where are the ads? At launch, there will be some public service ads at the bottom of the page, so that people are used to ads being in that spot. As for revenue generating ones, the company is considering whether it should build its own ad network or partner with someone else.

広告はどこにある? 始動時には、公共サーヴィスの広告がページ下部に載るだろう。多くの人にそこに広告があると覚えてもらうために。収益生成のために、この会社は自製の広告ネットワークを構築、あるいはほかの誰かと提携することを検討している。

Related to display, Cuil automatically suggest search topics as you type into the box on its home page, queries that come from looking at the most popular related words from across the web. It will also suggest actual web sites to take you to, showing an icon next to their name:

表示に関連して、クールはあなたがホームページのボックスにタイプするたびに自動的に検索トピックを提示してくる。ウェブのいたるところからもっとも人気の関連した単語を見つけ出して、表示するようだ。これはすぐに飛んでいけるウェブ・サイトも提示して、その題名の横にアイコンも表示する。
(part 3 of 4)
<1 2 3 4>