リンクトインがマシン・ラーニング機能「フィーチャーフー」のオープンソース公開を開始

リンクトインは今日、マシン・ラーニング機能のオープンソース・ソフトウェア「フィーチャーフー」のリリースを発表した。
これはプログラマがフィーチャー・エンジニアリングの作業効率を高めるのに役立つソフトウェアで、こうした作業においては既存データを効率的に稼動するアルゴリズムで高品質なデータへと変換することが欠かせない。
フィーチャーフーを使うと、この作業がさまざまな方式において簡略化でき、たとえば分類化、クラスタリング、標準化といった目的に活用できる。リンクトインのシニア・ソフトウェア・エンジニアであるビング・ザオはフィーチャーフーを発表するブログ記事で述べている。
リンクトインにとっては、一般の人でも利用できるオープンソース・ツールの最新版であり、これまで同社はカフカ、ザムザ、ヴォルドモート、ピノットをリリースしてきた。
定期的にオープンソースのソフトウェアをリリースしてきた企業としてはフェースブックリンクトインのほかエアbnbが挙げられ、6月に同社はマシン・ラーニング機能のエアロソルヴをオープンソース化している。
ザオはフィーチャーフーの持つ特長を次のように例を挙げながら説明している。

たとえば、プロフェッショナル・ソーシャル・ネットワークにおけるホームページのフィード・ランキングでは、フィードの種類ごとにメンバーの好みを集計する(たとえば人気投稿者の記事、連絡先の肩書変更など)のにこれまでの人気投票履歴や、表示回数をメンバーの個別フィードで分類してきました。表示回数ごとの投票数など、静的統計が可能な指標においては次のような数式を用います(1+投票数)/(10+表示回数)。これまで、この数式はオンラインのフィーチャー供用システムに組み込まれ、数式に変更が加えられる場合はコードの書き換えと適用作業が必要で、これにはかなりの作業量が伴うのが通例でした。しかし、エキスパーやフィーチャーフーを使えば、数式を次のようにすればよく、”(/(+1投票数))(+10表示回数))様式設定ファイルに記載しておくことによって、数式の変更は簡易化できます。集計のロガリズム採用を通じてこのように追加設定ができます ”(−(log2(+10表示回数))(log2(+1投票数)))”。このほうがずっと柔軟で、多用途に活用できます。

すべてJavaで書かれたフィーチャーフーは今後、新機能の追加に応じてアップデートをつづけていく予定だとザオは述べている。
フィーチャーフーはギットハブのこちらのページで入手できる。詳しくはザオのブログ記事を参照されたい。続きを読む
(From the VentureBeat blog post. Thanks to Jordan Novet.)