Google的なシステムを介した検索手法では、ほとんどの「近過去」の情報は見つかる。しかし、ほとんどの「今」な情報は見つからない。「今」はノイズの固まり。

 で、さっきのエントリーは、はいそのとうりなんでそうしましょ、
個人的には読んで納得、その後はあたし的にはどうでもいい話題なんだけど(爆)。
 
http://takagi-hiromitsu.jp/diary/20060416.html#p02
高木浩光@自宅の日記:Winnyを規制するISPは、Winnyトラフィック中の無駄割合を調査するべき
 
 でも、もうひとつのエントリーの方は、
正直言って、ちょっと無理があるかもというか、
情報の本質的な性質というものを"掴んでいない"というか
"意図的"に無視している部分がある気がする、なんとなく。
高木浩光さんが、急場の現場に気を取られている故に
相当やばいことろの話を詭弁を交えて言っているってことに
気が付いてないんじゃないか…って気がして、
そして、この一大事だからこそ気になってしまう、なんとなく。
 
 
 この書き方だけではISPはかなり説得できても、
Winnyユーザー、特にヘビーユーザー層は
まず確実に説得できないだろうなぁ…。
 もう一押しか二押しぐらいなにかグッと来るものが必要。
この感覚は、なんとなくだけど、けど決定的な違いになるんで、
色々とこだわってみる。
書けるかどうかわからないけど。
(注:下の方を読むと挫折したっぽいですよ、だめじゃん俺(泣)。)
 



 
いったん流出したファイルが止められないのは、その独特の使用方法にも原因がある。
ウィニーユーザーは、必要なものだけ選んでダウンロードするのではなく、
キーワード検索にヒットするファイルを片っ端からダウンロードして、
後から必要なものだけ見るという使い方をする。
そのため延々とウィニーを接続し続ける。
 
ウィニー騒動の本質 あまりにも情報流出のリスクが大きい,
朝日新聞社 論座, 2006年5月号
 
 
大半のファイルは、消費されることなく削除されているのではなかろうか。
 
ISPは、Winnyのそうした使われ方の実態を調べたらいい。
「平均10Mbpsで通信しているのに、
そのうちの99パーセントは無意味に捨てられている」
という結果を出せれば、Winnyには欠陥があると主張することができるはずだ。
 
昔は、シグネチャを5行以上書くと
トラフィックの無駄だ」などと
ネットワーク屋にトンチキなことを言われたものだ。
それが今はどうだ。
 
まっとうなソフトウェア作者なら、
ネットワーク回線を有益に使うためのトラフィック調整を考えて作るだろう。
Winnyは、Winnyネットワークにとってだけ都合がよいように作られた
利己的プログラムである。
全体のトラフィック制御をせず、最大限使い尽くし、
基幹ネットワークのボトルネックによって
結果的にトラフィック制御されるという、
傍若無人なソフトウェアだろう。
 まず、「99パーセントは無意味に捨てられている」というのが
どれくらい信頼できるのか判らないんだけどそれは置いておく*1
 
 現実世界やネットワーク上で情報を集める場合は、
それだけを狙って手に入れる情報の入手方法、
例えば本屋でISBNを言って「Web進化論」を注文したり
Google検索で「寒天の作り方2.0」で探すとかいう方法もあるけど、
それとは別の手法として、
様々な情報の森のなかをぶらぶらしてるときに手に入れる情報があって、
例えば本屋の平積みの棚に目が留まって本を購入したり、
知人のはてなブックマークの一覧からおもしろそうな記事を読んでみたり、
散歩中にふと見つけた甘味所に立ち寄ってみたりするってのもあって

何言ってるんだろう、あ、Winnyの話だった。
 
 ある"キーワード"ってからファイルをゲットするってのは、
最初の内はおそろしくロスが無い(かのように)情報が集まるんだけど*2
そのうち、そういう探し方だけでは物足りなくなる。
ファイルを大量にチェックしている上級者になるほど
キーワードで探す手法のある程度の限界は見えてきて、
そこから(仮想のまだ見つからない)当該ファイル
"周辺"のキーワードを使って検索することで探索の網を広げてみたり、
そこから先はノイズの海に自らじゃんじゃん飛び込むことでしか
情報が集まらなくなって、結果的に「効率」が悪くなるんじゃないかなぁ。
いわば、「高速道路の先の大渋滞」の部分や、
ソーシャルブックマークでの「タグ」から検索だけでなく
新着情報に自分が最初に「タグやコメントを付けることになる」部分。
あるいは、市井にある"キーワード"を吊しで使う状態から
より自分好みにタグやキーワードを付け直していく部分。
(そこから先に行くと、こんな具合に自分で長い文章を書く羽目になる(汗。)
 
 ある程度までは、Google的なキーワード検索で効率的に集まるんだけど、
ある程度から"先"の世界はキーワード検索だけではどうにもならない、
まだまだタグの打たれてない非効率な探索の世界に踏み出さざるおえないと言うか、
いわば足で稼ぐ*3な世界が待ってるってこと。
 コピペの積み重ねではどうこういけない試行錯誤の世界では
集めた情報の99%が無駄になるとか、本1冊読んで引用は1行だけとか、
図書館で資料1日中探しまくっても何も目新しい成果がなかったとか、
試聴したレコードを30秒聴いて棚に戻すX50回なんてのはざらです。
*4
 
 この辺りは、検索"効率"が上がることである程度精度は上がるにせよ、
それでも、おそらく100にひとつふたつしかグッとこない世界です。
検索効率や精度が上がってきたとしても、その分、欲深い人々が
探し求めるものの「クオリティ」がずんずん上がっていくので
所詮はイタチゴッコかと。
 
 で、問題は、そういう状態の時の、当りに出会う手間を
どの程度「無意味に捨て」と考えるのかということ。
ここで高木さんみたく99%を「無意味に捨て」って言い切っちゃうと、
それはさすがになんか変な気がする。
この「無意味に捨て」の中には相当減らし辛い「無意味」もある。
 
 高木さんが言っている

シグネチャを5行以上書くと
って部分の無駄は、なんとなく反復の無駄って感じ。
私の署名も、初対面の人を除いては未だに大体3〜4行程度です。
おそらくプログラマが性格的に効率化したくなる「死んだ作業」。
 
 けど、「Winnyの99%(略(仮説)」のなかで「無意味に捨て」られているファイルのうちの
おそらく何割かは、一人一人の"個人"のデスクトップ上に瞬間でも表示されて
評価と選択の結果デスクトップ上で「捨て」られているファイルのために
消費されていったトラフィックです。これは反復とはちょっと違う種類。
動画検索はいまだに人力タグ・キーワード・レビューを付けて、
そこからフィルタリングで選択する作業が主流ってのも大きい。
動画へのタグ付けはまだ全然自動化できていない人間臭い作業。
この作業は、ほぼ無尽蔵にあるの案の中から、数個の有望そうな案を選んで、
そこから色々試作・試用をしてみて、その試作品の中から有望なモノを選んで、
残りを「捨てる」って作業に近い。
 この作業を「無意味に捨て」るとみなすのは、
よっぽどくじ運がある引きの強い人かいつでも妥協出きる人かのいずれかだ。
(まあ、セキュリティだけは退却戦なんで妥協も色々必要です。)
 
 
 
 

 けど、「99パーセントは「無意味に」捨てられている」ファイルが、
Winnyの検索システムがウンと向上して「97%は「無意味(略」」になるだけで、
Winnyによるネット上のトラフィックは(数字マジックの上では)
半分近くにガクッと落ちる可能性もあるんだから*5
やっぱり、帯域の無駄使いって言い方も、ある程度あてはまるんだよなぁ…
高速な回線と充分なHDD容量さえあれば、ほんのちょっとの時間で
その帯域の無駄使いをいきなりしかも徹底的に始められるのが
Winnyのアプリとしての性質なんだよなぁ…。
 
 こんな事が起こるなんて想定外だったISPにとってみれば
Winny的なP2Pファイル交換ってのは
たまったもんじゃないだろうなぁ…。
 
で、その「無駄」なファイルを大量に数テラバイト単位レベルで貯め込んで、
ガシガシHDDの中身を常時検索できたり色々整理してタグ付けし直したり、
○○キボンヌってひとにファイル放流したりして「神」な状態の人が
おそらくWinnyとかみたいなP2P共有ファイルの世界にはゴロゴロいるんだろうなぁ。
自分のノートパソコンのHDDは120GBしかないよ。
GoogleVideoとかYouTubeのなかのHDDって何テラあるんだろ?
 
 あ〜、なんかまさに無駄な文章書いちゃったなぁ…w。
ま、無駄な文章だって私が思っただけ収穫なんで、消さずにUPするかなぁ、トホホ。
 

*1:Winnyのフィルタリング機能ってそんなに低精度なのかなぁ?。ま、元は数年前のソフトだし。

*2:けど、それはキーワード検索で手に入る情報が自分にとってあまりに未知のものばかりの場合だけだ。

*3:つまりパケ死ぬほど無駄にしまくり

*4:趣味や専門にディープにのめり込むほどこういう傾向が起こります。

*5:けど、その落ちたトラフィックを使って、またファイルを検索したりするんだろうなぁ