The Original GOOGLE Computer Storage

seihiguchi2005-09-28


Googleの初代StorageマシンがDepartment of Computer ScienceのGates Buildingにあります.今日はふと気になったので足を運んでみました.


残念ながら, Google初代システムのマシンは展示されていません.


これ面白いかも: Google: Better Search and More..
http://speaking.stanford.edu/highlights/Google_Tips_and_Tools.html


ついでにDepartment of Computer Science
http://cs.stanford.edu/


1996年当時のStorageマシンはGatesの地下に展示してあります. ここではいろいろと授業の際に通りかかることが多かったのですが, Googleの機械が展示してあるなんて全く気がつきませんでした..


1996年というと, PC用のハードディスクの容量は512MBとか1GB,せいぜい2GBが一般的だったかと思われます. 96年というとまだ高校1年生だったころなのでPCにさわった経験はなかったのであくまで推測です. そのころの水準で4GBというと, 今の一般PCと照らし合わせると, 400 GBくらい? そうするとこのstorageは4 TBということか. すごい容量だ〜.


2005年の現代では40GBの新品HDDを買うことが難しいでしょう(容量が小さ過ぎて).

以下は引用:

Crawling the web to obtain its link structure required an enormous amount of storage in comparison with typical student projects at that time. We show here the original storage assembly, containing 10 4 Gigabyte disk drives, giving 40 Gbytes total.


Computer Scienceのサイトには博物館のような写真集があります. ここに載ってある現物はすべてGates Bldg.に展示されてありますので, ご興味がある方は足を運んでみてはいかがでしょう.

http://www-db.stanford.edu/pub/voy/museum/pictures/display/0-4-Google.htm


1日の総クエリ数

Googleのシステム(インフラ)は高価なサーバ専用マシン群ではなく, 幾多ものPCを並列に繋げて構築されているといわれています. Google Milestonesによると,

1999年 第4四半期: 300万クエリ/日
2000年 第2四半期: 1800万クエリ/日
2000年 第4四半期: 6000万クエリ/日
2001年 第1四半期: 1億クエリ/日

また, Why is Google so fast?には, Google is responding to about 4 searches per second per serverという記述があります.

そうすると


4 [サーチクエリ/秒/サーバ] x 86,400 [秒/日] x 250,000 [サーバ]
= 8.64x10^10

すなわち, 1日あたり864億のクエリが処理されている計算になります(Googleの実質稼働している総マシン数を25万台と仮定).この数字は色々な仮定を含むので, ざっくりした計算結果ですが, 数100檍の桁に達することは間違いないでしょう.


また別な手法として, ↑の4つの数字を簡単に補間(least-squareなど)してやると10^9〜10^11のオーダになります.


すごい.


Googleのサービスや中で行われていること(ほとんどがブラックボックスですが...)もすごいですが, 断片的情報から得られる数字そのものも, すごいです.

参考

場所: Gates Bldg. 地下1階 (Computer Science)
時間: 月〜金 8:00 - 17:30. 週末はロックされています
料金: 無料