データの大きさ

ITの仕事で働いた時にいつもたくさんデータが集まった。 でもデータの大きさを理解するは大変だ。 更にデータは具体的なものではないから、分かりにくい。 プログラミングや分析に興味があるから、色々なことを友達に説明したいけど、専門的なことはかなり難しい。 だから最近説明方をよく考える。 例えばデータの大きさ。

データを保存する時に、byteを使う。大体1字は1byteだ。

1kilobyteは1024byteだ。想像したら、1kilobyteと本の1ページは同じぐらいの大きさ。

1megabyteは1024kilobyteだ。想像したら、1megabyteは1024ページの本だ。

1gigabyteは1024megabyteだ。もし1megabyteは本1冊なら、1gigabyteは本1024冊だ。 本1024冊を集めたら、本棚に入れったほうがいいと思う。

1terabyteは1024gigabyteだ。本棚1024台を集める所は図書館だ。

1petabyteは1024terabyteだ。図書館1024件があれば、県や州の図書館かもしらない。

英語で「picture is worth a thousand words」と言うことわざある。 日本語で似ていることわざある。「百聞は一見にしかず」 今僕のFacebookのプロフィール写真は50kilobytes(50ページ)ぐらいだ。 最近投稿のInstagramの写真は100kilobytes(100ページ)ぐらいだ。 カメラで映る写真は多分1megabyte(本1冊)ぐらいだ。 たしかに写真1枚と言葉1000語の大きさは近いだ。

でもIT会社はたくさんたくさんデータを集める。 例えば1つのお客さんの1のアプリの集まったデータはすごい! 小さいアプリは100megabytes(本100冊)ぐらいけど、大きいアプリは100gigabytes(本棚100台)以上かもしらない。

分析する時にたくさんデーテを集めるのは必要だった。 前の会社のデータウェアハウスは1petabyte(図書館1024件)以上だった。

毎日Instagramで80,000,000写真がアップされている。 もし写真は1megabyteなら毎日76terabyte(図書館76件)がアップされている。

データがすごいね。