YahooBBの個人情報流出データ量

26 Feb

YahooBBの個人情報流出についてちょっと考えてみた。

新聞とかの報道では、不正アクセスの記録がないとか、何人の人がアクセスできるとかそういう議論が多いけど、データベースそのものを持っていかれたという可能性をまず疑うべきだと思うんだが・・・。460(470?)万件なんてデータ、データベース丸ごとのほうが自然だと思うが。

で、そのデータ量について考えてみた。DVD1枚という報道以外に、CSVで10GBちょいとか、いろいろと説はある。
たとえばCSVで10GBだとすると、CSVではほとんど無駄なデータはないので一人当たりの情報は全角1160文字。
(10×1024×1024×1024 /4,600,000=2334.…(byte)=1167.…文字)
個人情報にしては多すぎる気がする。

逆に、CDじゃなくてDVDであることを考えれば、一人当たりの最低流出データ量が分かる。CDの容量(最近のだと700MB?)を460万人で割った、全角80文字。これ以上であることは確実。

さて、1人分のデータに何バイト必要か考えてみる。
うちの郵便番号、住所、住所のフリガナ、名前、名前のフリガナ、契約電話番号、契約日、メールアドレスをCSVデータで(カンマやダブルクオーテーションをつけて)文字数を数えると、69文字。
ということは、Yahooが公表したデータだけが含まれていたとすると、大体CD1枚分くらいの容量が妥当。

さて、CD1枚分かそこらのデータをDVDに入れるだろうか・・・。
CD1枚なら入りきらなくても、2枚なら十分入るはず。

1枚にまとめてあったほうが扱いやすいからDVDに入れてた可能性も十分あるにはあるけど・・・。

Leave a Reply

Your email address will not be published.