いい技術とは何か–日本人学生エンジニアの激論160分(前編)
いい技術とは何か–日本人学生エンジニアの激論160分(後編)
エラそうなことばっかり言ってすみません・・・。
これぞGoogleキラー?Wikipedia創始者らの手による検索エンジン公開
分散型Webクローラーを活用した検索サイト「Wikia Search」のα版が公開
Wikiaのサーチエンジンが公開されました。少なくとも現状の検索結果は惨憺たるもので役に立つなどとはとても思えないできなのですが、その辺についてちょっと思ったことを(というか年始に友人と話したこと)。
Wikia Searchは、P2Pのクローラでデータを集めているらしい。ただ、計算量を考えても現代の検索エンジンで一番重いのはクロールするところではなくインデックスを作るとこなんじゃないだろうか?もしクロールも自前で行わない方がいいと判断されるほどマシンパワーがないのであれば、まともにインデックスを作れるはずがないのでないだろうか。
P2Pによる検索という話は、たぶん1990年代に生まれたアイディアで、もしかしたら当時はインデックスよりもクロールの方がずっと大変な処理だったのかもしれない。でも、あるシステムのボトルネックが時代と共に変わるのは当たり前のことで、その「クロールを分散すればどうにかなる」という概念だけ生き続けてしまった結果こういう事態になってしまったのかなと想像してみた。
Subversionが安定して動くようになって以来、バージョン管理システムの動向は気にしていなかったのだけど、最近分散型バージョン管理システムが熱いらしいのでちょっと調べてみた。
なんか比較説明を見ていたら、Mercurialがいちばんよさげ。Haskellで動いているdarcsとか格好いいんだけど常用するツールとしてどうかと問われるとちょっと引かざるを得ない。ちゃんとした理由があるわけじゃないけど;
というわけで、Mercurial使ってみました。使い方は簡単で、インストールの後バージョン管理下に置きたいディレクトリで
$ hg init $ hg add $ hg commit
と打つだけ。subversionみたいにサーバでリポジトリを作ったり云々は必要ない。
分散して動作する云々より前に、別の場所へのバックアップをあえて作る必要がないようなちょっとした時に簡単にバージョン管理ができるのがとってもありがたい。リポジトリがローカルにあるからネットワークにつながっているか否かも気にする必要ないし。
しばらく使ってみようと思う。
まだ三賀日だから間にあってます。
今年もよろしくお願いいたします。
昨年はたくさんの方にお世話になりました。かつ、自分がその人たちのおかげで毎日をうまいこと過ごせていることを実感できた年でした。本当に感謝しております。
今年の目標は「修行する」にならざるを得ないと思います。就職するし・・・。自分の過去を振り返っても、環境が変わるときが一番勉強になるときだと思っています。社会的な面でも「学生」ステートから「社会人」ステートになるわけだし、会社に入ったらまわりの人がすごすぎて毎日「やばいやばい」と思いながら過ごすことになりそうです。おてやわらかにお願いします>なかのひと
年末年始は兵庫県にいて、そばとうどんをひたすら食べていました。ネットにつながらないのでしかたなくファイナンスのかじりみたいな本や色彩についての本とかを読んでいました。
さてそろそろ年賀状を書こうかと・・・すいませんすいません。
(本当は年賀状を出したい方が死ぬほどいるんですが、ほとんどの方の住所を知らない&年賀状をやりとりする習慣のない方が多いので、省略させてもらっています)
あとついでにデザイン変えてみました。
何かもっと先に書いた方がいいことがいくつもあるんだけど、このエントリは今日しか書けないから・・・。
1月:
去年の年末に先生に「とりあえず一回企業ってところにいってみたい」って宣言して、会社とか調べる。
コンサルとかマスコミとか既にエントリー締め切っる会社もあってびっくり。
2月:
説明会とかまわって、面白い仕事ができる会社ってのはほとんどないことに唖然とする。
元々経済はそれなりに興味があったので、金融とかもおもしろいかなぁとか考えたり。
友だちに就活について話して、あまりのポジティブシンキングに「それは博士に行く気に満ちているといわざるを得ない」と酷評される。
3月:
面接とかもはじまったり。
がんばって笑顔で好きなように話せばだいたいOK。
就職のついでに未踏にもエントリーシート出す(ホントに50%以上は就活のエントリーシート)。
4月:
比較的早い時期に内定とかもらえてひと安心。ニート回避。
あと未踏も採択してもらえてよかったよかった。
5月:
いつのまにか過ぎた。
6月:
AmazonのEC2とかS3とかで遊んだり。
7月:
未踏のためのシステムとかつくったり。
8〜9月:
金沢いって、街の変なもの見たり
名古屋いって発表したり史跡見たり
神戸いって先輩にあったり遊覧船に乗ったり
教養の時の友だちとシンガポールいって観光したりあやしげな場所に行ったり
10月〜11月:
幕張でいきなり朝ご飯について意見を述べろと言われる。んでTokyo Bay FMで声が流れる。マスコミ初デビュー。
ひょっとしたことから、心臓が普通じゃない疑いがあるという診察を受けて大あわて。
生まれて初めて入院。検査入院だから、「病院のベッドに寝た」って程度の意味だけど・・・あれはいいもんじゃない。
結局問題なしという検査結果がでて、ひと安心。よかったー。
12月:
サービス公開したり。んでニュースに出たり。
お役人様のために(読まれないであろう)書類書いたり。
今年初めの目標は去年に引き続き「表に出て行く年にしたい」でした。あと「楽しく過ごせる環境をさがす」。
表に出て行くは、未踏だけかなぁ。検索して名前がいくつかヒットするようになったから成果0ではないけど。
楽しく過ごせる・・はとりあえず雇ってくれる会社があってよかった。
就活の話はまとめて書こうと4月頃から思っているけどまだ書いてない・・・。近いうちに書こう。
久々の日記。
12月13日付で、blogeyeというサービスを公開しました。
日本にたくさんあるブログそれぞれについて、著者の性別・年齢・居住域(都道府県)を推定した上で、
それぞれの属性での流行のキーワードや、キーワードをどんな人が話題にしているのかを分析できます。
未踏ソフトウェア創造プロジェクトという経産省の支援を受けて、個人的につくってみたものです。
blogeye.jp : ブログを通して社会をのぞく
いくつかのニュースサイトでも取り上げてもらえました。こんなのはじめて。
・Internet Watch 東京大学大学院生がブログ分析サービス「blogeye」公開
・ITmedia ブロガーの性別や地域ごとに人気キーワード表示する「blogeye」
・マイコミジャーナル 東大院生が次世代ブログ分析サービス「blogeye」を公開
・BroadBand Watch ブログ投稿者の性別や年齢などを分析できるブログ分析「blogeye」
Google Newsで自分の名前を検索したときに結果が出るようになりましたw
これまでに、数千人の方にのべ数万回使ってみてもらえたようです。
自分のブログやmixi日記で紹介してくれた人、某サイトに投稿してくれた人、いろいろな方に感謝。すごい感謝してます。
公開当初はIEでデザインが崩れてたりとか問題はいくつかあったけれど、システムが落ちたりはしなくてよかった。
blogやmixiでの反応とかはできる限り探して読んでいるけど、それについてはまた今度。
着いたのが夜なのでどこもやっていません。
確かに女性の髪のカール率が高いように思えます。
数GBのファイルをscpで転送するときは、
sysctl net.ipv4.tcp_window_scaling = 0 としてやらないといけないらしい。知らなかった・・・。
数TBならともかく、数GBのファイルを送るのにデフォルト値でうまくいかないなんて・・。