午前中、CourseraのMining of Massive Datasetsを進める。
- 一回一回のボリュームが多すぎてついていけない…。
- 今回は輪読で扱ったFinding Similar Itemsだったが、逆に聞き流してしまってあまり勉強にならない。Quizは簡単に感じた。
- Finding Frequent Items?のあたりは昨年度の講義で勉強したところだったが、A-Prioriアルゴリズムで必要なメモリ量の計算方法がわからず、Quiz解けず。
午後はWebクローラ。
- IPアドレスResolverのUnitTestが動くようにした。
- 設定管理モジュールもなんとかしたいが、複雑に絡み合っていて解きほぐせない。他人が書いたコードは一度読んでも時間を空ければすぐに忘れてしまう。
- DNS Lookupのモジュールは結局adnsで行くべきか、dnspythonで行くべきかわからない。前はdnspythonのほうが早い感じだったが、GNU adnsの力を借りたほうが早いのが自然な気がする。わからん。