午前中、CourseraのMining of Massive Datasetsを進める。

  • 一回一回のボリュームが多すぎてついていけない…。
  • 今回は輪読で扱ったFinding Similar Itemsだったが、逆に聞き流してしまってあまり勉強にならない。Quizは簡単に感じた。
  • Finding Frequent Items?のあたりは昨年度の講義で勉強したところだったが、A-Prioriアルゴリズムで必要なメモリ量の計算方法がわからず、Quiz解けず。

午後はWebクローラ。

  • IPアドレスResolverのUnitTestが動くようにした。
  • 設定管理モジュールもなんとかしたいが、複雑に絡み合っていて解きほぐせない。他人が書いたコードは一度読んでも時間を空ければすぐに忘れてしまう。
  • DNS Lookupのモジュールは結局adnsで行くべきか、dnspythonで行くべきかわからない。前はdnspythonのほうが早い感じだったが、GNU adnsの力を借りたほうが早いのが自然な気がする。わからん。