東京 (9/6-10/7)
前期が終わったところでラップトップのハードディスクが死んだ。その前後で自転車を盗られる、USBを失くす、SDカードを (物理的に) 壊す、など散々な目にあった。卒論が国際会議に通った喜びでなんとか平静を保っている。
修士課程に入学した。いきなり体調を崩して1つも講義に出なかったのが第一週のハイライト。
最近論文を書いたので、学んだことをまとめておく:
- 比較手法の実験は早い段階から行っておく
- 何が効いたのか、何が効かなかったのかを説明する
- こういう敵がいました、みんな苦しめられています、そこで私たちはこういう武器でこのように戦います、エイッ(簡単そうに倒す)というのが1つのわかりやすい流れ
- スペルチェックする
- レビューを受けて再提出する前に、訂正した箇所は何度も見直すこと
- 英語ではtextbfではなくtextitを使う
- 表のキャプションやカラム名は見落としがち
卒論の執筆と提出が終わった。
- 研究はソフトウェア開発ではない
- ソフトウェア開発気味なところも分野によってはあるのかもしれないが
- 「学び」が無くてはいけない
- 研究の貢献が言えないといけない
- うまくいかないのが基本
- 何にでも適用できるスーパーな手法はたぶんできない
- どういう前提条件があるときにうまくいくか、がわかれば上出来
オプトのデータ解析コンペが(ほぼ)終了。Pandasを使って数十万レコードの時系列データを整形するいい練習になった。
「伝搬」はほぼ英語のto carryに近い意味を持つ(例:「ループ伝搬」)。「伝播」はほぼto propagateの意味を持つ。「伝達」はほぼto transfer, to passの意味を持つ。
- CourseraのMMDはなんとかがんばってAdvanceまでビデオを視て(あまり理解できなかったけど)、Quizを出した
- その日を摘め – Wikipedia
午前中、CourseraのMining of Massive Datasetsを進める。
- 一回一回のボリュームが多すぎてついていけない…。
- 今回は輪読で扱ったFinding Similar Itemsだったが、逆に聞き流してしまってあまり勉強にならない。Quizは簡単に感じた。
- Finding Frequent Items?のあたりは昨年度の講義で勉強したところだったが、A-Prioriアルゴリズムで必要なメモリ量の計算方法がわからず、Quiz解けず。
午後はWebクローラ。
- IPアドレスResolverのUnitTestが動くようにした。
- 設定管理モジュールもなんとかしたいが、複雑に絡み合っていて解きほぐせない。他人が書いたコードは一度読んでも時間を空ければすぐに忘れてしまう。
- DNS Lookupのモジュールは結局adnsで行くべきか、dnspythonで行くべきかわからない。前はdnspythonのほうが早い感じだったが、GNU adnsの力を借りたほうが早いのが自然な気がする。わからん。
院試が終わった。発表は13日後。最近は今年度中に海外大学院に出願することをすっかり諦めてしまった。幸運にも浪人も留年もしないで進級できたので、もう1年日本で修行してからでもいいかと考えている。
ここ数日IBMのBlueMixと格闘している、はじめはPyramidを使うつもりだったが、Webのリソースの量を考えてDjangoを使うことにした。Almost Django’ing with Bluemix | Bluemix Stirredが大いに参考になった。