輪講の発表テーマのためのプログラミング。つーわけで多腕バンディット問題でのUCBもろもろの実装。UCBのほかにもいくつか手法を試してみると、確かにUCBが結構うまく出来てることが分かる。が、実は論文の筆者が一番プッシュしてるUCB-tunedは実は理論的評価は全くされてない(性能の理論的な評価はUCB1という手法にのみ行い、UCB-tunedは「実験してみたらUCB1よりいい性能でした」というインチキ)ということで付け入るスキもありそう。1プレイあたりの計算時間O(n)の遅い手法を使えば一応勝てそう(UCBはO(1))。

さてさて僕はちょっと前まで同じ財布を13年間くらい使っていて、それがとうとうぶっ壊れたので家の奥にあった別のサイフに乗り換えたんですね。で、それがあまりに使い勝手が悪いので、先日1000円の財布を買ってさらに乗り換えました。が、これも小銭入れの部分が口の狭さの割に底が深くてなかなか使い辛い。
こりゃーもう財布探すより自前でどうにかした方がよさげっつーことで改造。

無理やり縫い付けて底を浅くしただけ。見てくれは悪いけど確実に使い勝手は向上しました。
夕飯は

  • 豚丼
  • ホウレンソウのおひたし
  • キャベツと長葱と豆腐のおひたし

たまには牛が食べたいなー。