taki["blog"] = "200 OK" (R)

社会人4年目(東京1年目)の日常

2017/11/1 温

だいぶ温かい気分がした水曜日(気温のこと)。

完全な喪から立ち直って、再びマッチングアプリの闇と戯れている日々(食事に誘ったり、既読無視されたり)。会社ではテンサーフローあらためテンサーフ労(と見せかけてのテンサーボー動)をしていた。たくさんWriterを動かして出力すると動作がすごく重いので、面倒になって日付ごとのディレクトリを作ったりしている(正しいやり方は何だろう?)。

会社で「Successor Features for Transfer in Reinforcement Learning」という論文の話を聞いた(デービッドシルバー含。そういえば結局AlphaGoZeroの論文は見てない)。一般化は面白かったけど、こんな都合よく使えるんかなという印象(詳細は読んでない、話を聞いたのみ)。

[1606.05312] Successor Features for Transfer in Reinforcement Learning

他にもやらないといけないことが山積みな気がする(IBIS2017に行く準備とか)けど、今日はソフトボールして疲れたのでもう(つ∀-)オヤスミー