Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more ■記名の有無■ hololive - ホロライブ学力診断 中学5教科 Special Edition【特別版】2セット 7回分の表紙に記名があります。大逆転合格する人だけが知っている秘密の習慣。 清風南海中学校 2016年度受験用 /英俊社(単行本)