Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more ■帯の有無、状態など商品画像と実際の商品とは異なる場合がございます。駿台 日本史前近代/近代/現代・テーマ史/問題集(論述対策) テキスト通年セット 2023 計6冊 ☆ 074R0D。また、商品画像に「帯」が付いているものがありますが、中古品のため、実際の商品には付いていない場合がございます。河合塾 国公立大学理系コース 数学1〜3/理系数学実戦演習 テキスト通年セット 2023 計8冊 ☆ 087L0D。 hololive - ホロライブ学力診断 中学5教科 Special Edition【特別版】2セット