G04-04-01

強化学習の基本

強化学習の基本を確認します。エージェント・環境・状態・行動・報酬・方策・価値関数・マルコフ決定過程(MDP)・割引率など、G検定で頻出の強化学習の基礎用語を4択問題で復習できます。

この単元で学ぶ主なキーワード

  • 強化学習
  • 状態
  • 方策
  • 価値関数
  • 状態価値関数
  • 行動価値関数
  • マルコフ性
  • 報酬

難易度を選んでください

本ページの問題は、G検定対策の学習補助を目的として独自に作成した非公式の確認問題です。公式問題・過去問・公式教材の内容を再現するものではありません。