G04-04-03
TD学習・Q学習・SARSAの基本を確認します。TD学習・Q学習・SARSA・価値関数・行動価値関数・ベルマン方程式など、G検定で問われる代表的な強化学習アルゴリズムを4択問題で復習できます。
この単元で学ぶ主なキーワード
基本問題
動画内で説明されている内容から出題します。
応用・発展問題
動画内で説明されている内容よりも発展的な単語、概念が出題されることがあります。
本ページの問題は、G検定対策の学習補助を目的として独自に作成した非公式の確認問題です。公式問題・過去問・公式教材の内容を再現するものではありません。