R

Apprentissage par Renforcement

Définition

Un type de machine learning où un agent apprend à prendre des décisions en effectuant des actions dans un environnement et en recevant des récompenses ou des pénalités. L'agent optimise sa stratégie (politique) pour maximiser la récompense cumulée au fil du temps.

Terme défini