A

Alignement de l'IA

Définition

Le défi de s'assurer que les systèmes d'IA poursuivent des objectifs et des comportements cohérents avec les intentions et les valeurs humaines. La recherche en alignement cherche à résoudre des problèmes comme le détournement de récompense, la mauvaise spécification des objectifs et l'alignement trompeur.

Terme défini