Alignement de l'IA
A
Alignement de l'IA
Définition
Le défi de s'assurer que les systèmes d'IA poursuivent des objectifs et des comportements cohérents avec les intentions et les valeurs humaines. La recherche en alignement cherche à résoudre des problèmes comme le détournement de récompense, la mauvaise spécification des objectifs et l'alignement trompeur.