Поскольку в проблемах POMDP агент не имеет доступа к истинному базовому состоянию, как описано здесь:
Состояния убеждений в POMDP для обучения с подкреплением (RL)
schedule
13.03.2024
Поскольку в проблемах POMDP агент не имеет доступа к истинному базовому состоянию, как описано здесь: