>>>
搜索结果: 1-4 共查到会议中心 reinforcement相关记录4条 . 查询时间(0.046 秒)
本次讲座主要针对智能运维中的建模优化问题。首先基于前期研究,我将讨论基于马尔可夫决策过程的有限周期的视情维护策略。考虑二元件系统以及系统元件的退化过程具有随机相关性,用二元伽马过程来描述系统退化过程。系统元件服从周期性检测,当元件的退化程度超过预防性维护阈值时,其会被替换。该维护问题可以表示成马尔可夫决策过程并可用动态规划来求解。不同于无限周期的维护策略,有限周期的最优策略是动态的,其在每次检测都...
本次讲座主要针对智能运维中的建模优化问题。首先基于前期研究,我将讨论基于马尔可夫决策过程的有限周期的视情维护策略。考虑二元件系统以及系统元件的退化过程具有随机相关性,用二元伽马过程来描述系统退化过程。系统元件服从周期性检测,当元件的退化程度超过预防性维护阈值时,其会被替换。该维护问题可以表示成马尔可夫决策过程并可用动态规划来求解。不同于无限周期的维护策略,有限周期的最优策略是动态的,其在每次检测都...
This talk focuses on the even-triggered cooperative control problem of heterogeneous multi-agent systems (MASs) using data-based reinforcement learning (RL) algorithm. To lower the communication and c...
Reinforcement Learning (RL) has achieved many successes over the years in training autonomous agents to perform simple tasks. However, it takes a long time to learn a solution and this solution can us...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...