方略学科导航

Academy of Mathematics and Systems Science, CAS Colloquia & Seminars：Markov decision process and reinforcement learning for intelligent 智能马尔可夫决策过程强化学习 2023/4/28

本次讲座主要针对智能运维中的建模优化问题。首先基于前期研究，我将讨论基于马尔可夫决策过程的有限周期的视情维护策略。考虑二元件系统以及系统元件的退化过程具有随机相关性，用二元伽马过程来描述系统退化过程。系统元件服从周期性检测，当元件的退化程度超过预防性维护阈值时，其会被替换。该维护问题可以表示成马尔可夫决策过程并可用动态规划来求解。不同于无限周期的维护策略，有限周期的最优策略是动态的，其在每次检测都...

原文地址

Academy of Mathematics and Systems Science, CAS Colloquia & Seminars：Markov decision process and reinforcement learning for intelligent operation and maintenance 智能马尔可夫决策过程强化学习 2023/4/28

本次讲座主要针对智能运维中的建模优化问题。首先基于前期研究，我将讨论基于马尔可夫决策过程的有限周期的视情维护策略。考虑二元件系统以及系统元件的退化过程具有随机相关性，用二元伽马过程来描述系统退化过程。系统元件服从周期性检测，当元件的退化程度超过预防性维护阈值时，其会被替换。该维护问题可以表示成马尔可夫决策过程并可用动态规划来求解。不同于无限周期的维护策略，有限周期的最优策略是动态的，其在每次检测都...

原文地址

Academy of Mathematics and Systems Science, CAS Colloquia & Seminars：Reinforcement Learning-Based Event-Driven Adaptive Cooperative Control of Heterogeneous Multiagent Systems 强化学习异构多智能体系统事件驱动自适应协同控制 2023/5/17

This talk focuses on the even-triggered cooperative control problem of heterogeneous multi-agent systems (MASs) using data-based reinforcement learning (RL) algorithm. To lower the communication and c...

原文地址

2017第一次强化学习转移研讨会（1st Workshop on Transfer in Reinforcement Learning） 2017 第一次强化学习转移研讨会 2017/4/25

Reinforcement Learning (RL) has achieved many successes over the years in training autonomous agents to perform simple tasks. However, it takes a long time to learn a solution and this solution can us...

原文地址

中国研究生教育排行榜-条

中国学术期刊排行榜-条

世界大学科研机构排行榜-条

中国大学排行榜-条

人　物-篇

课　件-篇

视听资料-篇

知识库-篇

研招资料 -篇

知识要闻-篇

国际动态-篇

会议中心-篇

学术指南-篇

学术站点-篇

中国研究生教育排行榜-条

中国学术期刊排行榜-条

世界大学科研机构排行榜-条

中国大学排行榜-条

人 物-篇

课 件-篇

视听资料-篇

知识库-篇

研招资料 -篇

知识要闻-篇

国际动态-篇

会议中心-篇

学术指南-篇

学术站点-篇

人　物-篇

课　件-篇