浅析强化学习与蒙特卡洛树的基本原理

外文文献知网节

文献信息节点

基本信息摘要关键词核心评价相关文献

Journal | [J] Volume 1, Issue 2. 2019.

浅析强化学习与蒙特卡洛树的基本原理

作者 : 谢嘉诚, 鲍正德, 唐娅雯

DOI: 10.18686/jsjxt.v1i2.700

全部来源

获取全文

Universe Scientific Publishing

摘要 / Abstract

如今智能科学快速发展，伴随着 Alpha Go/Zero 取得的成果，强化学习(Reinforcement Learning RL)的声望渐渐增强，这是一种能自主地进行动态选择，达到获取最优执行选择（选取最优解）的目的，使得最终回馈的奖励总值达到最大的学习方法。在强化学习的运行环境中，需求一种动态的不定单元，在使用这种动态单元的前提条件下，才能在整个环境模式中进行试验并发现正确的执行选择。蒙特卡洛树的搜索算法中，对问题的多次模拟以及基于模拟结果对最佳下一步的预测可用于强化学习算法。本文基于机器强化学习与蒙特卡洛树的基本原理，浅谈了关于将两者结合运用于人工智能领域的理论

关键词 / Keywords

机器学习；强化学习；蒙特卡洛树；人工智能

CNKI数字图书馆

个人馆/机构馆

学者成果库

学者圈

科研项目

网络资源

CNKI学术趋势
数字化学习与研究

数字化学习与研究平台

学术资源发现平台

中国知网
客户服务

充值中心

在线咨询

客服中心

关于我们
资源合作

cnki.scholar@cnki.net

+86-10-82896619
意见反馈

cnki.scholar@cnki.net

《中国学术期刊(光盘版)》电子杂志社有限公司 KDN平台基础技术由KBASE 11.0提供

CNKI数字图书馆

数字化学习与研究

客户服务

资源合作

意见反馈