蒙特卡洛树，蒙特卡洛树是什么算法

1，蒙特卡洛树是什么算法

蒙特卡洛算法就是用很多个随机事件的结果去逼近所需要的精确结果。与常规的牛顿搜索，正交共轭搜索之类算法不同，蒙特卡洛不用确定搜索方向，每取一个值，都跟上一个取值无关，正因为如此每一步都有很多种的可能性，这样在设计围棋这样求解步数很多的事情或过程时，所需要的内存和CPU性能几乎是无穷大，

蒙特卡洛树是什么算法

2，AlphaGo会打劫吗

打劫指黑白双方都把对方的棋子围住，这种局面下，如果轮白下，可以吃掉一个黑子；如果轮黑下，同样可以吃掉一个白子。因为如此往复就形成循环无解，所以围棋禁止“同形重复”。对于AlphaGo来说，其算法决定其在不打劫就能获胜的条件下会尽量避免劫争，因为优势下的劫争增加了搜索的不确定性，常常会使他对胜率的估计降低。但是，非胜不可的劫，电脑必然会打。去年10月AlphaGo对欧洲围棋冠军樊麾第三局、第五局，都出现劫争。其中第三局马上消劫形成转换；第五局劫争过程持续18手，亦形成转换。很多时候之所以AlphaGo不打劫，很可能是有更好的选择，只要能赢这个棋就已够了。

alphago依靠精确的专家评估系统（value network）、基于海量数据的深度神经网络（policy network），及传统的人工智能方法蒙特卡洛树搜索的组合，以及可以通过左右互搏提高自己的水平，这个真的是有的恐怖了有木有。李世石九段固然厉害，可人类毕竟是动物，机器软件程序是无休止的工作，这一点也是客观因素了。围棋九段李世石目前已经一比四落后alphago了，（比赛规定即使是在分出胜负的情况下，也要下满五局）。

AlphaGo会打劫吗

3，目前深度学习的模型有哪几种适用于哪些问题

AlphaGo依靠精确的专家评估系统（value network）:专家系统是一个智能计算机程序系统，其内部含有大量的某个领域专家水平的知识与经验，能够利用人类专家的知识和解决问题的方法来处理该领域问题。基于海量数据的深度神经网络（policy network）:多层的好处是可以用较少的参数表示复杂的函数。在监督学习中，以前的多层神经网络的问题是容易陷入局部极值点。如果训练样本足够充分覆盖未来的样本，那么学到的多层权重可以很好的用来预测新的测试样本。但是很多任务难以得到足够多的标记样本，在这种情况下，简单的模型，比如线性回归或者决策树往往能得到比多层神经网络更好的结果。非监督学习中，以往没有有效的方法构造多层网络。多层神经网络的顶层是底层特征的高级表示，比如底层是像素点，上一层的结点可能表示横线，三角；而顶层可能有一个结点表示人脸。传统的人工智能方法蒙特卡洛树搜索的组合:是一种人工智能问题中做出最优决策的方法，一般是在组合博弈中的行动（move）规划形式。它结合了随机模拟的一般性和树搜索的准确性。

quora上有个答案，hastherebeenanyworkonusingdeepl

目前深度学习的模型有哪几种适用于哪些问题

4，深度学习的模型并行是什么原理

最简单的一种方法是利用人工神经网络的特点，人工神经网络（ANN）本身就是具有层次结构的系统，如果给定一个神经网络，我们假设其输出与输入是相同的，然后训练调整其参数，得到每一层中的权重，自然地，我们就得到了输入I的几种不同表示（每一层代表一种表示），这些表示就是特征，在研究中可以发现，如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度，甚至在分类问题中比目前最好的分类算法效果还要好！这种方法称为AutoEncoder。当然，我们还可以继续加上一些约束条件得到新的Deep Learning方法，如如果在AutoEncoder的基础上加上L1的Regularity限制（L1主要是约束每一层中的节点中大部分都要为0，只有少数不为0，这就是Sparse名字的来源），我们就可以得到Sparse AutoEncoder方法。

alphago依靠精确的专家评估系统（value network）、基于海量数据的深度神经网络（policy network），及传统的人工智能方法蒙特卡洛树搜索的组合，以及可以通过左右互搏提高自己的水平，这个真的是有的恐怖了有木有。李世石九段固然厉害，可人类毕竟是动物，机器软件程序是无休止的工作，这一点也是客观因素了。比赛已经结束了，李世石一比四不敌alphago。

5，AlphaGo 用了哪些深度学习的模型

AlphaGo用了一个深度学习的模型：卷积神经网络模型。阿尔法围棋（AlphaGo）是一款围棋人工智能程序。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入，通过非线性激活方法取权重，再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样，通过合适的矩阵数量，多层组织链接一起，形成神经网络“大脑”进行精准复杂的处理，就像人们识别物体标注图片一样。扩展资料：阿尔法围棋用到了很多新技术，如神经网络、深度学习、蒙特卡洛树搜索法等，使其实力有了实质性飞跃。美国脸书公司“黑暗森林”围棋软件的开发者田渊栋在网上发表分析文章说，阿尔法围棋系统主要由几个部分组成：一、策略网络（Policy Network），给定当前局面，预测并采样下一步的走棋；二、快速走子（Fast rollout），目标和策略网络一样，但在适当牺牲走棋质量的条件下，速度要比策略网络快1000倍；三、价值网络（Value Network），给定当前局面，估计是白胜概率大还是黑胜概率大；四、蒙特卡洛树搜索（Monte Carlo Tree Search），把以上这三个部分连起来，形成一个完整的系统。参考资料来源：搜狗百科-阿尔法围棋（围棋机器人）搜狗百科-深度学习

AlphaGo依靠精确的专家评估系统（value network）、基于海量数据的深度神经网络（policy network），及传统的人工智能方法蒙特卡洛树搜索的组合，以及可以通过左右互搏提高自己的水平，这个真的是有的恐怖了有木有。李世石九段固然厉害，可人类毕竟是动物，机器软件程序是无休止的工作，这一点也是客观因素了。比赛已经结束了，李世石一比四不敌alphago。

6，AlphaGo用的什么CPU

AlphaGo的配置是可变的，最低配置是48个CPU加一个GPU，这种配置下由于计算能力太弱，所以它的围棋能力很弱，最高配置是1920个CPU加280个GPU。和李世石下棋的就是这个配置。部分媒体翻译有误，说和李世石对战的AlphaGo是单机版，实际上不是这样，和李对战的AlphaGo连接的是谷歌的内网，把当前战况发送到谷歌的计算中心，通过计算后，决定要怎么走，再发送回来。最高配置的AlphaGo的计算能力大概相当于天河二号超级计算机的计算能力的十分之一。至于具体是哪一款，官方没有说，我猜是英特尔的至强E7，因为谷歌也是美国公司，完全可以买到英特尔的E7，不像我们的天河二号，想买E7，美国不让卖，只能买到E5，还不是最强的E5。实际上从计算能力的对比也可以看出来，天河二号用了3.2万个E5，计算能力仅为AlphaGo的10倍，如果AlphaGo也用E5，应该是没有这么强，所以应该是18核36线程版的E7，而天河二号用的是12核24线程的E5。换算一下差不多，18核的E7性能相当于12核E5的1.5倍，1920个18核E7，相当于2880个12核E5，性能相当于使用了3.2万个12核E5的天河二号的十分之一，这数字就对上了。至于AlphaGo的GPU用的可能是英伟达的特斯拉，用于加速运算，由于同配置下的GPU的浮点计算能力比CPU强大得多，在部分需要大量浮点计算的场景调用GPU辅助运算，可以大大提高效率。从AlphaGo的规模来看，总功耗预计会在2000KW左右，也就是下一个小时的棋，要消耗2000度电。

AlphaGo是分布式服务器组成的阵列，并不是某一个CPU组成的，根据公布数量的来看，至少有2000多个CPU和GPU合成了这个人工智能产品。AlphaGo依靠精确的专家评估系统（value network）、基于海量数据的深度神经网络（policy network），及传统的人工智能方法蒙特卡洛树搜索的组合，以及可以通过左右互搏提高自己的水平。

从2015年10月的分布式运算公布的版本，alphago使用一千多块cpu及一百多块gpu，而这次围棋对战分析据说只用了服务器总的百分之三十资源，其余的在空闲。

alpha go是一款程序，直播中大家所看到的只是一台普通电脑而已，只执行显示功能，其计算通过网络由谷歌的超级计算机完成。cpu一般采用定制的intel xeon处理器以及intel/nvida加速卡。

文章TAG：蒙特卡洛卡洛是什么什么蒙特卡洛树