近幾年, 計算機圍棋成功引發了又一輪的人工智能熱潮, 從計算機圍棋中發展出來的AlphaZero框架成功地應用在其他完全信息條件下的二人有限零和博弈問題, 進而展示出了深度學習和強化學習在智能決策領域的優異性能。本文首先介紹了AlphaZero框架中三個核心技術: 深度學習、 強化學習以及蒙特卡羅樹搜索, 然后詳細說明了AlphaZero框架兩個關鍵階段——AlphaGo和AlphaGo Zero的基本原理, 最后, 對AlphaZero框架提出了自己的思考, 并基于對AlphaZero原理的剖析討論了其對軍事決策智能化的啟示。
//www.aeroweaponry.avic.com/CN/abstract/abstract10638.shtml