“血戰”10W+場獨占鰲頭，網易開源“最強”斗地主AI模型-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

“血戰”10W+場獨占鰲頭，網易開源“最強”斗地主AI模型

發布時間：2022-10-08 17:13:00 作者：網友整理

繼圍棋、德州撲克、星際爭霸之后，AI技術又“卷”到了斗地主游戲。近日，網易互娛 AI Lab 聯合上海交通大學和 CMU開源斗地主AI模型“PerfectDou”。該AI模型不僅擊敗了一眾已知開源的AI“同行”，成為目前實力最強的斗地主AI，相關研究成果還登上了AI頂級學術會議NeurIPS 2022，受到國際學術界的高度認可。

對人類而言，斗地主可能只是一個簡單的紙牌游戲；但在AI眼中，斗地主的玩法極具挑戰性。作為一款非完美信息游戲，斗地主不僅涉及策略合作，隊友/對手水平等復雜因素，其牌型組合更是高達27472種，極大地限制了如 CFR 等搜索類算法的使用，這也對算法模型的創新探索提出了更高的要求。

針對上述難點，網易互娛 AI Lab 聯合上海交通大學和 CMU提出基于完美信息蒸餾（PTIE）的斗地主 AI“PerfectDou”。在斗地主游戲中，非完美信息的引入主要是由于三位玩家均不能看到別人的手牌，對于任意一位玩家而言，僅可知道其余兩位玩家當前手牌的并集，但很難精準判斷每位玩家當前手牌。針對此類非完美信息問題，完美信息蒸餾的思路是構建一個第三方角色，該角色可以看到三位玩家的手牌，該角色在不告知每位玩家完美信息的情況下，通過信息蒸餾的方式，引導玩家打出基于當前情況相對合理的出牌，并贏得比賽。

針對斗地主游戲出牌組合數較多的問題，PerfectDou 基于RLCard 的工作上對動作空間進行了簡化，對占比最大的兩個出牌牌型進行動作壓縮，將整體動作空間由 27472 種縮減到 621 種，幫助AI加速訓練過程。

（PerfectDou 策略網絡結構）

為驗證AI模型的強度， PerfectDou 與各個斗地主AI分別進行了1萬局的對戰，并與之前達到 SOTA 水平的 DouZero模型單獨進行了10萬局對戰。對戰主要指標包括兩種：勝率（WP）和場均得分（ADP）。考慮到場均得分更符合斗地主游戲規則，所以將其作為主要指標，勝率則作為輔助指標。實驗結果顯示，PerfectDou 擊敗了所有已知AI斗地主模型，創下最新的SOTA水平。