科幻文化科普:-AI 可以毁了国际象棋,也可以拯救国际象棋
来源:36氪
发布时间:2020-09-21
浏览次数:1594
科幻文化科普:-AI 可以毁了国际象棋,也可以拯救国际象棋

 编者按:从IBM的深蓝开始,到DeepMind的AlphaZero,计算机陆续征服了国际象棋、围棋等最复杂的棋类游戏最顶尖的棋手。但计算机也在慢慢毁了这些棋类游戏——因为棋手们开始越来越依靠死记硬背计算机的下法来击败对手,令棋类游戏失去了原先的美丽。不过,现在DeepMind团队正在跟前国际象棋世界冠军克拉姆尼克合作,尝试国际象棋的若干变种,试图恢复棋类游戏的美丽。原文作者是TOM SIMONITE,标题为:AI Ruined Chess. Now, It’s Making the Game Beautiful Again

AI 可以毁了国际象棋,也可以拯救国际象棋

在这个研究项目里面,全世界上最会玩国际象棋的计算机跟人一起玩而不是对战

  划重点:

  自从人工智能征服了棋类游戏之后,棋类游戏变得缺乏创造力了

  如果大家愿意对既定规则做出一些小小的改动的话,其最新结果有望展现一幅令人着迷的国际象棋新图景。

  让人与机器合作而不是对抗,不仅可以丰富这种棋类游戏的技术体验,也可以丰富其情感体验。

  国际象棋以冷冰冰的逻辑著称,但克拉姆尼克(Vladimir Kramnik)是因为它的美丽而喜欢上这个游戏的。

  他说:“这是一种创造。”他对思维艺术在棋盘上的碰撞,复杂而优雅的挑衅和反击的你来我往的爱好,让他在2000年击败了卡斯帕罗夫(Garry Kasparov),坐了好几年的世界冠军王座。

  尽管如此,克拉姆尼克去年还是退出了竞技性的国际象棋比赛,同时认为自己心爱的棋类游戏已经变得越来越没有创造力了。他把其中的原因部分归咎于计算机,认为计算机缺少灵魂的算计造就了一个规模庞大的开局和防守库,然后顶尖选手开始死记硬背。克拉姆尼克说:“在最高级别的比赛当中,有相当一部分近半(有时候甚至整场比赛)的下法都是靠记忆走完的。你甚至都没有自己的下法,那全都是计算机的下法。”

  上周三,克拉姆尼克就如何让国际象棋恢复一部分人类的艺术提出了一些想法,不过这需要一个有违直觉的来源的帮忙——全世界最强大的国际象棋计算机。他正在跟Alphabet的人工智能实验室DeepMind合作,让研究人员向他们超人的国际象棋玩家AlphaZero发起挑战,看看后者能不能学习选择出来的九种国际象棋的变体,从而让棋手进入到创新性的新模式。

  2017年,AlphaZero 展示了自己可以无师自通,先后在国际象棋、围棋以及日本将棋中击败了最好的计算机棋手。克拉姆尼克说,如果大家愿意对既定规则做出一些小小的改动的话,其最新结果有望展现一幅令人着迷的国际象棋新图景。

  该项目还展示了国际象棋棋手与机器之间关系的一种更为合作的模式。从事该项目的DeepMind研究人员Nenad Tomašev 说:“开发国际象棋引擎一开始的目的是要击败跟自己下的人类棋手。现在,我们会看到像AlphaZero 这样的系统被用于跟人类一起进行创造性探索而不是针对他们。”

  人类玩国际象棋已有大约1500年的时间,对规则的调整并不是什么新鲜事。对计算机让这个游戏变得无聊的抱怨也不算新鲜。

AI 可以毁了国际象棋,也可以拯救国际象棋

前国际象棋世界冠军克拉姆尼克(左)正在跟Alphabet的DeepMind合作,利用人工智能探索国际象棋的新形式。右为DeepMind的创始人Demis Hassabis

  大约500年前,当欧洲棋手将缓慢移动的棋子提升为如今强大的后,让游戏更加流畅之后,国际象棋迅速传播开来。1996年,也就是IBM的深蓝(Deep Blue)击败卡斯帕罗夫的前一年,变成逃亡者的国际象棋神童费舍尔(Bobby Fischer)在布宜诺斯艾利斯召开了一次新闻发布会,在会上他抱怨国际象棋需要重新设计,计算机增强的记忆力应该要给创造力让位。他推出了费舍尔任意制国际象棋(Fischer Random Chess),这种棋保留了通常的游戏规则,但每场比赛都要把底线那排厉害的棋子的起始位置随机打乱。这种任意制国际象棋又叫做Chess960,后面再国际象棋界慢慢赢得了自己的小众市场,现在还有了自己的锦标赛。

  DeepMind 和克拉姆尼克把AlphaZero无师自通从零开始学习游戏的能力物尽其用,想用借助它来更快地探索国际象棋的新玩法,而不是像过去靠人类折腾了几十年甚至几个世纪才把这种游戏的美丽和缺陷给摸清楚。Tomašev说“你当然不希望自己花了几个月甚至几年才玩会的东西却马上意识到,‘噢,不,这种游戏一点都不美。’”

  “在最高级别的比赛当中,有相当一部分近半(有时候甚至整场比赛)的下法都是靠记忆走完的。”

  ——前国际象棋冠军弗拉基米尔· 克拉姆尼克

  AlphaZero 是AlphaGo 更灵活、更强大的升级版,后者曾在2016年击败了当时的围棋世界冠军,为AI历史奠定了一个里程碑时刻。系统开始学习游戏的时候手头只有这3样东西:游戏规则,记分方式以及预先写进程序的不断实验并赢得胜利的冲动。项目的另一位研究人员,DeepMind的Ulrich Paquet 说:“系统刚开始玩的时候表现实在是太糟糕了,我真想躲在桌子底下。但是看着它一步步从一张白纸演变过来的感受令人兴奋,无比纯粹。”

  刚开始下国际象棋的时候,AlphaZero 并不知道可以拿下对手的棋子。但经过几个小时高速的对抗之后,其自身的能力开始逐渐增强,跟之前的国际象棋引擎相比,它变得更加熟练,而且在某些人看来表现更加自然。在这个过程当中,它重新发现了几个世纪以来人类玩国际象棋的一些下法,而且还添加了自己的天赋。英国的国际象棋大师马修·萨德勒(Matthew Sadler)表示,研究AlphaZero的下法就像“发现了过去某位伟大棋手的秘密笔记本”。

  AlphaZero 测试过的九种国际象棋的替代版包括没有王车易位版的国际象棋,这种规则克拉姆尼克和其他人已经考虑过,并且在今年一月份举行了第一场专门比赛。这种规则取消了所谓的“王车易位”走法,这种走法可以让棋手把自己的王躲进由其他棋子组成的防护屏背后——这是一道强大的防御工事,但也会令比赛变得沉闷。其他的五种变体则改变了卒的走法,torpedo国际象棋就是其中之一。在这种国际象棋当中,卒自始至终都可以最多走两格,而不是像原版国际象棋那样只有第一步可以走两格。

  解读AlphaZero的结果的办法之一是看冷冰冰的数字。在没有王车易位的情况下,平局跟常规规则下法相比变少了。而学习不同的规则也让AlphaZero给不同棋子赋予的价值做出了改变:在传统规则下,王/后的价值相当于9.5个卒;而按照torpedo国际象棋的规则,后只值7.1个卒。

  “走了三步之后,你就不知道该怎么办了。这种感觉很不错,就像自己是个孩子一样。”

  ——前国际象棋世界冠军弗拉基米尔· 克拉姆尼克

  DeepMind的研究人员最后还是对本项目另外一个国际象棋大脑克拉姆尼克的分析更感兴趣。Tomašev 表示:“这跟数字无关,而是从定性上,在美学上能不能让人乐意坐下来玩的问题。” 上周三发表的一篇技术论文里面包括了克拉姆尼克对AlphaZero的探索做出的70多页的评论。

  在AlphaZero 如何适应新规则方面克拉姆尼克看到了一些美丽之处。他说,为了保证王的安全,没有王车易位的国际象棋催生了丰富的新模式。self-capture国际象棋是一个更为极端的变化,也就是棋手可以拿掉自己的棋子,结果证明这种改法更加迷人。克拉姆尼克说,这条规则实际上让棋手有更多机会,通过牺牲一颗棋子来取得领先,数世纪以来这种走法被认为是优雅走法的标志。他说:“总而言之,这只会让游戏变得更加美丽。”

  克拉姆尼克希望,AlphaZero的这番国际象棋冒险之旅能够说服不同级别的棋手去尝试。他说:“这是我们献给国际象棋界的礼物。” 现在也许是献礼的合适的时机。

  曾两次获得美国国际象棋冠军的詹妮弗· 沙哈德(Jennifer Shahade)说,多年来国际象棋一直很受欢迎,但因为新冠病毒流行很多人为了寻找新的智力刺激又火了一把。大家对Chess960的兴趣也在增长,这表明大家对这种新型的下法产生了浓厚的兴趣,其中就包括部分超级明星。Shahade还会为Chess960锦标赛提供赛事评论,这场锦标赛吸引了包括世界排名第一的卡尔森(Magnus Carlsen) 和前国际象棋世界冠军卡斯帕罗夫在内的一众好手。

  就像克拉姆尼克一样,Shahade 认为AlphaZero测试的若干国际象棋变体有值得称道的地方,即便类似允许卒侧向移动之类的走法感觉有点 “令人费解”。如果这些新变体当中的哪个能够发展起来的话,一些棋手仍会希望靠计算机和深度研究来取得成功,但是对周期进行重新设置也许会令人着迷。同时也是美国国际象棋联合会女子项目主管的Shahade说: “新玩法带来的发现会令人耳目一新,结果也许会非常令人兴奋,并令其他类型的棋手受益”。

  由于机器无与伦比,DeepMind 和克拉姆尼克的项目还可以鼓励计算机国际象棋变得更具创造力。Eli David是以色列巴伊兰大学的研究员,他自己开发了一个基于机器学习国际象棋引擎。他说:“与其让计算机国际象棋变得更强大,让人类显得相形见拙,不如把国际象棋变成一种游戏艺术”。他的实验室有一名研究生正在研究国际象棋软件,这种软件会学习模仿特定棋手的风格,这样大家就可以求助于机器,问问对方某位深受喜爱的国际象棋大师(过去或者现在的)在特定情况下会怎么走。

  克拉姆尼克的经验表明,让人与机器合作而不是对抗,不仅可以丰富这种棋类游戏的技术体验,也可以丰富其情感体验。AlphaZero 甚至把他带到了超出其渊博知识范畴以外的地方。他说:“走了三步之后,你就不知道该怎么办了。这种感觉很不错,就像自己是个孩子一样。”

  译者:boxi。


本文来自: 36氪



关注【深圳科普】微信公众号,在对话框:
回复【最新活动】,了解近期科普活动
回复【科普行】,了解最新深圳科普行活动
回复【研学营】,了解最新科普研学营
回复【科普课堂】,了解最新科普课堂
回复【科普书籍】,了解最新科普书籍
回复【团体定制】,了解最新团体定制活动
回复【科普基地】,了解深圳科普基地详情
回复【观鸟知识】,学习观鸟相关科普知识
听说,打赏我的人最后都找到了真爱。
做科普,我们是认真的!
扫描关注深i科普公众号
加入科普活动群
  • 参加最新科普活动
  • 认识科普小朋友
  • 成为科学小记者