第二次人机大战终于如约而至。据媒体消息,围棋人工智能程序AlphaGo将于5月22日至27日在浙江乌镇,与包括柯洁在内的中国顶尖棋手对决。媒体表示,这可能是人类顶尖棋手与人工智能程序的终极对抗。
对抗不是为了输赢
终极对抗可能是真的,但不是为了比输赢。在去年AlphaGo大胜韩国围棋高手李世石、今年年初用升级版本Master身份,以60:0的成绩大胜人类高手之后,人机在围棋上的水平高低,就已经分出了。只要是“完美信息”的棋牌类游戏,人类已经不可能战胜人工智能程序。
什么是“完美信息”的棋牌类游戏?即是在比赛过程中,所有的信息都是公开的,没有隐藏的,你知道的,也是我知道的,比如围棋、国际象棋、跳棋之类的,人类就不可能战胜机器。因为计算和存储,本来就是机器的专长,人类的计算能力再强,也不可能跑得过机器。
既是如此,那么所谓的终极对抗,又是什么?
因为去年AlphaGo与李世石的比赛,现在大家都知道一种叫做深度学习的算法。通过这种算法的训练,需要有料可喂,就是需要数据来给机器训练。所以,AlphaGo的成绩,其实是建立在这种数据规模之上的:AlphaGo训练时用到了16万人类棋谱,加上自己左右互搏产生的3000万棋谱,以及人类总结的几万个模式。
但DeepMind(AlphaGo的公司)的野心不止于此。如果只是这样,那么AlphaGo可能在去年那一战之后,就不需要再出来的。但今年年初,它以Master身份再次迎战人类棋手时,即意味着它又发生了变化。
完全摒弃人类棋谱
在Master升级版本中,除了继续采用深度学习方法,它还加入了强化学习方法,而且更侧重于后者。这种方法允许人工智能程序,直接从0开始,不需要人为总结任何模式,进行训练。换句话说,如果全部依赖于此,那么它的成功,将彻底与人类的围棋经验、智慧无关了。
不过,最终Deepmind公司表示,Master版本还是有借用人类棋谱。因此,此次AlphaGo再度出山,与柯洁等中国顶尖棋手对阵的版本,则有极大的可能是完全从0开始训练的AlphaGo版本——也就是第二次升级后的AlphaGo。
这才是此次人机大战,对于机器的意义所在。在这个意义上,才有所谓的终极对抗——两种不同产生方式的智能间的比较。如果只是论输赢,人机之间的比赛,除了像德州扑克这种“不完美信息”游戏外,人类已经不可能战胜机器了。
或带来围棋“革命”
对于柯洁,对于其他围棋高手,此战的意义则可能在于,与这样新的围棋智能对抗,或许可以带来新的围棋“革命”,这恐怕也是人工智能对于人类的意义所在。人类可以借助人工智能产生新智能的方式,来重新认识世界,改变人的知识结构与思维模式,从而提升人类的智能,甚至改变人类的智能产生方式。
换句话说,AlphaGo将通过完全自学的方式,产生新的智能,这种智能通过与人类的比赛来获得确认;而人类将在与这种新智能的比赛中,学习、提高、改变人类的智能发展路径,这也是人类的特殊所在。人类可以通过灵感,产生疯狂的想法;也可能通过借助其他事物的启示,来寻得突破。
或许会有人说,既然人工智能在这方面如此之强,那么为什么人类不直接借助这种智能方式,来强化人类呢?这种想法,特斯拉的CEO马斯克早就有了,并且已经着手去做研究了。其可行性如何,效果如何暂且不说,只是如果真能实现,那么这种强化究竟谁有资格获取?如果只是少数人的特权,那么它对社会结构的破坏,将比它所能带来的好处多得多。
言归正传,柯洁与AlphaGo的比拼,比的不是谁的棋艺更高,而是两种不同方式产生的智能,谁更强,以及智能的产生方式,还有多少种新可能,多大空间。