水平线效应与每况愈下

时间:2023-11-29 16:59:03

不过,今后人工智能真正在社会中得到应用的时候,对其工作状态进行严格的验证,确保其不会有故障,提升其“健康度”,将是一项十分重要的工作。

当人工智能机器人被导入到社会生活中时,为了确认它真的没问题,真的对人类无害,事先进行各种检查认证,先行掌握人工智能的优势和弱点,是非常重要的。

水平线效应与每况愈下

在这个层面上,将棋程序与棋手的对局,也许还有着未来社会模拟实验这样一层意义吧。

举例来说,现阶段人工智能的课题中,有一个问题叫做水平线效应(horizon effect)。

简单说明的话,就是说人工智能有“将问题延后”的习惯。例如,如果程序能预判后20手,就会发现现在这个下法是负1000分的臭棋,但对于只能判断后10手的程序来说,这个问题在水平线的另一头,所以程序就会毫不犹豫地选择眼前看起来只是负10分的棋步(看起来损失更小)。从结果上来看,这种下法就是把问题拖延到后面,尽量地选择拖延战败时间。

在AlphaGo的对局中,李世石唯一获胜了一局,恐怕也是由于这个缘故。这种水平线效应对于电脑程序来说,很可能是致命的弱点。

有一个词叫每况愈下,水平线效应正意味着人工智能故意选择了这样的未来。对于我来说,如果“下这里还能再持续50手,但却没什么胜算”,那么我可能会冒着在10手后被将死的危险,选择有获胜机会的下法。

这种水平线效应,还涉及人工智能应该如何把握认输时机和方式等问题。在将棋和围棋的对局中,判断自己毫无胜算并认输,实在是一种非常像人类的行为。

当然,我们可以将软件设置为超过评价系数的一定值时投子认输,但这并不等同于本质意义上的认输,让软件深刻地认识到几乎没有赢的机会,承认自身的失败,是非常困难的。

不过即使对人类来说,要用长远的目光对某样事物的利弊进行判断,也是非常困难的一件事。

有这样一种说法,国际象棋的软件如果突然下了一步看起来对自身来说不利的棋步,这时候人类就会比较容易犯错。这是一种非常经典的技法,大约三四十年前就被发现了。据说,打败了国际象棋冠军卡斯帕罗夫的深蓝中,也包括了这种程序。也就是说,也有一种程序专门利用水平线效应,诱导人类棋手失误。

人类也好,人工智能也罢,都有犯错的可能。我们可以理解人类犯下某种程度的失误;但同时,我们很可能会过分相信电脑的能力,误以为人工智能绝对不会犯错。