荒野乱斗:遭遇“迎难而上”之后的怒骂,段位的锅凭啥给ELO背

凌晨两点,对楼最后一个并肩熬夜者也熄了灯。

历经赢一局输一局的多次循环之后,临近崩溃边缘的你把要求降到了最低,在这场游戏匹配阶段的数十秒里反复祈祷着“赢了这局就睡觉”。

然而进入游戏时迎面而来“迎难而上”四个大字几乎浇灭了你所有停下来的借口,想哭又哭不出于是只能无能狂怒着或者骂一骂万恶的匹配机制,在几次自己或队友的失误之后终于带着愤恨于绝望中挂机睡下……

其实《荒野乱斗》中“迎难而上”本身还是一种保护机制,他照顾了被动的处于低质量对局的劣势方玩家,使他们在对局失利时少扣掉一些奖杯,在对局胜利时多获得一些奖杯。3月11日,游戏官方团队就在其更新预告中详解了“迎难而上”机制的设计初衷——保护在3V3模式中碰到奖杯数相差过大的双排队友或者平均奖杯数比对方相差过大的情况。

为了保证英雄奖杯的含金量,荒野乱斗使用了“以组队内最高英雄奖杯者为队伍水平”的匹配机制。这样一来,当两位英雄奖杯相差过大的玩家在3V3模式中组队时,第三位单排玩家的奖杯数也大都与之相差很大,这位单排玩家就被动的陷入了一场可能的(如果他们操作水平相当就不算为低质量对局)低质量对局。

另一方面,随匹配时间增长,匹配系统会通过扩大ELO等级分段(下文做详细介绍)缩短匹配时间进行快速匹配,从而导致玩家被动的进入胜率不太接近50%的低质量对局。在这两种低质量对局中,被动处于劣势方的玩家将获得一定程度的补偿。

而翻了翻TapTap评论区:被赞言为“细胞出品,必属精品”的Supercell在3.7分《荒野乱斗》上栽了跟头,“迎难而上”成了非但没有让玩家开心起来,反倒成了吐槽匹配机制的一大突破口。

为什么这一保护机制到了玩家手里却费力不讨好呢?

本篇旨在为玩家详细解读ELO评级机制,纠正部分错误观念,使用为最简单的匹配模型。并以此讨论如何在MOBA游戏中巧妙利用此机制斩获高段位,享受快乐游戏。


什么是ELO评级机制?

多数玩家对ELO算法的认知源自且停留于2018年5月份《王者荣耀》策划Donny的一篇微博上,该微博对ELO算法做了简要介绍:

它是一个衡量各类对弈活动水平的评价方法,被广泛用于国际象棋、围棋、足球、篮球等运动,是一套非常完善的评分规则和机制。

但也如“迎难而上”的命运一样,Donny对ELO机制的科普非常失败,不但没有得到玩家们的认可,反而成了一些玩家甚至作者诟病其匹配模式的攻击对象——“《王者荣耀》使用了ELO算法,我们被坑就是因为这个!”

但事实上,ELO是一套非常完善的评分规则和机制。

田忌赛马是历史上有名的在劣势中扬长避短谋取胜利的例子,孙膑为田忌出招以下马对齐威王的上马、以中马对齐威王的下马、以上马对齐威王的中马,最终田忌以2比1取得胜利。虽然方法很巧妙,但它同时也给我们抛出一个矛盾点:这次失败后齐威王排名的低于田忌,可明明硬实力却是完胜的,难道要让实力强的靠后而要实力差的排第一?

1960年,匈牙利物理学家 Arpad ELO(埃洛)用一种积分算法解决了比赛中的排名问题,并最早用于国际象棋的排名中。

ELO分值的存在使齐威王与田忌的排名更接近客观真实:假设齐威王是3500分,田忌的elo为3100,虽然田忌这次侥幸赢了,但他的积分仅变为3056,在排名上还是会低于齐威王。这样一来,只要齐威王不会傻到一直“白送分”,那么在越来越多场的比赛中双方排名都会更加自己的真实水平。

这时候问题又来了,为啥每次比赛的分数变化只有这么点,我赢一局分数翻一倍不成吗?要解决这个每次分数增加多少的问题,就要涉及到下面ELO计算的三大公式:

埃洛首先由正态分布来拟合玩家在比赛中的波动表现(第一个p(D)等式的右半部分即为正态分布函数积分形式),在以此经过大量数据模拟之后发现还是逻辑分布更为合适,于是有了“升级版”预期的分率(第二个p(D)等式,式中“400”是取自DOAT2中的一个参数,不同比赛对应值不同)。我们可以通过公式①得出一个预期胜率,而不是说齐威王3500分就一定赢或输给3100分的田忌,这里代入等级分差D=3500+3100=400后得出齐威王的胜率为p(D)=0.557。

②、③为ELO算法中的两个经典公式,前者要结合一个相关数表所以我们选用后者。最近表现系数K记为100(方便计算,比起3k左右的ELO分来说已经算高的了),那么根据公式③我们可以得出齐威王在这次失败后的ELO为Rn=3500+100(0-0.557)=3444分、同时田忌的ELO为Rn'=3000+100(1-0.443)=3056分。

所以对齐威王而言:“虽然你田忌侥幸赢我一次,但只要我齐威王不一直这么蠢下去,你就永远是个弟弟。”


ELO算法与MOBA游戏

不止是Donny所说《王者荣耀》使用了ELO,几乎所有MOBA游戏都在使用ELO或者与之相似的算法。从前文提到的《荒野乱斗》匹配机制中可以得出,他们在队友与队伍ELO分的关系上取得平均值,也就是:ELO(队伍)={ELO(A)+ELO(B)+ELO(C)}÷3(我们看到的是奖杯数或段位,但实际仍为ELO值,原因后文会说)。

无论ELO的理论基础还是实践K值调和,都指向了一个点:玩家玩场数越多,相应的ELO积分就越贴合自己的实力。

在日常匹配中使用此算法无论对谁都是非常公平的,那为什么还是会遭骂呢?

  • 快速匹配

分差随时间增大是匹配系统为保证匹配效率常用的方法。在日常匹配中系统趋向于将双方的预期得分率都控制在0.50±x(x值很小),但在玩家基数越少、分段内玩家越少的游戏中这个条件就显得越苛刻,为了提高匹配效率系统会随时间增加而逐步放大x值。

比方说某款5V5MOBA游戏中在某一时间段只有十位玩家在线,尽管他们相差很大但若匹配时间足够长还是会匹配在一起而进入一场低质量对局(一般来说,队间分差越大游戏质量越低)。

在安徽大学2019年的一篇学士论文中,作者提出了一种贪心算法,用替换机制和半衰期机制来优化目前MOBA游戏匹配的时间和质量。不过笔者看来,既然存在没有合适对手的情况那就一定会存在低质量对局,只有通过不断优化提高匹配效率并降低每场对局的分差。而想要绝对避免的话,除非在匹配等待数分钟后对深夜里的玩家说一声:“您所在分段的玩家大都已经在睡觉觉啦,您也要保重身体啊,达令~”

  • K值与段位

在上文③式中有一个与表现相关的系数K,这个K值会根据玩家近一段时间的表现进行微调,当你长时间表现较好时K值就比较高而当你表现较差时K值会比较低。每个新手玩家在进入游戏时都会获得一个基础分R0,同时也会有个比较高的K值方便调整。在《英雄联盟》、《DOAT2》这种大型MOBA游戏中也并不能萌新直接进排位赛,而是经系统衡量你在大量的匹配对局中的KDA、参团率、输出、建筑伤害、补刀等表现给出一个合理的K值并逐渐对ELO分做出调整。

比如《英雄联盟》到达三十级且凑够16位英雄之后就可以进入前十局定级赛,有人找大神帮打赢八局只定到白银,别人自己打赢五局就定在了黄金,这就是前期匹配赛以及这十场定级赛中K值对你的影响。此时的ELO也被称为“隐藏分”,它源于DOTA2的天梯匹配,为了不影响玩家的心态在定级之前的ELO分是不允许被看见的,所以出现了这个有点神秘的新名。

再来谈谈段位,《英雄联盟》中采用了每场游戏对局±20左右的段位积分,虽然有晋级赛的影响但与以前的积分制还比较接近(ELO比段位高太多了就会在晋级赛成功时跳段)。而尽管《王者荣耀》这种一局一星的可以靠段位积分做出补偿,但赛季开始就是大家直接都掉段,比用十局排位重新定级来的容易也来的粗糙。

段位与ELO差多了就容易出现这样一个情况:拥有星耀elo分的钻石玩家张三和几个只有铂金elo分的钻石玩家“愉快”的组队了,或许这就是钻石段“永恒”的原因。

  • 玩家与算法追求目标的差异

另外,玩家与算法所追求目标的差异也是致使玩家体验“差”的一个重要因素。在上文中,我们的算法穷尽所能在追求对局双方实力上的平衡,而大多数玩“上头”的玩家想要的确是稍微有些轻松甚至完全碾压对手的胜利。


怎样才能玩的更“爽”?

尽管系统更倾向于我们进行高质量的平衡对局,但高质量对局哪有轻松连赢来的爽。就像在苦学医术医治四大家族千辛万苦获得成功面前,谁不会选择赘婿秒变修罗的快感呢?

接下来的观点源于两年前我玩《王者荣耀》时一次钟馗连赢25+对局上王者的的经历,在《荒野乱斗》基本同样适用。

理论支持:

ELO评级的目标是愈发贴近我们的真实水平,通过一定时期的表现对K值进行微调。但《荒野乱斗》的奖杯数并不管这一套,赢了就给你八个、输了就扣掉八个,分段越高得奖杯越少扣奖杯越多(也是为了更贴合真实ELO)。

也就意味着:段位其实是个虚有其表的东西,“高分(段位)低能(ELO分)”的情况可以存在。当你在游戏中获得胜利时ELO评分按K值增加,奖杯数按固定值增加,如果你可以通过隐藏表现使K值降低,那在获得同样的ELO评分增长时会获得更高的奖杯数提升。以下为简单演示:

这是一种思路,比如说我玩个辅助钟馗自己三路逛就是不在下路,到后期还出肉打不出多少伤害,或者《荒野乱斗》赏金模式在保证己方能赢的情况下多送两次同时少杀两个……这种有意识隐藏真实表现的方法可以让你从低ELO回到真实ELO水平时获得更多的段位攀升。

更多方法还需要对具体游戏找规律探究,而如果你想更好的体验游戏竞技(这才真正的爽点)而非满足于名不副实的荣誉的话,那就摆正心态继续愉快的游戏吧,毕竟,在公平方面游戏内匹配机制比我所说的要完善的多。

当然,如果你又频繁遭遇“迎难而上”或者低分队友了的话,请先看看时间,如果不是该休息了的话,你可以对自己说:“我又达到一个更少人能达到的高度啦!”

举报