围棋吧 关注:335,483贴子:10,064,303

从崔五段文章展开的思考

只看楼主收藏回复

读了崔文后的这几天,对问题有了一些新的思考。
有些内容在别的贴回复过。


IP属地:河南1楼2021-08-22 15:01回复
    其实从崔文里可以引申出来几个结论,还没见有人提起过:
    1.职业高手水准以上的很难通过吻合度来比较,比如大李意外的低,好像比老曹还低。
    2.从稳定的一选吻合度来看,每盘棋大概有40%左右的着法是必然下法。按崔文研究的180步来看,大概就是每方30-40手左右。
    3.看上去业余棋手和职业高手的绝对差距也就是8%左右,但是如果减去必然着法,对比会可能会扩大到8:16也就是1:2的程度,也就是说在局面疑问点上职业高手的准确度比业余棋手高1倍。
    4.如果是职业棋手和AI比较可能达到16:60也就是4:15,也就是说职业棋手的准确度大致是超过25%一点。柯洁做为bug可能达到了35%以上甚至摸高50%,申工智能目前甚至可能达到60%以上。
    5.准确度或者说吻合度高大概在2/3的程度上决定胜负,反过来说就是在1/3的情况下吻合度高的一方不吻合着法的胜率损失更大。
    6.吻合度是和水平正相关的,但是肯定不是线性相关,所以无法对职业高手的水平进行比较,扣除必然着法的影响可能会好一些。扣除方法是去掉一选计算量超过99%的着法,这么做可能就可以避免随着对局手数的增加吻合度增加的问题。


    IP属地:河南2楼2021-08-22 15:01
    收起回复
      由于崔文中有一个表,日本丈和秀策的棋在放宽胜率下降程度时表现较好,甚至个别指标优于现代棋手。
      于是一些贬古(特指贬低中国古棋)的就兴奋了,纷纷在这个指标上做文章。对此我的看法是:
      降胜率这事应该怎么看呢?
      比如朴总前一段对申工智能,一步冲走错到直接接龙到接龙,其实也就亏了几目棋,问题是局面并不复杂,但是非常接近,可能也就是2目棋的胜负,所以几目棋的亏损就胜负翻转胜率大损。
      现代棋手的棋比如半目胜定的棋,一个疏忽亏了一目就变成半目输定了,这胜率亏损有可能超过90%,比如当年刘昌赫被彭荃粘劫收后。
      再来说说为啥丈和秀策恶手的胜率损失小,结合上面的例子大致可以看出,丈和和秀策对同时代棋手优势比较大,所以多数局面领先优势不小,即使恶手亏目不至于把优势亏出去,自然胜率下降就少了。
      所以降胜率这事只能说明对同时代对手的优势程度。
      @活宝扁你个头 也提到:我发现了秀策丈和吻合度高,恶手率低的秘密,选的是御城棋棋谱,秀策19局御城棋棋全胜,对手水平明显不够。选的都是全胜的棋,这样的吻合度和恶手率肯定会有很大不同。如果柯洁也只选胜局,那吻合度肯定也会大幅上升,恶手率也会下降
      确实胜局特别是完胜局本身胜率波动和恶手降胜率的幅度当然会比较小,这是正常的。也是崔五段选局时忽视的地方,当然崔五段也没那么多对局可选,丈和好像只有7局,秀策21局。


      IP属地:河南3楼2021-08-22 15:10
      收起回复
        此外关于吻合度评价中布局问题,我是这么看的。从总体上布局的提高是时代进步最佳体现。我相信做一个随时间演进的布局吻合度指标,会明显看到随时间变化这个指标的提高。但是在个人评价上,这个指标不适用,原因很简单。近4年AI布局的大流行肯定提高了业余棋手的吻合度水平,甚至于可能将吻合度指标提升5%以上,按崔五段的数据,这是世冠和业余顶尖的差距。那么请问现在的晚报杯冠军放20年前能拿到世冠吗?
        布局问题确实是古棋中最弱的地方,也是所谓时代进步最明显的地方。不过这个和水平关联相对低,因为同一时期的布局套路是有区别的。就算道策的布局前20手吻合度为0,你和道策下开局20手能把对手胜率降到多少?


        IP属地:河南4楼2021-08-22 15:11
        回复
          关于挺古和贬古的问题。
          崔五段以前确实是贬古的,也就是认为古棋也就是业余水准。从他开始文章的口气也可以明显感觉到。可是这个研究做下来,他应该不会还是以前的观点了。
          这里我也给贬古和挺古做个划分,省的出现所谓“理性崇古”。贬古到挺古划分六个区间各三个:极端贬古,古棋业5;一般贬古,古棋业6;轻微贬古,古棋职业门槛;不挺不贬,职业高手(围甲水平);轻微挺古,顶尖高手(世冠);极端挺古,超越世冠比肩AI。
          我个人算轻微挺古,理由是围棋理论确实是有进步,所以古棋有时代局限性,表现在棋谱上就是布局吻合度比较低,拉低了对古代棋手的评价。


          IP属地:河南5楼2021-08-22 15:12
          回复
            最后来谈谈我对棋手水平评价的思路:
            1. 吻合度在统计意义下是与棋手水平正相关的,这点也是评价研究的起点和基础。否定这点的往下不用看了。
            2. 吻合度评价中存在噪声,就是必然着法,以及在一些局面中为了取胜做出的妥协导致的不吻合。
            3. 崔五段为了去除棋局手数和吻合度上升相关的问题,简单的去掉了低于180手的对局和超过180以后的吻合度。这点我认为不太合适,虽然对结果影响不大,但是这种操作并不严谨,李昌镐数据异常可能与此有关。
            根据以上三点,我的对棋手水平评价的考虑是:
            1. 对必然着法的剔除,对于一选计算量超过99%的着法,如果吻合则从统计中去掉,如果不吻合则计入。
            2. 对于不吻合着法中,与一选相比胜率下降幅度在1%的着法计入吻合度着法,胜率上升的也计入吻合。这么做是为了避免一些局面下超过3选甚至AI忽略的正确着法。
            3. 不必再去掉少于180手的对局和超过180手后的吻合度,这一点需要试验验证一下。
            4. 去除一方胜率超过99%时的吻合度数据,这一点以前谈过就不再赘述了。
            这样就用修正后吻合度应该更能看出棋手的水平。


            IP属地:河南6楼2021-08-22 15:27
            收起回复
              在崔老师的研究框架下,吻合度还是能在相当程度上说明问题的,尽管还大有进一步研究的余地,更不能说就此终结争议。
              欢迎更多的人能百尺竿头,更进一步。


              IP属地:天津来自Android客户端7楼2021-08-22 15:51
              回复
                极端崇古也太反智了,比肩ai都来了,古棋业5论好歹算是有理有据,代表棋界一部分棋手的看法,这都成极端贬古了,至于吹古棋比肩ai,我从没见过主流棋界有这种观点


                IP属地:重庆8楼2021-08-22 16:24
                收起回复
                  笑死我了,还有人认为古棋下法能赢ai。所以这个人是谁?谁说的古棋下法能赢ai?这说明什么,崇古的大都反智。


                  IP属地:重庆9楼2021-08-22 16:59
                  收起回复
                    吻合度作为一个统计量是合理的,尽管不够理想,也许比较粗糙。
                    这是把AI当成一把尺子来衡量棋手强弱,同样一个局面,高手容易下出正手,低手容易下出错着,与我们的经验相符。在同一把尺子,同样的条件下产生的数据,可以用来作统计分析。


                    IP属地:美国10楼2021-08-22 18:27
                    回复
                      吻合量是个统计量值,也只是个统计量值。不能用它来推导它不能表达的东西,做超出统计的言说。


                      IP属地:四川来自Android客户端11楼2021-08-22 19:52
                      收起回复
                        這是小天分析alphago zero 40 b第19局的局面, 想請教下正確嗎?



                        IP属地:中国香港来自Android客户端12楼2021-08-22 20:44
                        收起回复
                          你说你是世界冠军的水平,这点我不认同,请问你是跟柯洁下过,还是跟哪位世冠下过。这是第一点的事情。
                          第二我发的帖子那时候不是请教别人,问都哪里下错了?你根本不顾我原帖子的事实,就上来教训别人说,我这个人油盐不进。你看了我的帖子,不明白什么意思?你就胡乱说话,以为你说的是教训我的话,是那么回事情吗?
                          你这个事情都敢胡乱说话,你还世冠水平?你吹牛。如果你就算有业余8段的围棋水平。你对我胡乱说话,侮辱,你以为你是在教训我?纯粹就是你自己一厢情愿,说出的胡言乱语。想教训我,你没有资格。
                          我觉得你是棋品不好拿伙的,如果你棋品,怎么能对我这个人冒犯呢?胡乱对我说话?这就是你?


                          IP属地:黑龙江13楼2021-08-22 20:59
                          回复
                            更正这句话:第二我发的帖子啥时候不是请教别人,问都哪里下错了?


                            IP属地:黑龙江14楼2021-08-22 21:00
                            收起回复
                              补充一个今天发现的问题,选局时胜负对局会对棋手的评价起到影响。
                              崔五段的选局导致的数据异常主要有:
                              1. 道策、丈和、秀策选择的是全胜对局,其中秀策选了一局和棋(太田)
                              2. 由于现代职业棋手选择的是世赛决赛,所以李昌镐的数据出现异常(低于曹),主要原因就是大李在2005以后的九连亚,计2胜17负。而在罗洗河之前李昌镐是45胜17负。通算47胜34负,这个胜率相对于曹小李古力的决赛成绩差远了。
                              3. 根据崔五段统计大概2/3的对局中,胜方吻合度更高。这就导致了李昌镐的评价结果偏低。
                              做个对比,李昌镐生涯胜率71.6%,曹薰铉生涯胜率70.2%,古力千胜时胜率66%。
                              世赛决赛,李昌镐胜率58%,曹薰铉67.8,古力64.7%.


                              IP属地:河南15楼2021-08-23 20:26
                              收起回复