et采集吧 关注:108贴子:524
  • 5回复贴,共1

遇到一个过滤BUG

只看楼主收藏回复

<img src="/JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851" srcset="/JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 380w, /JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 760w, /JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 1024w, /JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 2048w" sizes="(min-width: 1024px) 1024px, 100vw" alt="">
===================================================================================
我的过滤写法是
<img src="<%var%>" srcset="<%var%>>
但是他把我其他的img标签页过滤了。


IP属地:广东1楼2017-11-17 09:09回复
    强烈要求官方加入H5标签过滤
    如:
    <noscript>
    </figure>
    <svg>


    IP属地:广东2楼2017-11-17 09:11
    回复
      @badwood2
      @工坊008


      IP属地:广东3楼2017-11-17 09:23
      回复
        纠正
        <img src="/JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851" alt="" />
        <img src="/JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851" srcset="/JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 380w, /JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 760w, /JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 1024w, /JvMTdkZDE6hgbNJAlCsuLpM97UkU2ak3/promo334881851 2048w" sizes="(min-width: 1024px) 1024px, 100vw" alt="">
        ======================================================================================
        img1和img2的图片是一样的。
        于是我用<img src="<%var%>" srcset="<%var%>>
        想把img2直接过滤掉,只留下img1,但是跑了一下发现正文所有的img标签全部过滤了。
        后来就用了下面的规则,但是这样的话出现了保留两个img的问题。
        <img src="<%itemdata1%>" srcset="<%var%>> 替换<img src="<%itemdata1%>" alt="" >


        IP属地:广东4楼2017-11-17 09:32
        回复
          这并不是BUG,而是你对变量标记理解错误。
          H5标签过滤你可以自己在数据整理中添加。
          关于你的问题,可以导入如下整理规则:
          <%~%>
          <img src="<%itemdata1%>" <%itemdata2%>><%=%><img <%itemdata2%> src="<%itemdata1%>"/>
          <%~%>
          <img srcset<%var%>/><%=%>
          <%~%>
          解释:
          第一条规则,将IMG代码的后半截内容 调换到了前面,这样,第2个IMG标签的srcset特征字符串就会移动到前面,可以作为起始特征了。
          第二条规则,过滤 有srcset的IMG


          5楼2017-11-17 15:20
          收起回复