网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
06月20日
漏签
0
天
python吧
关注:
461,675
贴子:
1,927,407
看贴
图片
吧主推荐
视频
游戏
10
回复贴,共
1
页
<<返回python吧
>0< 加载中...
求助
爬虫用bs中的find_all找的不完整
只看楼主
收藏
回复
邪冥兽皇
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
写了一个程序去爬网页的一些图片,一开始用的xpath的getall,发现爬的不全就换成bs的find_all,还是爬的不完整,第一张图就是调试的时候发现第一页有六七十张图片,只爬到了32张,后面有的甚至一整页什么都没获取到(图3:这个帖子有很多页),求助一下
邪冥兽皇
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
还有就是百度贴吧它经常需要安全验证,每次被检测到我只能等一段时间然后去header里换一个Cookie才行,问问大佬们有没有什么绕过反扒办法
邪冥兽皇
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
dd
邪冥兽皇
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
getall怎么会找不全呢,是本页面后面的内容没有加载出来吗
别看俺是一头牛
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
懒加载呗
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示