蚂蚁吧 关注:178,888贴子:7,426,517
  • 11回复贴,共1

〖20230101〗〖蚁问友答〗Antweb标本图爬虫程序

取消只看楼主收藏回复

从去年搞到现在,终于搞完了!(bushi


IP属地:云南1楼2023-01-01 20:26回复
    之前写了个antwiki的爬虫用来自动下载标本图,最近有空就又写了个antweb的,标本图比antwiki上多
    之前的贴:https://tieba.baidu.com/p/7765831484


    IP属地:云南2楼2023-01-01 20:28
    回复
      链接:https://pan.baidu.com/s/1NX3_FfKfAYnLFlC9LnqCiw?pwd=09a1
      提取码:09a1
      是.exe文件,电脑上直接双击打开


      IP属地:云南3楼2023-01-01 20:30
      收起回复
        打开这个程序后输入蚂蚁的属名和种名,然后回车,程序就会开始自动下载。图片会下载到这个可执行文件所在的目录下,文件名是拉丁名+序号+试图(h:正面观,p:侧面观,d:背面观)+标本标号。如果是亚种,种名后会带有亚种名。


        IP属地:云南4楼2023-01-01 20:37
        回复
          种名和属名不区分大小写,但是需要注意的是,属名和种名中间必须以一个空格隔开,并且前后不能有空格。如果不小心多了空格或打错的话程序会报错提醒,这时候检查下再重新输入就好了。
          如下图,第一次就多达了一个空格。


          IP属地:云南5楼2023-01-01 20:42
          回复
            图片有时有下载失败的情况,目前来说感觉是网络的问题,毕竟手动上antweb就会感觉很慢。
            下载失败的也会提示,并且会给出图片的地址,复制这个地址直接进浏览器就是高清图,比起在antweb上搜索然后再一层层点开还是快很多的。


            IP属地:云南6楼2023-01-01 20:45
            回复
              用法介绍完了。然后跟之前一样,如果有程序出错的情况可以在帖子里跟我反馈,如果对于程序有别的需求也可以跟我提。简单的小工具希望对大家有用


              IP属地:云南7楼2023-01-01 20:52
              回复
                @Snowkings 雪王要的antweb版。另外@爱情懦夫 这种能不能申精


                IP属地:云南8楼2023-01-01 20:54
                回复
                  自顶。
                  by the way,突然发现一个很尴尬的问题,应该是“请稍候”,不是“请稍后”。
                  不过没人看的话就不会尴尬了吧(笑)


                  IP属地:云南9楼2023-01-01 22:11
                  回复
                    版本更新:2.0
                    更新内容:
                    1、添加了自动爬取属名和亚科名的功能,取代了之前直接在程序里记录属名和亚科名的方式。以便属和亚科发生变动时还可以正常爬取不会找不到网页。
                    2、添加了批量下载的功能,程序开始时可以输入需要批量下载的种的个数,然后输入多个种名就可以依次下载,每一个种在该目录下建立一个文件夹。
                    3、添加了下载失败的图片网址保存在log.txt文件的功能。
                    4、移除Herobrine(


                    IP属地:云南18楼2023-04-13 14:22
                    回复
                      目前多了两个问题是,程序文件相比之前变大了很多,而且运行时需要等待几秒,爬取属名亚科名时也有点慢,其他问题还未发现。有建议欢迎反馈,2.0的链接见三楼的评论。


                      IP属地:云南19楼2023-04-13 14:23
                      回复
                        周末了,自顶下贴


                        IP属地:云南22楼2023-04-15 20:22
                        回复