全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 14212|回复: 38
打印 上一主题 下一主题

关于javhd脚本的一些问题

[复制链接]
跳转到指定楼层
1#
发表于 2018-3-14 09:49:51 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
  首先我承认,我写的脚本很容易被识别为机器,然后就爬不成了。

解决办法很简单,让它每爬一页休息一会就好了。
spider.zip (1.4 KB, 下载次数: 507)

关于限速问题:

将线程放少点就好了,具体 就是将37行的10改的小一点就好了

python问题建议百度,centos下python3安装https://eqblog.com/centos-install-python3-6-4.html
安装好后使用pip3安装所需库就好了

37#
发表于 2018-5-14 01:17:37 来自手机 | 只看该作者
yeshan 发表于 2018-3-14 09:51
试用会员爬不了全部视频,建议要爬全站的来一个月正式会员

知道啥是解析不?
36#
发表于 2018-5-10 18:40:17 | 只看该作者
eqblog 发表于 2018-3-18 06:50
我准备修改下脚本,你等今天晚些我发布吧。。

改好了吗大佬。。。
35#
 楼主| 发表于 2018-3-18 06:50:57 | 只看该作者
itsme 发表于 2018-3-18 06:47
能不能帮忙改下?不会编程,为了用这爬虫这几天都在自学python编译 分卷压缩 等等相关了。窘。
现在脚本 ...

我准备修改下脚本,你等今天晚些我发布吧。。
34#
发表于 2018-3-18 06:47:54 | 只看该作者
本帖最后由 itsme 于 2018-3-19 19:46 编辑

------------------------
33#
 楼主| 发表于 2018-3-18 05:58:46 | 只看该作者
itsme 发表于 2018-3-18 05:27
楼主,javhd的脚本我运行完全没问题了。不过有个小问题,就是获得的文件名都不是完全的title标题,Sakura A ...

改下正则匹配就好了。。。。
32#
发表于 2018-3-18 05:27:41 | 只看该作者
楼主,javhd的脚本我运行完全没问题了。不过有个小问题,就是获得的文件名都不是完全的title标题,Sakura Aida enjoys Asian ... 能否改动什么地方抓取完整title作为文件名?
31#
发表于 2018-3-16 17:05:29 | 只看该作者
zhp521163 发表于 2018-3-16 14:45
我在本地爬了1380个视频,不知道全部视频有多少

我是480p的,爬完1380多个视频之后就爬不了了
30#
发表于 2018-3-16 16:51:58 | 只看该作者
本帖最后由 itsme 于 2018-3-18 05:26 编辑

本帖没内涵
29#
发表于 2018-3-16 16:32:23 | 只看该作者
eqblog 发表于 2018-3-14 22:16
不能 但是可以手动设置页数

如果要从61页开始抓取,只要改下面这个flag的值吗 改了脚本似乎卡住没任何动静了

def run():
    s=spider(quality)
    reqget=s.req()
    flag=61
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-11-15 06:14 , Processed in 0.081259 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表