全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 7617|回复: 25
打印 上一主题 下一主题

爬个数据就挂掉一个网站

[复制链接]
跳转到指定楼层
#
发表于 2018-1-14 00:17:04 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
我一直使用python的requests爬取数据,有个网站的数据单线程,5分钟可以爬完.

刚才用了nodejs的request库, 从启动任务到结束10秒钟结束,以为自己眼瞎, 但是数据确实下载成功了.
然后那个网站离线了.

从来不知道nodejs这么牛叉.
来自 25#
 楼主| 发表于 2018-1-14 09:55:48 | 只看该作者
数据都入库了,没报错,10秒钟,42万行数据。

nodejs的异步第一次领略,确实很牛逼。
推荐
发表于 2018-1-15 11:28:27 | 只看该作者
python写得慢 是你技术有问题。。


https://luodaoyi.com/p/python-yi-bu-duo-xian-cheng-chao-gao-xing-neng-pa.html

点评

确实技术问题,这个太高级, 没学会。:>  发表于 2018-1-16 09:10
推荐
发表于 2018-1-14 08:12:49 | 只看该作者
应该不会是完全都爬完了吧。。。
推荐
发表于 2018-1-14 04:54:13 | 只看该作者
不会那么巧 等你把数据爬完了再挂吧?
看看你的数据完整不?
22#
发表于 2018-1-15 11:09:52 来自手机 | 只看该作者
我感觉不能说明什么
21#
发表于 2018-1-15 10:44:02 | 只看该作者
大佬技术在哪学的?发车吧!!!!
20#
发表于 2018-1-14 14:14:35 来自手机 | 只看该作者
说不定只是把你ip屏蔽了
19#
发表于 2018-1-14 14:07:29 来自手机 | 只看该作者
数据是完整的吗
18#
发表于 2018-1-14 09:19:23 | 只看该作者
nodejs默认是异步的,python默认是同步的,代码改一改也可以实现相同效果
当然你怎么确定你把数据爬完了,网站都挂了23333
16#
发表于 2018-1-14 08:27:11 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-11-8 23:17 , Processed in 0.080204 second(s), 14 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表