全球主机交流论坛

标题: 我发现我不适合自己采集小说站,我就适合看 [打印本页]

作者: mzh    时间: 2020-5-11 22:57
标题: 我发现我不适合自己采集小说站,我就适合看
我就是照着201206030大佬的程序
小说精品屋-plus已开通充值功能,欢迎大家体验
自己在空闲的2o上搭了一个。
想着自己以后看书再也不用看广告了。可是爬了一天多了,才736本,6.8G


可能是2Ocpu太差了吧,跑程序的还是pve开的小小LXC鸡
作者: tir    时间: 2020-5-11 23:02
确实,自己采集的话太消耗CPU和硬盘了
他支持一个单独的VPS采集然后远程调用吗?
作者: mzh    时间: 2020-5-11 23:05
tir 发表于 2020-5-11 23:02
确实,自己采集的话太消耗CPU和硬盘了
他支持一个单独的VPS采集然后远程调用吗? ...

应该是可以的,我看爬虫设置文件里有ip的设置选项
作者: 9c.cx    时间: 2020-5-11 23:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: 某斑竹草泥马    时间: 2020-5-12 00:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: mzh    时间: 2020-5-16 13:15
更新:
才几天啊都快到一万本了。硬盘总共占了120G了,其中MySQL54G,再爬我鸡没地方了
作者: lansghy    时间: 2020-5-16 13:31
content 都存数据库,估计小说多了带不动吧
作者: 52naiba    时间: 2020-5-16 13:38
这是要逼我玩大盘鸡了吗
作者: mzh    时间: 2020-5-16 13:42
lansghy 发表于 2020-5-16 13:31
content 都存数据库,估计小说多了带不动吧

估计有点,因为现在content表是百万级的数量
作者: mzh    时间: 2020-5-16 13:44
52naiba 发表于 2020-5-16 13:38
这是要逼我玩大盘鸡了吗

我是闲置2O终于有用了
作者: neeyuese    时间: 2020-5-16 13:55
居然2O搭。




欢迎光临 全球主机交流论坛 (https://sunk.eu.org/) Powered by Discuz! X3.4