ptcms4.2.8自动采集配置教程已经主动采集详解

一只鱼 6个月前 一只鱼
1,218 0

采集教程的话也简单,如果是互站网买的用户,我赠送三条长期稳定的采集规则,失效包补,采集不用太多三五条即可。

ptcms4.2.8自动采集配置教程已经主动采集详解

把采集规则导出,站点分类选择新站点。下拉到后面选择导入规则,在下拉后下面选择确认修改,只需一开始选择新站点,其他都不用修改。

然后这里我们选择任务,因为这个是自动采集。

ptcms4.2.8自动采集配置教程已经主动采集详解

采集间隔时间选择60秒。默认是600秒,我们选择60秒!

ptcms4.2.8自动采集配置教程已经主动采集详解

在这里就可以看到添加的采集任务,我们点击开启。

ptcms4.2.8自动采集配置教程已经主动采集详解

然后我们发现获取主进程状态失败。时间显示1970

ptcms4.2.8自动采集配置教程已经主动采集详解

接下来我们就要这样配置,配置cron

用命令进入网站根目录,“网站根目录名称”改成你实际的网站目录。

cd /www/wwwroot/网站根目录名称/

再输入。

/www/server/php/73/bin/php kx cron:check

这样后台就能自动采集了。

ptcms4.2.8自动采集配置教程已经主动采集详解

好多现在已经开启了,这个主进程就相当于你的qq,可能挂机一段时间会掉线不采集,需要你重新做一下这一步,如果服务器重启,也会主进程获取失败,需要重新做一下。

ptcms4.2.8自动采集配置教程已经主动采集详解

现在来说一下主动采集的事情,但是因为ptcms的特性,自动采集每天也就几百,有的人网站刚建好,小说太少,嫌慢,希望自己先主动采集多少本,后面再挂着自动采集,现在来说明下。

ptcms4.2.8自动采集配置教程已经主动采集详解

一般选用后台离线采集,选择规则,自定义页面,填入要采集的页面,比如说https://www.biquge.info/paihangbang_postdate/1.html

这个页面,是第一页,第二页只是后面的1变成2。可以用[page]这个页码代码来代替比如说

https://www.biquge.info/paihangbang_postdate/[page].html

比如我要采集这个页面的1-5页,就可以如下图这样写。好了教程就到这里,我没用里面的书号采集,书号采集容易出现采集到废的小说或很多没封面的。

ptcms4.2.8自动采集配置教程已经主动采集详解
版权声明:一只鱼 发表于 2020-12-29 3:17:02。
转载请注明:ptcms4.2.8自动采集配置教程已经主动采集详解 | 轻谈浅唱 – Mi导航

暂无评论

暂无评论...