主机参考:VPS测评参考推荐/专注分享VPS服务器优惠信息!若您是商家可以在本站进行投稿,查看详情!此外我们还提供软文收录、PayPal代付、广告赞助等服务,查看详情! |
我们发布的部分优惠活动文章可能存在时效性,购买时建议在本站搜索商家名称可查看相关文章充分了解该商家!若非中文页面可使用Edge浏览器同步翻译!PayPal代付/收录合作 |
采集的是这个网站
可能是我表达错误,不是列表页,是文章分页没法采,比如https://www.xgmn.org/Xiuren/Xiuren13413_2.html
分页规则设置了,数据来源也设置分页源码了,循环匹配也设置,还是没法采集分页内容
有大佬帮我看一下怎么弄吗
各路大神的回复:
注册: 这就涉及到了我的知识盲区
夏渔: 没用过工具,只是这种我一般都FOR循环 https://www.xgmn.org/Xiuren/page_变量+1.html
一个不知名网友:
bluevm: 不是列表页,是文章分页没法采,比如https://www.xgmn.org/Xiuren/Xiuren13413_2.html
英梨梨: 可能是我表达错误,不是列表页,是文章分页没法采,比如https://www.xgmn.org/Xiuren/Xiuren13413_2.html
夏渔: 一样的道理啊 FOR循环 https://www.xgmn.org/Xiuren/Xiuren13413_变量.html 简单点的话遇到404 之类的 就是最后了 或者第一页的时候匹配出来最后一页的页码ID
夏渔: 9.x分页采集有问题, 返回200状态码,就是获取不到内容。 换8.x就好了
bluevm: 今天看到两则说pyone因为采集被抓了?
木易酱: 谢谢大佬了
这几篇文章你可能也喜欢:
- 暂无相关推荐文章
本文由主机参考刊发,转载请注明:请教一下火车头采集的问题 - 便宜vps优惠码,免备案香港vps服务器 https://zhujicankao.com/10883.html
评论前必须登录!
注册