试用 购买
留言论坛
当前页面:熊猫智能采集软件> 留言论坛
发新贴

对于分页列表点击没有变化的改怎么采集,求管理员指教谢谢!

作者: 红孩儿 | 阅读: 28802/7   2016/3/14 16:38:24
 
分页列表点击没有变化 以及那种点击加载更多的列表的改怎么采集,求管理员指教谢谢!


2 楼: 红孩儿 2016/3/15 0:34:25
 
www.mafengwo.cn/ajax/ajax_article.php?start=1&type=1 
使用抓包工具得到列表的网站,可是都是英文的,使用解析里面的对源码执行 unicode编码转换后可以得到部分中文  但却无法获取真正的文章链接,改如何操作呢 求指点,谢谢了 


3 楼: 红孩儿 2016/3/15 0:34:29
 
www.mafengwo.cn/ajax/ajax_article.php?start=1&type=1 
使用抓包工具得到列表的网站,可是都是英文的,使用解析里面的对源码执行 unicode编码转换后可以得到部分中文  但却无法获取真正的文章链接,改如何操作呢 求指点,谢谢了 


4 楼: 红孩儿 2016/3/15 0:34:29
 
www.mafengwo.cn/ajax/ajax_article.php?start=1&type=1 
使用抓包工具得到列表的网站,可是都是英文的,使用解析里面的对源码执行 unicode编码转换后可以得到部分中文  但却无法获取真正的文章链接,改如何操作呢 求指点,谢谢了 


5 楼: 红孩儿 2016/3/15 1:49:21
 
自己研究 使用中介模式搞定,耶,软件还是很强的

6 楼: 管理员 2016/3/15 9:13:38
 
能研究出来就很不错了。还有更方便的方法。

在“标题列表页及其翻页设置”标签下,起始页网址下方左侧,有个“剪刀”图标,点击可以打开针对列表页源码的修缮对话框。

打开修缮对话框后,新增一个修缮规则:
然后依次选择:
修缮的位置:字段全部(默认)
修缮的方式:修改替换(默认)
在“原内容输入框”下勾选:为多项替换方式   -再勾选“局部匹配替换”。

然后在“原内容输入框中,输入如下字符:

\n= 
\r= 
\t= 
\"="
\’’=’’
\/=/

注意\n\r\t的=符号后面,是空格。

然后点击确定,保存修缮规则,返回上一级页面,再次点击“开始进行预分析”。就可以了。

这样在“选择内容页”标签中,继续可以使用可视化的操作方式进行选择。
 


7 楼: 管理员 2016/3/15 9:16:03
 
注意上述的\’=’  为半角单引号。

网站安全机制将单引号自动替换为全角符号了。

8 楼: 2016/3/15 10:35:54
 
谢谢,这个好,更直观。。


回复
 
 
 
验证码:
 

电话:171 9219 7361

建议/合作: 139 1618 6547

邮箱:123jlxie@ 163.com

友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 手机号码采集工具 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4