下载 购买
软件介绍
当前页面:熊猫智能采集软件> 软件介绍> 多模板自适应采集

多模板自适应采集

此项功能是熊猫独有的。
对于大型网站的综合类栏目的内容页面,往往都是版面种类丰富。(典型的如阿里巴巴、慧聪中的二级企业网站,多大门户网站非新闻板块等等)。此时如果是设置一个模板,是无法采集完整的。如果需要完整采集数据,就需要针对该板块出现的不同页面版面风格,分别建立一套自定义模板,这样才有可能采集完整。
实际采集中,自始至终都是单一版面风格页面的场合,越来越少,存在多版面的场合越来越多、越来越复杂,数据采集的完整性也就越来越困难。

多模板采集

熊猫独有的多模板功能,可以针对实际需要,新增足够多的模板,来确保采集结果数据的100%完整。采集结果数据的“完整度”,是衡量一个采集软件成熟度的基本特征之一,但往往被忽视。
熊猫在采集运行时,会将所有定义的模板和采集目标页面,做一个相似度的分析,并按相似度做一个排序。按相似度排序后的顺序,逐个进行模板匹配,直到匹配成功。
如上图所示,列表的右上方有个按钮“模板均失败时改用自动解析模式”。此功能是确保在意外遗漏的情况下,启用系统的自动分析功能,来做一个最终的补救。

熊猫独有的部分高级功能分项阐述
友情链接: 建筑结构软件 中国制造业博览 飞翔下载 好特下载 当下软件园 六度软件下载 ZOL应用下载

Copyright @ 2011 www.CaiJiRuanJian.com All Rights Reserved 上海齐索信息科技有限公司 沪ICP备16048952号-4