不采集复合语句内的隐藏内容 帮助目录 词典
指如果"复合语句"内出现隐藏的不可见内容,在采集时是否一并采集该隐藏内容。默认为是,即不采集复合语句内的不可见内容。
详:
此项定义针对的是复合语句对象。对于单一的采集对象,不论是否勾选此项,均会进行正常采集。
所谓复合语句,是熊猫采集软件自定义名词,指采集目标对象的某个字段,会包含若干个网页中的自然分段对象。区别于"单一语句"。
此项默认为是,意即不采集网页中不可见部分的内容对象。如果需要采集的网页内容对象是不可见的,则有必要检查此项设置。在模板页面配置过程中,每个采集项目均有各自的“不采集隐藏的内容”选项,默认情况下会继承此处的设置。当两者不一致时,以每个采集项目的定义为准。
此项的修改可以随时进行。此项定义可能会导致部分采集结果没有内容,因此需要留意。