依据冒号进行分段 帮助目录 词典
指熊猫系统在对网页进行仿浏览器解析时,是否依据网页可视内容字符串中的冒号,对网页可视内容进行分段处理。 此时冒号后面的内容会切分成为新的独立的网页对象,以便灵活操作。
详:
很多时候,冒号的前面是某一信息的标题,后面则是信息的主体内容,且两者连在一起,未能通过网页代码实现自然分隔。如果需要采集的对象的遇到这种情况,则可视需要是否勾选本项。默认为是。日期字符串不会因此被切分。
需要注意的是,是否勾选本项,应该在项目的模板定制之前进行确定,一单模板已经开始定制,不应该中途修改本项,否则会导致不可预料的解析误差。如果确实需要中途修改。则请重新对模板进行学习定制、定义。