对应字段名列表 帮助目录 词典
请在此字段列表内选择用来存储采集对象的字段。此处字段列表内的内容来自前面的库表列表中选择的库表。
详:
默认情况下,系统会对库表以及库表的字段的使用做严格限制,已确保库表及其字段在使用过程中的清晰逻辑。减少因用户操作不熟练而导致的错误,提高用户设置效率。因此此处罗列的库表字段列表,可能不是全部,或干脆完全没有。
默认情况下,对于主表或者非重复子项的子表,一但某一字段已经被使用,则会被隐藏起来,不再供用户选择,避免用户重复选择同一个字段而产生错误。对于重复子项的子表,由于需要通过确认重复的字段对象来定义重复子项关系,因此不适合对所有已使用字段进行隐藏。
默认情况下,对于主表或者非重复子项的子表,对于已经使用的字段,会保留当前元素对象的前一个入选库表的网页元素对象使用的字段。如果同时选择前一个已经入选的字段,就说明从前一个入选字段到当前入选字段之间的内容是连贯的,是需要存入同一个库表的同一个字段内的。这样的多语句被称为"复合语句"或"为多语句/或段落"。
默认情况下,该数据库表内的具有"标识"属性的字段,是不会被列出的。其它还有熊猫采集专用的页面url路径存储字段pandaWebUrl,子表中用来指向父表主键的定义字段。使用Access数据库有个例外,由于微软未能提供相关有效查询接口,因此系统无法识别Access数据库的具有"标识"属性的字段,因此用户需要自行留意,不要使用该具有"标识"属性字段。快捷识别方法:一般是库表内的首个字段,字段名中一般也会包含id字样等,不过一个Access库表内具有"标识"属性的字段只有一个。
总而言之,如果字段列表内没有列出的字段,都是已经被使用的,且不可以再使用的字段。字段列表内列出的字段都是可以使用的未被使用的字段。只有"复合语句"是例外,此时该前一个已经使用的字段名称会用符号√来标识该字段已使用。
如果你在项目高级设置环节取消了"严格限制数据库父子表的逻辑关系"项的勾选,则此处可以放开对数据库表字段的的使用限制。但并不是说此时就可以任意使用,此时用户需要更加小心的应用库表字段,避免产生逻辑错误而导致不可预料的后果,甚至导致系统崩溃。
如果你对此费解,请进入帮助目录,查看数据库设置环节的相关帮助说明。