<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%> 数据库设置帮助_新手指引
采集设置操作的新手指引 字体: 帮助目录 词典

数据库设置:
在当前数据库设置环节,设置用来存储采集结果数据的数据库。(这是关键设置环节,因为如果没有指定好用来存储采集结果数据的数据存储库,则本采集项目的设置就缺乏意义。)
如果在前面的“基础设置”环节已选择了自动生成当前项目的数据库表单”,则系统在此处已经为你配置好了相关设置,用户可以直接跳过对本环节的设置,直接点击进入下一个设置环节。
如果在前面的“基础设置”环节已选择了数据存入已有的数据库表内”,则需要在此“数据库设置”环节对该“已有的数据库表”进行配置。请按下面的说明进行配置操作。
在完成对“数据库”的设置后,请点击窗口左下的按钮,进入下一个设置环节:“文件下载”的设置
在当前数据库设置环节:
必须设置的地方:设置数据库链接参数,并选择主表

数据库设置的设置步骤
1、选择用于存储采集结果数据的数据库引擎种类Access , MSSQL(SQL Server), MYSQL, Oracle

2、点击按钮
在选择好数据库引擎种类,并填写好连接参数后,请点击按钮,只有数据库连接成功后,才能继续下面的配置。

3、在“主表”列表框内点选用来存储采集结果的数据库表
如果前面的“连接测试”成功,则此“主表”列表框内会罗列出该数据库内可用表的名称。注意此“主表”列表框内,用户只能点选一个表。如果本采集项目需要多张表才能存储,则此处选择的表示是项目的“主表”,其它表请点击“启用子表”复选按钮,来加入其它表。

应该设置的地方:

可选设置的地方: 添加子表

4、启用子表,勾选“启用子表”复选按钮
如果当前采集项目较为简单常规,只需要使用一张表来存储采集结果,则此处不必勾选“启用子表”。勾选了“启用子表”按钮后,子表选择框则由灰色变得可以使用,同时主表列表框旁边会增加显示“选择主表主键”的选择框。

5、在“选择主表主键”列表框内点选主表的标识主键字段名
如果没有勾选“启用子表”复选按钮,则此列表框是隐藏不可见的。当当前采集项目需要使用多张表来联合存储采集结果时,系统约定只有一个主表,其它均为子表,每个子表中均应有专用字段来记录、指向主表的标识主键。此处需要用户点选的就是主表中的标识主键。
如果选择的是非Access数据库,则此处主表标识主键列表框内只列出该主表内所有的主键字段,一般只有一个,也就是默认的主表主键。如果是Access数据库,由于系统则无法识别Access数据库的标识属性字段,因此需要用户自行挑选指定,一般都会是第一个字段。

6、在窗口左下的“子表名称列表框”内点选子表名称
如果没有勾选“启用子表”复选按钮,则此列表是灰色的,意味着无法使用。在该列表内点选用来参与存储采集结果数据的表名称。此时该列表右邻列表框中会罗列出该表内的所有字段,

7、点选子表中“指向父表主键的字段
如前所述,如果当前采集项目需要使用多张表来联合存储采集结果时,约定只有一个主表,其它均为子表,子表中要有专用字段来指向父表的标识主键。此处列表框内罗列的是该子表的所有可用字段,请在该列表框内点选指向父表主键的专用字段名。点选后,在列表框上方的灰色输入框内会显示点选字段的名称。系统会以该灰色输入框内的显示内容为最终选择结果。

8、确认选择无误后,点击按钮,完成一个子表的设置。此时可见刚才设置的子表会添加到右邻的“确认入选的子表”列表框内。只有在列表框内出现的子表,系统最终才会采用。

9、重复第6~第8步,完成对其它数据库子表的添加。(在使用系统默认数据库时,设置结束后如下图)


熊猫采集的采集项目设置,需要逐步进行,因为后面的配置依赖于前面的设置结果。
熊猫采集是采集软件的换代产品,其工作模式、设置方法与您使用过的任何采集软件都不同。因此首次配置项目时请参考新手指引。
一旦熟悉了熊猫的配置和工作机制,则操作和采集配置过程就会非常轻松、简单、便捷。
配置采集的配置思路很常规:通过翻页来遍历访问“标题列表页面”,进而访问所有的“内容页面”,在内容页面内来采集您需要采集的内容。
熊猫致力于追求所见即所得。通过鼠标点选看得见的网页内容即可完成对采集项目的配置。系统会记录用户的点选操作结果,并据此完成对采集项目的配置。
在项目设置窗口的右上方有实时动态帮助窗口,对每个设置选项都有详细说明。
在配置项目时,点击项目配置窗口上中位置的按钮,可以随时打开本帮助页面。


熊猫采集软件的设置流程:
  • 基本准备工作:
    1. 明确需要采集什么内容,从哪儿采。
    2. 明确采集的结果数据需要存储在哪儿,用什么存储。
    3. 熟悉被采集网站的逻辑架构,找到标题列表页面内容页面
  • 配置采集:
    1. 点击软件主界面菜单:“项目管理”-“新建项目”,新建一个采集项目。并依次设置:
    2. 项目基础设置(少数项目在此处需要打开设置界面下方的“高级设置”对话框。配置高级属性,新手略)
    3. 数据库设置
    4. 文件下载设置(默认情况下不用设置此项)
    5. 设置标题列表页页面翻页的方式和方法
    6. 设置标题列表页面向内容页面过度方式和方法
    7. 设置内容页面,配置需要采集的网页内容。并在内容页面模板管理窗口对定义的内容页面模板进行管理。
    8. 保存设置。完成采集项目的配置。
  • 试运行:检查运行的采集结果。依据采集运行结果,检查是否需要修改项目配置。

请问本帮助内容对你有帮助吗?是否还有费解地方?请在此反馈给我们,以便我们改进。谢谢!