一种基于大数据技术的专利数据采集系统
摘要
1.一种基于大数据技术的专利数据采集系统,其特征在于,包括:运行有专利采集管理系统软件的专利采集管理服务器,运行有调用管理系统且部署有网络爬虫的专利采集云服务器集群,以及存储有专利大数据并支持访问和下载的Hidden Web网页服务器;所述的专利采集云服务器集群由专利采集云节点服务器S1、专利采集云节点服务器S2、专利采集云节点服务器S3,…,专利采集云节点服务器Sn组成;专利采集管理服务器调用专利采集云服务器集群中的专利采集云节点服务器Si采用网络爬虫根据专利大数据采集任务去抓取Hidden Web网页服务器内的相对应的专利大数据;专利采集云服务器集群中的专利采集云节点服务器Si的调用管理系统采用零知识证明的验证方法对专利采集管理服务器的身份进行验证,其交互验证方法,包括以下步骤:步骤一:专利采集管理服务器在专利采集云节点服务器Si的调用管理系统上进行用户注册,具体包括:(1)调用管理系统在注册页面上弹出与专利采集管理服务器进行交互式通信的对话框;(2)专利采集管理服务器随机选择两个大素数pi和qi,计算ni=pi×qi和专利采集管理服务器随机选择素数ei,使计算出使(di,ni)=1;将ni和ei传送给调用管理系统,即输入到对话框内;步骤二:当专利采集管理服务器向专利采集云节点服务器Si发送调用请求时,调用管理系统开始对专利采集管理服务器的身份进行验证,具体的验证过程为:(1)调用管理系统在验证页面上弹出与专利采集管理服务器进行交互式通信的对话框;(2)专利采集管理服务器选择一随机数γ∈{2,ni-1},计算将xi输入在对话框内;(3)调用管理系统发送一随机数pi∈{1,2t}给专利采集管理服务器,即将pi显示到对话框内;(4)专利采集管理服务器计算并将yi发送给调用管理系统,即输入在对话框内;(5)调用管理系统验证是否成立;若等式成立,证明专利采集管理服务器知悉复合私有密钥pi、qi和di,则调用管理系统通过了专利采集管理服务器的身份验证。
