1、引擎:用来处理整个系统的数据流,触发新事务。

2、调度器:用来接受引擎发过来的请求,压入队列中,并在引擎再次请求时返回。

3、下载器:主要用来下载网页中的内容,并将其返回给蜘蛛。

4、蜘蛛:蜘蛛主要是来制订特定域名或网页的解析规则。

5、项目管道:负责处理由蜘蛛从网页中抽取的项目,主要任务是理清、验证和存储数据。当页面被蜘蛛解析后,将被发送到项目管道,并经过几个特定的次序处理数据。

6、中间件:主要有下载器中间件、蜘蛛中间件和调度中间件。[7

上一篇:Android移动校园助手的设计与实现
下一篇:MATLAB多旋翼飞行器的PID姿态控制系统设计

Python+mysql宠物领养平台的设计与实现

IEEE802.15.4网络自适应策略研究

MATLAB基于流形学习与神经网络的预测建模

社交网络个性化推荐方法对比研究

jsp+mysql网络招标评审系统设计+源代码

基于生物启发神经网络的AUV三维路径规划

SOM神经网络多机器人任务分配算法研究

酵母菌发酵生产天然香料...

压疮高危人群的标准化中...

浅论职工思想政治工作茬...

提高教育质量,构建大學生...

浅谈高校行政管理人员的...

AES算法GPU协处理下分组加...

从政策角度谈黑龙江對俄...

上海居民的社会参与研究

STC89C52单片机NRF24L01的无线病房呼叫系统设计

基于Joomla平台的计算机学院网站设计与开发