毕业设计(论文)题目:网络爬虫设计与实现 一.毕业设计(论文)内容及要求(包括原始数据、技术要求、达到的指标和应做的实验等) :

  1。 理解网络爬虫的原理;86165

  2。 设计实现一个简易网络爬虫。

二.完成后应交的作业(包括各种说明书、图纸等) :

  1。 网络爬虫源代码;

  2。 本科毕业论文

  3。 不少于5000字的英文翻译

三.完成日期及进度 :

  1。 3。21~4。3 下达任务书,完成英文翻译,开题

  2。 4。4~5。4 完成软件环境的搭建与部分仿真,中期检查;

  3。 5。5~5。15 完成课题规定的全部任务;

  4。 5。16~5。25 完成论文写作,准备答辩。

四.主要参考资料(包括书刊名称、出版年月等) :

[1] 周德懋, 李舟军。 高性能网络爬虫:研究综述,计算机科学,2009(8)。

[2] 万源,万方,王大震。  一种并行Crawler系统中的URL分配算法设计。 计算机工程与应用。 2006(S1)。

[3] 李晓明,凤旺森。  两种对URL的散列效果很好的函数。 软件学报。 2004(02)

[4] 张敏,高剑峰,马少平。  基于链接描述文本及其上下文的Web信息检索。 计算机研究与发展。 2004(01)

[5] Dean J,Ghemawat S。MapReduce:Si mplified Data Processing onLarge Clusters。 Proceedings of the 6th Conference on Sym-posiumon Opear-ting Systems Design&I mplementation 。 2004

[6] Samaras G,Papapetrou O。Distributedlocation aware web craw-ling。 Proceedings of the 13thInternational World Wide WebConference 。 2004。

[7] Lee Hsin-Tsang,Leonard D。IRLbot:Scalingto6 Billion Pagesand Beyond。 Proceedings of the 17th International WorldWide Web Conference 。 2008。

[8] Shkapenyuk V,Suel T。Design and i mplementation of a highperformance distributed web crawler。 Proceedings of the18th International Conference on Data Engineering 。 2002。

[9] 余锦,史树明。  分布式网页排序算法及其传输模式分析。 计算机工程与应用。 2004(29)

[10] 陈华,罗昶,王建勇,段晖,薛明。  基于Web的百万级FTP搜索引擎的设计与实现。 计算机应用。 2000(09)

上一篇:六自由度三维扫描仪手臂式支架设计任务书
下一篇:智能健康计步器设计任务书

58000DWT散货船货舱309P分段设计任务书

23000DWT散货船锚泊系泊设备设计任务书

低合金贝氏体钢研制任务书

PLC技术电梯控制任务书

粉料称重装置控制系统设计任务书

太阳能自动跟踪系统设计任务书

浮式防波堤构型设计任务书

压疮高危人群的标准化中...

AES算法GPU协处理下分组加...

浅谈高校行政管理人员的...

浅论职工思想政治工作茬...

从政策角度谈黑龙江對俄...

STC89C52单片机NRF24L01的无线病房呼叫系统设计

提高教育质量,构建大學生...

酵母菌发酵生产天然香料...

上海居民的社会参与研究

基于Joomla平台的计算机学院网站设计与开发