8

1.3.1 Google 8

1.3.2 Bing 9

1.3.3 百度 10

2 项目框架介绍 11

2.1 SCRAPY 11

2.1.1 Scrapy爬虫框架介绍 11

2.1.2 Xpath 11

2.2 ELASTICSEARCH 12

2.2.1 Elasticsearch搜索框架介绍 12

2.3 DJANGO 13

2.3.1 Django框架介绍 13

3 课题结构详解 16

3.1 爬虫(SPIDER) 16

3.1.1 基础架构设计 16

3.1.2 爬取算法 21

3.1.3 储存爬取数据 22

3.2 ELASTICSEARCH 23

3.2.1 建立索引 23

3.2.2 对数据进行存储 23

3.3 DJANGO 25

3.3.1 基础架构设计 25

3.3.2 后端设计 26

3.3.3 前端设计 27

4 结论 29

4.1 爬虫运行 29

4.2 数据存储 29

4.3 搜索结果 29

1 绪论

本课题名为计算机专业文章搜索引擎,在日常学习与生活中我们早已离不开搜索引擎,不论是学习或是生活中遇到问题,第一时间就会使用搜索引擎来查找答案,搜索引擎早已成为了我们生活中离不开的部分,而我们早已养成了遇到问题就使用搜索引擎的习惯。由于众所周知的原因,中国由百度搜索引擎一家独大,搜索引擎作为现代互联网重要的入口,百度的所作所为似乎并不能让人满意,从“魏则西事件”到我们每天使用百度搜索引擎所出现的广告,甚至是诈骗钓鱼网站,百度早已失去了搜索引擎原本的初衷,在巨大商业利益的面前,百度似乎早已迷失了方向。但是,我们早已离不开搜索这一互联网世界的入口,当我们需要查找学习资料时,我们陷入了纠结,既不能使用Google又不想使用百度,所以在这种情况下我想设计这样的一款搜索引擎,只针对计算机专业的文章进行搜索。

1.1

上一篇:JSP企业产品管理与展示平台设计与开发
下一篇:没有了

Python+mysql宠物领养平台的设计与实现

jsp《计算机硬件技术基础...

基于WEB的计算机导购平台的设计与实现

ASP.NET的计算机协会管理系统的设计与实现

C语言在计算机中的应用探讨

Python广告投放分类问题中的特征提取方法

python基于决策树算法的球赛预测

新事业单位會计制度下基...

初探城市规划中城市景观设计方法【1346字】

未注册商标法律保护制度研究

全站仪自由设站法在测绘中的应用研究

心里深藏着一个世界宗白...

江苏宿迁三胎政策2023,生...

公众参与立法模式论文开题报告

今文学派文献综述和参考文献

當前职业教育产教融合存...

多功能办公椅设计任务书