摘要:    在互联网技术的飞速发展的背景下,互联网上的的信息也在飞速的增长。在这样的情况下,一页的网页根本容不下这么多的信息,于是网页链接也开始迅速增加起来。如何能够从特定页面中抓取所需要的链接资源,也变得越来越棘手起来。本次论文主要解决怎么获取分析网页上的链接,实现对分析好的链接的进行存储和管理的问题,数据的处理过程使用单线程和多线程两种方式进行处理,突出体现多线程的优势,并将实现查找某个页面上的所有链接是否包含某个关键字的功能。旨在设计一个简单易操作的,能抓取特定网页上的所有链接资源的管理程序。本文首先介绍了网页信息采集的背景,然后提出研究的基本内容。之后介绍系统的需求分析、系统设计、系统实现以及系统测试的基本情况。重点在于系统的设计与实现。9275
关键词:网页分析;数据存储;多线程;超链接;信息处理
Multi-threaded parallel search in the information processing
Abstract:     With the rapid development of Internet technology, the context of the information on the Internet is also rapidly growing. In this case, the web page can not simply tolerate so much information, the hyperlinks on the web page also growing rapidly. How to grab resource needed from a specific page links is becoming increasingly difficult. This research is mainly to solve how to obtain Analysis page link analysis to achieve a good link for storage and management issues, data processing procedure will use single-threaded and multi-threaded processing in two ways, highlights the advantages of multi-threading, Find and implement all the links on a page if it contains a keyword function. The research aimed at designing a simple and easy to operate, and can crawl all the links on a given page resource management program. First, this paper will introduces the background of the web information collection, and then make a basic content of the research. After that, it will introduce the presentation system requirements analysis, system design, system implementation and system testing the basic situation. This paper mainly focuses on system design and implementation.
Keywords:    Web analytics; data storage; multithreading; hyperlinks; Information Processing
目录
摘要    i
Abstract    i
1    绪论    1
1.1    课题的背景及研究现状    1
1.1.1    课题的背景及研究目的    1
1.1.2    课题的国内外研究现状    2
1.1.3    发展趋势    2
1.2    研究的基本内容    3
1.2.1    基本框架    3
1.2.2    研究的重点和难点    3
1.3    研究的方法及措施    4
2    系统需求与可行性分析    5
2.1    可行性分析    5
2.2    功能需求分析    5
2.2.1    系统功能说明    6
2.2.2    数据流图    7
2.2.3    数据字典    8
2.3    非功能需求    10
3    系统设计    11
3.1    模块详细设计    11
3.1.1    分析页面数据提取URL    11
3.1.2    单线程/多线程处理链接    12
3.1.3    日志模块实现    12
3.1.4    用户配置模块    13
上一篇:C#网上手机销售系统的设计与实现
下一篇:ASP.net《操作系统》在线作业模块的设计与实现

多频激励下典型非线性系统的振动特性研究

SOM神经网络多机器人任务分配算法研究

asp.net多维度元信息支持的...

用VisualBasic实现多画面播放功能【1344字】

WEB服务器多框架解决方案【1450字】

IP多媒体子系统IMS技术与應用【1466字】

DSP与单片机通信的多種方案设计【1567字】

STC89C52单片机NRF24L01的无线病房呼叫系统设计

上海居民的社会参与研究

酵母菌发酵生产天然香料...

压疮高危人群的标准化中...

浅谈高校行政管理人员的...

浅论职工思想政治工作茬...

从政策角度谈黑龙江對俄...

提高教育质量,构建大學生...

AES算法GPU协处理下分组加...

基于Joomla平台的计算机学院网站设计与开发