毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
社会舆情信息采集研究(3)
2.1 正则表达式简介 正则表达式[7] 是一种可以用于模式匹配和替换的强有力的工具,一个正则表达式 就是由普通的字符(例如字符 a到z)以及特殊字符(称为元字符)组成的文字模式, 它描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板, 将某个字符模式与所搜索的字符串进行匹配。 正则表达式在字符数据处理中起着非常重要的作用,我们可以用正则表达式完 成大部分的数据分析处理工作,如: 判断一个串是否是数字、是否是有效的 Email 地 址,从海量的文字资料中提取有价值的数据等等,如果不使用正则表达式,那么实 现的程序可能会很长,并且容易出错。对这点本人深有体会,面对大量工具书
电子
档资料的整理工作,如果不懂得应用正则表达式来处理,那么将花费很大的时间, 反之则将可以轻松地完成,获得事半功倍的效果。
2.2 HTMLParser 概述 HTMLParser [8] 是一个开源的Java库,它提供接口,支持线性和嵌套的解析HTML 文本,HTMLParser Libraries 提供了一系列访问本地和网络 HTML 资源的 API。 Htmlparser.jar 提供底层的接口,它负责访问 HTML 中的文本、注释、标签等节点, 并把它们转换成线性的节点。HTMLParser 提供了两种访问节点的方法:Filter 模式 和Visitor 模式。
共3页:
上一页
1
2
3
下一页
上一篇:
电子商务网站分类使用中的学习现象研究
下一篇:
基于UML的某社团网站系统的建模与设计
Android员工请假系统设计
高校校园网信息安全隐患及防范措施
大数据时代下电子商务个性化信息服务研究
java+mysql学术会议参会信息系统的设计+源代码
JAVA+MYSQL小型超市进销存信...
Android朋友信息管理系统设计
C#+sqlserver餐饮管理信息系统的设计+源代码
组态王文献综述
淮安市老漂族心理与休闲体育现状的研究
大学生就业方向与专业关系的研究
人事管理系统开题报告
弹道修正弹实测弹道气象数据使用方法研究
小学《道德与法治》学习心得体会
浅谈动画短片《天降好运》中的剧本创作
适合宝妈开的实体店,适...
林业机械作业中的安全性问题【2230字】
紫陵阁