摘要: 近年来,学术造假、科研抄袭事件频发不止,大学生论文抄袭更是层不出穷,学术不端的问题不仅在中国,在世界范围内,都是一个令学界头痛不已的学界“肿瘤”。抄袭现象的普遍导致了学生诚信度受到质疑,甚至影响到真正做学术研究的学生的积极性,因此,查重软件应运而生。该系统是基于C#语言,采用了编辑距离算法即LD(Levenshtein Distance)算法,通过比对源文档和目标文档相似性给出相似度结果的一种信息处理系统。 本系统自动将文档切割为多个50到200字(可自定义)的小文本,通过一定的算法将其与其它文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。该系统可以实现两个文档的检测、一个文档对多个文档检测以及多个文档对多个文档的检测。检测结果将会已百分比形式显示,以精确的数字直观的了解到文档的重复度。通过该系统,可以直观有效的检测学生论文等学术文献的抄袭行为。52410

毕业论文关键词: 相似度;距离编辑算法;检测;

Text similarity detection system

Abstract: In recent years, academic cheating and scientific plagiarism have been exposed to the society frequently, let alone the thesis plagiarism phenomenon among the college students. Academic misconducts contaminate the academic circle like tumors all over the world. As a result, students’ credibility is called in question. Besides, those who do academic wholeheartedly may lose their enthusiasm. Therefore, checking system-an information processing system based on the C# language and the Levenshtein Distance occurs. Such system contracts the similarity of the source document and the target document. The checking system that I have made pides a document into several small texts consisting of 50 to 200 words automatically and matches these texts with other documents through some algorithm to mark the degree of similarity. This system can check the similarity between 2 documents, that between one document and others and that between documents and documents. The checking result is a percent. This system helps to see whether students have plagiarized or not. 

Keywords: Similarity; Levenshtein Distance; testing; 

目录

摘要 i

Abstract i

目录 ii

1 绪论 1

1.1 课题介绍 1

1.2 可行性研究分析 1

1.2.1 本课题研究的意义 1

1.2.2 调研分析 3

1.2.3 研究结论 5

1.3 开发环境 6

1.3.1 开发硬件环境 6

1.3.2 开发系统环境 6

1.3.3 开发工具 6

2 软件需求分析 7

2.1 功能需求概述 7

2.2 设计思想 7

3 系统设计概述 8

3.1 系统功能需求概述 8

3.2 系统的三个功能模块 8

3.3 系统检测思路 9

3.4 系统核心算法 11

3.4.1 算法实现过程

上一篇:jsp+sqlserver医院管理系统设计与实现
下一篇:弘扬国学宣传短片Flash设计制作

基于深度学习的目标识别算法研究

安全巡检系统研究现状

JSP+MySQL远程温度测控系统服务端的设计与实现

asp.net多维度元信息支持的...

AngularJs自定义指令不确定...

基于亲和度分析的歌曲推荐算法

超阅读:数码时代的文本变革【15688字】

弹道修正弹实测弹道气象数据使用方法研究

浅谈动画短片《天降好运》中的剧本创作

林业机械作业中的安全性问题【2230字】

大学生就业方向与专业关系的研究

适合宝妈开的实体店,适...

紫陵阁

人事管理系统开题报告

小学《道德与法治》学习心得体会

组态王文献综述

淮安市老漂族心理与休闲体育现状的研究