(一) 数据挖掘应用研究
1、 数据挖掘的定义
数据挖掘作为数据库研究中的一个很有应用价值的新领域,融合了数据库技术、机器学习、人工智能技术、统计学等领域的理论及技术,为了从海量的数据中发现隐含的、有意义的知识,从大型数据库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式。
2、 数据挖掘的功能
数据挖掘能分析方法以及主要任务为[6]。
(1) 分类:按照一定的标准把数据对象划归成不同的类别。
(2) 估值:通过对历史数据的分析找出规律,并建立模型,对未来数据的种类和特征进行分析。
(3) 描述和可视化:将结构或非结构数据转换成可视化图表,将隐藏在数据中的信息直接展现于人们面前。
(4) 预言:根据数据对象随着时间而产生变化的规律或变动趋势来预测未来的值。
(5) 相关性分组或关联规则:对大量的数据进行分析,从中发现满足一定支持度和可信度的数据项之间的联系规则。
(6) 聚集:在没有给定划分类的情况下,根据数据信息的相似度进行数据聚集。
3、 数据挖掘的应用
现如今,数据挖掘被应用在各种领域中,根据主要任务来划分[7]:
(1) 分类方法被应用于虚拟社区领域、企业商务、学术研究的分析中,近年来也发展到了教育研究和心理健康等多个领域的数据分析中。
(2) 聚类分析被广泛用于社交媒体、商业、学术研究以及医疗等领域。
(3) 关联分析被广泛应用于电子商务、医疗卫生、学术研究、物流等领域。
(4) 回归分析被应用于如学术动向的预测;医患关系的影响因素的预测和分析;政策舆情走向分析等。
(5) 特征分析主要应用于商业智能中的风险分析、在线医疗中用户数据分析、学术领域中的知识发现等。
(6) 时间序列的应用非常普遍,金融领域的股票市场分析,知识服务下的用户行为预测服务,经济销售预测等。
4、 数据挖掘的发展趋势
结合项目型企业特点,面向知识发现与管理,根据iConference 2017学术年会,数据挖掘发展趋势为:
(1) 可伸缩和可视化的交互方法:可伸缩的算法可以有效应对大数据时代下数据量的激增;可视化能帮助用户更好的理解与检验数据挖掘的结果。
(2) 挖掘对象的多样化和多元化:运用可伸缩和可视化的方法对更加广泛的数据来源进行挖掘,从而推动人在数据分析中的参与。
(3) 分布式数据挖掘和实时数据流挖掘:分布式系统的流行使集中式的数据挖掘不再能适应当前的环境,分布式挖掘在不久的未来将成为数据挖掘的主流。此外,为了处理流数据的应用,建立实时动态数据挖掘模型也被提上日程。
(二) 项目型企业CRM
1、 项目型企业概况
具有以下特征的企业称为项目驱动型企业[8]。项目驱动型企业是实行唯一性的、特有的任务分化的工作的组织,建筑业、咨询业及航母、大型装备制造、航天等制造业都属于这一分类。这些组织中,项目作为了主要特征,并且作为一个独立的成本核算单位产生盈亏报告。项目驱动型组织的利润增长就是通过一系列项目的动态实施来产生的,也就是说企业的利润是所有项目利润的累加。