在聚类的过程中选用了应用比较广泛的系统聚类法,系统聚类是将每个样品分成若干类的方法,其基本思想是:每个样品各自成一类,然后计算类间距离,让距离最小的两类合并,再计算距离,再合并,这样每次减少一类,重复下去,直至所有的样品合为一类为止。

2。2  因子分析概述

因子分析是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,并使因子具有一定的命名解释性的多元统计分析方法[4]。现在,因子分析被应用的更加广泛,它既可以减少变量的个数,还不会丢失大量的信息,能够有效的降低变量维度。通常,因子有以下几个特点:(1)因子个数远远少于原有变量的个数;(2)因子能够反映原有变量的绝大部分信息;(3)因子之间的线性关系不显著;(4)因子具有命名解释性。

3  聚类分析与因子分析的实际应用

3。1  指标选择和样本数据 

本文数据主要来源就是东方财富网提供的2016年年报股票财务指标信息。依据最能够展现股票发展水平的重要数据指标来作为基本依据,最终在网站上选取了江苏省35家上市公司作为基本股票样本,并且适当的把不完整的数据样本剔除,给出每只股票的每股收益,每股净资产,净资产收益率,营业收入,投资收益,利润总额,净利润,总资产共8项相关财务指标数据,并以此分析和研究股票的投资价值,利用聚类分析和因子分析方式对股票数据进行分析。(样本数据见附录表1)

3。2  聚类分析的过程

3。2。1  原始样本数据标准化来自优I尔Y论S文C网WWw.YoueRw.com 加QQ7520~18766

因为选取的样本存在不一样的指标,所以不能直接进行比较。只有对样本数据作标准化处理,把可能会影响分析的因素消除,才能更好的进行聚类分析。

表2:标准化处理后的数据

序号 代码 名称 Z每股

收益 Z每股

净资产 Z净资产

收益率 Z营业

收入 Z投资

收益 Z利润

总额 Z净利润 Z总资产

1 600713 南京医药 -0。25369 -0。42918 0。10046 3。14995 -0。5756 -0。13769 -0。2273 0。52226

2 600682 南京新百 0。07182 1。28174 0。70714 1。6553 -0。43822 0。00762 0。02647 0。9707

3 600557 康缘药业 0。56009 0。48519 0。46747 -0。24442 -0。48833 -0。05666

上一篇:小学数学学困生成因及转化策略
下一篇:基于多元回归模型的江苏省粮食产量分析

高考与竞赛中有关不等式证明方法及其拓展

贝叶斯统计方法及其应用

基于时间序列电视节目收视率的统计分析

分布式拒绝服务的攻击检测和控制方法

浅谈数列极限的若干计算方法

多元智能理论在小学数学教学中的应用

浅谈求数列通项公式的各种方法

农村幼儿教育开题报告

ASP.net+sqlserver会员管理系统设计

“时尚与旅游”电子杂志的设计制作

家电制造企业绿色供應链...

论商业银行中间业务法律...

高校体育场馆效益研究【2772字】

企业科研管理中统计报表...

基于安卓平台的二维码会议管理系统设计

透过家徽看日本文化家紋から見る日本文化

华夫饼国内外研究现状