对于帮助投资者做出盈利最大的抉择这个问题,不仅要对上市公司多项指标进行综合分析做出预判,该上市公司股票是否值得投资,还要对后续股票价格走势做出准确的预测。因此,单纯的统计学模型难以达到决策的目的,需结合统计学方法和数据挖掘技术,设计一套流程完整、科学而合理的选股模型。
首先,运用多元统计学中的主成分分析法对上司公司投资价值的多项指标降维,将高相关性的冗余属性浓缩成不相关的低维指标,并建立综合评价指标对上司公司的投资价值做出预判。
对判断为值得投资的股票,我们需结合数据挖掘技术作进一步分析,最终才能做出利润最大的决策。人工神经网络作为最常用的数据挖掘技术之一,有着强大的自我学习能力,适合用于处理非线性的复杂问题。其中,极限学习机较传统神经网络有着更高的准确度和尽可能少的人工干预,能快速完成实时学习的过程。因此,通过训练极限学习机模型,对股票价格做出预测,帮助决策者选择盈利最高的策略。
1.1 课题的目的和意义
1.1.1 研究背景
现今,大数据概念深入人心,数据挖掘技术被广泛运用于各行各业,其中对股市的研究是一大热门领域,如何选择一支高价值的股票,在短期内获得高收益,是许多企业和个人关注的问题。然而传统的统计学模型,难以解决这类复杂的非线性问题,市场上影响股票的因素有很多,上市公司的财政情况等等。高维变量不一定能带来高精确度,我们需要对股票数据进行降维处理,随即我们能筛选出一批高投资价值的股票。
结合数据挖掘技术,运用人工神经网络模型对股票价格数据进行预测,模拟真实股票投资环境,计算最后收益。将收益结果与真实投资结果比较,检验模型的参考价值和可行度。
但由于传统递归神经网络常运用的梯度下降法算法,往往目标函数十分复杂,容易出现“锯齿现象”、“过度拟合”的情况、,甚至会得到局部极小值,使得算法学习速度缓慢,影响预测的精准度。
因此,在本文模型中引入ELM极限学习机,是一种单层前馈式神经网络,与传统神经网络不同,不受限与参数设定,且学习速度更快,精度更高。
1.1.2研究目的和意义
人工神经网络具有很强的非线性映射能力,灵活性很大,不仅在优化、智能控制信号处理与识别故障等许多领域都有着广泛的应用前景,在医疗、金融、教育、无人驾驶等行业的深入运用更是能满足人们日益增长的对高新科技的智能生活的需求,因此研究将它的过去已有的理论基础和未来发展应用结合起来具有重要的实际意义。
在金融行业,尤其是股票投资领域,股票价格的预测一直以来都是投资者们的重点关注对象,但由于股票价值受多种外界因素影响,具有复杂的非线性关系,传统预测模型难以做到准确模拟价格走势。但由于神经网络无需对角色的活动规律进行编译,它从零开始学习,渐渐适应复杂的情况,这种模式使得它在处理复杂问题时要比其他算法更简单的。
通过选取人工神经网络技术可以实现数据挖掘技术中的预测功能,可把具有复杂非线性关系的自变量经过一定数量的训练后,较为准确的预测因变量结果。
因此,本文结合主成分分析和极限学习机,进行了基于人工神经网络的数据挖掘技术在中国股市中的研究,通过神经网络中广义逆矩阵的修正,改进神经网络计算和预测功能,并运用于股票决策中,用真实的股市数据检验选股模型的可行性和盈利程度。