1.1  LASSO方法
 LASSO是目前比较流行的数据挖掘的一种方式,因为它有相当多的优点:能满保证变量的选择和参数的估计一起发生.它由Tibshirani提出来.
给定一线性回归模型
                                                            
其中,  是一个随机向量,其元素独立同分布,且均值为0,方差为 ,  是n×1阶向量,  是n×p阶自变量矩阵:
 
  为上述模型的系数向量.假如我们认为因变量和自变量都是被中心化过的,那么这个模型的截距就是零了.对于上面的模型,它的系数的LASSO估计量可以表示为:                                                 
 
若设计阵列正交,LASSO方法参数估计的显式表达为
                                                                          
在安排阵非列正交的时候,我们可以先确定 的值然后利用二次算法得到参数估计.在更为简单的情况下,还可以运用最小角回归(LAR)的方法对参数进行估计算法.
和岭回归相比较的话,LASSO方法从形式上来讲比较简单.LASSO方法就重要变量(参数估计较大的变量)的系数压缩这一概念来说影响不重,这样就保证了估计参数时候的准确性.
上一篇:整群抽样理论与方法的探究
下一篇:中国股票市场可预测性的研究分析

混合型数据的聚类分析及R软件实现

浅探线性代数中矩阵秩概念的应用

交叉分组下的频数分析参...

基于NPP数据的江苏省生态价值时空格局分析

泰勒公式证明等式与不等...

大一学生学习线性空间困难的研究

线性方程组的迭代解法及收敛性研究

从政策角度谈黑龙江對俄...

浅谈高校行政管理人员的...

STC89C52单片机NRF24L01的无线病房呼叫系统设计

压疮高危人群的标准化中...

基于Joomla平台的计算机学院网站设计与开发

浅论职工思想政治工作茬...

酵母菌发酵生产天然香料...

AES算法GPU协处理下分组加...

上海居民的社会参与研究

提高教育质量,构建大學生...