【因素分析法的计算例题】多因素分析法研究

来源:财务工作总结 时间:2019-08-07 14:30:11 阅读:

【www.bbjkw.net--财务工作总结】

  多因素分析法研究

  小编为大家整理的相关的多因素分析法研究资料,供大家参考选择。

  多因素分析

  研究多个因素间关系及具有这些因素的个体之间的一系列统计分析方法称为多元(因素)分析。主要包括:

  多元线性回归(multiple linear regression) 判别分析(disoriminant analysis) 聚类分析(cluster analysis)

  主成分分析(principal component analysis) 因子分析(factor analysis) 典型相关(canonical correlation) logistic 回归(logistic regression) Cox 回归(COX regression)

  1、 多元回归分析(multiple linear regression)

  回归分析是定量研究因变量对自变量的依赖程度、分析变量之间的关联性并进行预测、预报的基本方法。研究一个因变量对几个自变量的线性依存关系时,其模型称为多元线性回归。函数方程建立有四种方法:全模型法、向前选择法、向后选择法、逐步选择法。

  全模型法其数学模型为:ebbbb++++=ppxxxyL22110

  式中 y 为因变量, pxxxL21, 为p个自变量,0b为常数项,pbbbL21,为待定参数,

  称为偏回归系数(partial regression coefficient)。pbbbL21,表示在其它自变量固定不变的情况下,自变量Xi 每改变一

  个单位时,单独引起因变量Y的平均改变量。多因素分析法研究

  e为随机误差,又称残差(residual), 它是在Y的变化中不能为自变量所解释的部分

  例如:1、现有20名糖尿病病人的血糖(Lmmoly/,)、胰岛素(LmUx/,1)及生长素(Lgx/,2m)的数据,讨论血糖浓度与胰岛素、生长素的依存关系,建立其多元回归方程。

  逐步回归分析(stepwise regression analysis)

  在预先选定的几个自变量与一个因变量关系拟合的回归中,每个自变量对因变量变化所起的作用进行显著性检验的结果,可能有些有统计学意义,有些没有统计学意义。有些研究者对所要研究的指标仅具有初步知识,并不知道哪些指标会有显著性作用,只想从众多的变量中,挑选出对因变量有显著性意义的因素。

  一个较理想的回归方程,应包括所有对因变量作用有统计学意义的自变量,而不包括作用无统计学意义的自变量。建立这样一个回归方程较理想的方法之一是逐步回归分析(stepwise regression analysis)

  基本原理:按这个自变量在方程中对因变量作用的大小,由大到小依次引入方程。每引入一个自变量都要对回归方程中每一个已引入的(包括刚被引入的)自变量的作用作统计意义检验,若发现一个或几个已被引入的自变量的作用无统计学意义时,即行剔除。每剔除一个自变量后,也要对留在回归方程中的自变量逐个作统计学意义检验。如果发现方程中还存在作用无统计学意义的自变量时,也予以剔除,直至没有自变量可引入,也没有自变量可从方程中剔除为止。

  最优方程应是:ebbb+++=ppxxyL110

  对y有显著性作用的自变量全部到回归方程中。凡是对y没有显著性作用的自变量都不被引入方程。多因素分析法研究

  例如:

  1、讨论中学生的肺活量的影响因素,观察了10名女中学生的体重(X1, kg)、胸围(X2, cm)、胸围之呼吸差(X3, cm)及肺活量(Y, ml)。

  2、某研究协作组调查煤矿工人II期高血压患者40例,同时调查了工作面的污染程度(X1 )、井下工作时间(X2)、每人的体重(X3)、吸烟年限(X4)、饮酒年限(X5)和收缩压(y),欲分析影响煤矿工人II期高血压患者收缩压高低的主要因素。

  3、为探讨影响差等生学习成绩的因素,某儿科医生调查了某学校六年级各班倒数第五名以内学生的平均成绩(y),并测定了智商(X1 )、血清铁(X2)、血清酮(X3)、日均热卡(X4)、日均食入蛋白量(X5)、头围(X6 )和月人均收入(X7)

  2、 判别分析(discriminant analysis)

  根据已掌握的一批分类明确的样品,制定出一个分类标准用以判断以后新样品的归类。在医学研究中经常遇到根据某病人的各种症状、体征、化验结果等来判定病人患的什么疾病,如:根据骨科的X光片的各种特征判断病人属于何种骨瘤?体育选材中根据运动员的体形、运动成绩、生理指标、心理素质指标、遗传因素判断是否选入运动队继续培养等。

  判别分析在医学领域的主要用途是:

  1、疾病诊断: 用判别分析的方法诊断疾病又称为计量诊断。包括临床诊断、X线诊断、心电图诊断、超声波诊断、脑电图诊断等。

  2、疾病预报: 流行病预报、某些疾病(心肌梗死、中风)的早期预报。

  3、预后估计: 某些疗法的疗效估计,某些恶性肿瘤患者的生存期估计等。

  4、疾病的病因学估计: 研究引起疾病的原因,并分析其主要影响因素。多因素分析法研究

  判别分析:要求Y变量二分类或多分类的属性变量。分别用Fisher和Bayes准则进行计算。

  同时根据样本中个体的症状、体征选用多元逐步判别分析的方法,来判断病人患的什么疾病。其判别函数为:

  Z = b1x1 + b2x2 + b3x3 …..+ bkxk

  对判别函数在实际应用中的判别能力要进行检验。

  判别临界值:()()[]2121

  0/nnbnanYyy+úû

  且:

  所以:若 Y>Y0 判为A类;若 Y<Y0 判为B类。 可以计算各指标的贡献率,进行回代检验其符合率。多因素分析法研究

  例如:

  1、有健康人10名,心肌梗死病人6名,分别进行心电图检查得到三个指标X1、X2、X3 。建立这两类人的判别式,以次判别新的就诊患者是否为心肌梗死病人。

  2、对正常人和白血病人进行血清学方面的研究,用高分辨核磁共振谱仪分析α峰形,以α峰的高度(X1)和峰腰(X2)的宽度作为观察指标,采集了13名白血病人和11名献血员作为健康人的血清的α峰形。

  3、现有已知分类的健康人11人,硬化症患者7人,冠心病患者5人,这23人的心电图的5个指标测量数据,建立判别方程。

  3、 logistic 回归分析

  多元线性回归要求y是呈正态分布的连续型随机变量。医学中常见这样的试验:动物服药后是生(假设其值为1)还是死(假设其值为0),或是发病(1)还是未发病(0)等。当因变量取值为(0,1),自变量可能是分类变量,也可能是连续变量时,用线性回归分析的方法进行处理是不合适的,应选用Logistic 回归。

  Logistic 回归属于概率型回归,用来分析某类事件发生的概率与自变量之间的关系。适用于因变量为二值变量(或多分类)的情形。

  基本概念:因变量的预测值在0~1之间。如根据冠心病病人的饮食特点、吸烟史、生活的方式、得病的类型等数据资料,建立一个logistic 回归方程来预测病人的冠心病的可能性。

  数学模型:y = ()[]ijjjjxbappå+=-1/ln

  式中:jp是在条件()mjjjjijxxxxxLL321,,=下,某事件发生的概率, jp-1是该事件不发生的概率。其中,,~1mi= m 是自变量

  的个数。a是截距,bi 是待估计的参数。

  Logistic 回归方程的曲线为S型,预测值最大值趋近1,最小值趋

  近0。多因素分析法研究

  logistic 回归方程的另一种表达形式:()()[]

  yypexp1exp+=

  通过变换可以得出P与多元变量Xi 间的数学表达式:)

  exp(1)

  exp(iiiixbaxb )exp(11iixbap)

本文来源:https://www.bbjkw.net/fanwen426355/

推荐访问:多因素分析法例题 多因素方差分析法 多因素多水平分析法 双因素分析法研究 因素分析法案例 单因素分析法 关键因素分析法 加权因素分析法 成本因素分析法 财务因素分析法 文化因素分析法 风险因素分析法 毛利率因素分析法 冷热因素分析法 三因素分析法 主因素分析法 单因素分析法研究 主次因素分析法
扩展阅读文章
热门阅读文章