词条 | 回归分析 | ||||||||||||||||||||||||||
类别 | 中文百科知识 | ||||||||||||||||||||||||||
释义 | 回归分析huigui fenxi“回归”原是生物学的词汇。英国科学家F·高尔顿在研究中发现:父母的身高与其子女的身高有一定的关系,即子女的身高向其父母的平均身高方向趋近,这种趋近现象称为“回归”。后来以此名词泛指变量间的这种关系。变量之间的关系一般可分为两类。一类是一种完全确定的关系,即称函数关系,如圆面积A与半径R的函数关系为A=πR2。另一类是一种不完全确定的关系,即称相关关系,如身高与体重的关系中,一般说来身高者体也重,但也有身高者体并不重的。在教育上较多的是相关关系。回归分析就是处理多个变量间相关关系的一种数学方法,它主要解决:❶确定几个特定变量之间是否存在相关关系?如是,则要找出它们之间的合适数学表达式;
![]() 回归方程的效果 这个问题具体指:❶回归系数b是否显著?若显著,则回归或预测效果较好。 ❷回归效率有多大?即能被预测的成分占总成分的比例有多少。为此必须先对回归方程进行统计检验。检验的方法是对回归方程进行方差分析,即把因变量(Y)之间的总变差(SST)分解成自变量(X)之间的变差(SSU)和剩余变差(SSQ): SST=SSL+SSQ 式中 SSU——回归平方和,属一种预测的变差 SSQ——剩余平方和,属一种非预测的变差 它们的方差分析表如下: a=0.01及f1 =1和f2= 10查F分布表得F(1.10)0.01=10.0。由F>F(1,10)0.01=10,故拒绝假设H0,即回归方程的回归系数有极显著的意义,亦即回归方程的效果很好。 回归方程的效率是回归变差在总变差中所占的比重,即 ![]() 式中 r——相关系数 其余符号同前。 从式中亦可知,回归效率恰为相关系数的平方。 ![]() 注意:如果F检验不显著,则有下列几种可能:❶影响Y的因素除X外,至少还有一个不可忽视的因素; ❷X和Y是非线性关系; ❸X与Y无关。 利用回归方程进行预测 从统计观点来看,所谓预测就是一个区间估计问题。即在回归方程中,在一定的置信水平α下,找出一个正数δ,使得某自变量X0所对应的实际观测值Ŷ0以(1-α)的概率落在(Ŷ0-δ,Ŷ+δ)之内,即 ![]() ![]() ![]() ![]() 称随机因素波动程度的指标。显然,S愈小即随机因素的波动愈小,则对Y0的预测就愈准确(即估计值Y0愈接近于Y0)。因此S是回归方程中预测Y0的精确度的指标。设X0来自于正态分布,则它所对应的Y0和Y0也服从于正态分布,因而Y0-Ŷ0也服从于正态分布。这就是说,当X=X0时,实际观测值Y0是以估计值Ŷ0为中心而正态地分布着,并且它与S之间有下述关系: Y0落在Ŷ0±S内的概率约为0.683(68.3%); Y0落在Ŷ0±2S内的概率约为0.954(95.4%); Y0落在Ŷ0±3S内的概率约为0.997(99.7%)。 就一般而言,Y0落在下面二直线之间的概率为1-a: ![]() 故Y0落在这2条直线内的概率为95%以上。 多元线性回归的方法与一元线性回归的思想基本相同,其回归方程为 ![]() 任何两个变量之离差积的平方和为 ![]() 则关于b1,b2,…,bk的正规方程组为 ![]() 解这一正规方程组可得:b1,b2,…,bk; ![]() 多元线性回归的方差分析表如下: ![]() 检验多元线性回归的效果是用复相关系数: ![]() K2为回归效率。R与相关系数r的意义相同,但0≤R≤1;其检验方法亦与r相同,但自由度为N-K。 回归分析huigui fenxi根据变量间的数量关系的模型来预测其中一些变量的状态的方法。由于描述、预测和控制是心理学研究的主要目的,因此,作为预测方法之一的回归分析具有很重要的意义。一般来说,回归系数越高,预测越精确;反之,预测的误差越大。回归分析主要有: 回归分析数理统计的一个内容。详“相关分析”。 |
||||||||||||||||||||||||||
随便看 |
开放百科全书收录579518条英语、德语、日语等多语种百科知识,基本涵盖了大多数领域的百科知识,是一部内容自由、开放的电子版国际百科全书。