线性最小二乘法相关公式的详细推导请转到人教版数学选修三
终于到最后一章了不是吗?很快就可以逃离高中数学的苦海了。
圆锥曲线和导数都通关了,统计那不得直接秒!
等等,这
还有尾杀是吧,数学书你不讲武德(吐血)
以上纯属虚构。非常好卡方独立性检验,使我的卡西欧旋转
前言
最小二乘法是最为常用的带误差数据拟合法,除开数学卷子,它也可能出没于如下地点:
- 物理卷子(例如“实验——探究弹簧伸长量和所挂重物质量的关系”中的作图题)
- Excel表格
- 这篇文章
- 某些抽卡游戏的玩家自制概率图
可见在数据统计领域,最小二乘法是不可获缺的分析数据的方法;在应试教育领域,它也是高考的一个重要考点。今天就由易到难介绍一番最小二乘法的计算方法。
线性最小二乘法
学完了高中数学,我们就应该知道这样一些用于计算线性回归的公式:
在线性拟合过程中,我们希望拟合直线能够尽可能接近所给的点。而“点与直线的竖直距离”自然就是刻画上述“点与直线接近程度”的首选方案,然而计算距离需要加入绝对值,使得计算不方便,因此以竖直距离平方代替,也就是“二乘”的由来(指平方)。看以下例题:
Example 1. Science of Prescience Pt.I
你向太卜司符玄请教了穷观阵的运作原理。
简而言之,穷观阵会对给定输入物品进行某种运算,根据计算结果,可以推演出周遭事物从古至今的变化历程,从而实现窥探历史、预测将来的神奇功能。当然,由于要保证仙舟的平稳运作,穷观阵的推算模块也必须尽可能减小一切形式的估算误差——即对给定的数据,求得某个直线,使得这条直线能最好的适应这些散点,并请根据推演结果预测数据
的结果。
编号 | x | y |
---|---|---|
1 | 1 | 3 |
2 | 2 | 7 |
3 | 3 | 10.5 |
4 | 0.5 | 0 |
易知
问题很简单,代入上文公式中可以求得
当然拟合也存在误差,接下来就要设计函数关系,使我们可以对拟合效果进行定量分析。
1.残差分析
实质上是比较估计值和实际值之间的差距,是很简单的一种误差分析方法。定义为“观察值减估计值得到的差”,假如例一中接着给出点
2. 线性相关系数
稍难一些,计算量也比较大。样本线性相关系数定义为
那么至此我们就完成了一个典型的线性回归方程的例题,接下来看更复杂的情况。
一般形式的最小二乘法
首先引入一个例题,作为例一的加强版:
Example 2. Science of Prescience Pt.II
我们都知道,命运是捉摸不定的,在起起落落间交替……
你请求太卜大人帮你预测一下近些日子的运势,尽管符玄早已看破你的小心思,但她还是决定给你一次机会。
人生有诸多起伏,符玄从中摘取了一段,并随机挑出了一些散点,拿到你的面前。你发现这些散点近似组成了一个二次函数,符玄也肯定了这点。你的任务是写出一段二次解析式,使得该函数与给出的散点之间的误差最小,并计算当
时 的值。
编号 | x | y |
---|---|---|
1 | 3 | 4 |
2 | 1.5 | 8.5 |
3 | -0.5 | 0.5 |
4 | 2 | 8 |
在二次最小二乘法问题中,
假设二次函数为
总结一下,矩阵二乘法的公式是类似于