为什么随机误差服从正态分布？

前言
正态分布的导出
python绘制图像

前言

正态分布分布在概率论与数理统计中处于核心地位。它最初作为二项分布计算的渐近公式由棣莫弗引进，后被拉普拉斯发展成系统的理论，但把它作为一个分布来进行研究则归功于高斯，他在19世纪初的测量误差研究中导出的误差函数，后被高斯命名为正态分布。因此正态分布又称高斯分布。这项研究又是当代统计学中重要思想——最大似然估计的源头。

正态分布的导出

在测量中若为 <svg style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 603 658"> svg>真值，为 <svg style="vertical-align: -0.357ex;width: 1.959ex;height: 1.357ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 866 599.8"> svg>观察值，而误差 <svg style="vertical-align: -0.489ex;width: 6.089ex;height: 1.808ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -583 2691.4 799"> svg>的分布概率密度为 <svg style="vertical-align: -0.566ex;width: 8.987ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 3972.4 1000"> svg>。经验表明 <svg style="vertical-align: -0.566ex;width: 4.192ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1853 1000"> svg>关于 <svg style="vertical-align: -0.186ex;width: 5.442ex;height: 1.692ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -666 2405.6 748"> svg>对称，而且对一切 <svg style="vertical-align: -0.025ex;width: 1.294ex;height: 1.025ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 572 453"> svg>成立。为了推导方便，还假设 <svg style="vertical-align: -0.566ex;width: 4.192ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1853 1000"> svg>具有连续导函数。

如果有独立同分布的观察值 <svg style="vertical-align: -0.439ex;width: 12.818ex;height: 1.439ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 5665.4 636"> svg>，其似然函数为 <svg style="vertical-align: -0.777ex;width: 21.892ex;height: 2.563ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -789.6 9676.3 1132.9"> svg>，它表征了这组观察值落在 <svg style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 603 658"> svg>的附近的可能性大小。高斯的假定是：观察值的平均值 <svg style="vertical-align: -0.798ex;width: 24.112ex;height: 2.755ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -864.9 10657.6 1217.7"> svg>作为未知参数 <svg style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 603 658"> svg>的估值使 <svg style="vertical-align: -0.566ex;width: 4.665ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 2062 1000"> svg>达到最大。

下面利用这个假定导出正态分布若 <svg style="vertical-align: -0.025ex;width: 1.294ex;height: 1.491ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -648 572 659"> svg>使似然函数 <svg style="vertical-align: -0.566ex;width: 4.665ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 2062 1000"> svg>达到最大，则

记 <svg style="vertical-align: -0.798ex;width: 13.81ex;height: 3.167ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -1047.1 6103.9 1399.9"> svg>,则 <svg style="vertical-align: -1.238ex;width: 11.502ex;height: 3.621ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -1053.5 5083.7 1600.6"> svg>，这时：

当n=2时，方程化为：

由于 <svg style="vertical-align: -0.566ex;width: 19.071ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 8429.6 1000"> svg>，以及 <svg style="vertical-align: -0.439ex;width: 5.42ex;height: 1.439ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 2395.8 636"> svg>的任意性得到 <svg style="vertical-align: -0.566ex;width: 14.804ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 6543.6 1000"> svg>对一切实数 <svg style="vertical-align: -0.025ex;width: 1.294ex;height: 1.025ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 572 453"> svg>成立

当n=3时，方程又可以化为：

由于 <svg style="vertical-align: -0.566ex;width: 31.122ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 13756 1000"> svg>，可知对一切实数 <svg style="vertical-align: -0.464ex;width: 3.409ex;height: 1.464ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 1506.7 647"> svg>成立

这是柯西函数方程，很容易证明其解比为 <svg style="vertical-align: -0.566ex;width: 9.415ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 4161.6 1000"> svg>.

事实上，若记 <svg style="vertical-align: -0.566ex;width: 11.406ex;height: 2.587ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -893.3 5041.4 1143.3"> svg>,则方程化为：

这方程对一切 <svg style="vertical-align: -0.464ex;width: 3.409ex;height: 1.464ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 1506.7 647"> svg>成立，且 <svg style="vertical-align: -0.566ex;width: 4.299ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1900 1000"> svg>是连续函数，因此可令 <svg style="vertical-align: -0.566ex;width: 15.892ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 7024.2 1000"> svg>,从而得知

因此

, <svg style="vertical-align: -0.566ex;width: 4.192ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1853 1000"> svg>为密度函数，因此 <svg style="vertical-align: -0.09ex;width: 5.119ex;height: 1.661ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -694 2262.6 734"> svg>,记 <svg style="vertical-align: -0.99ex;width: 8.302ex;height: 2.947ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -864.9 3669.7 1302.4"> svg>,则

有规范化条件 <svg style="vertical-align: -0.902ex;width: 15.701ex;height: 3.04ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -944.8 6940.1 1343.6"> svg>知 <svg style="vertical-align: -1.334ex;width: 10.014ex;height: 3.291ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -864.9 4426.1 1454.5"> svg>，故