前言
正态分布分布在概率论与数理统计中处于核心地位。它最初作为二项分布计算的渐近公式由棣莫弗引进,后被拉普拉斯发展成系统的理论,但把它作为一个分布来进行研究则归功于高斯,他在19世纪初的测量误差研究中导出的误差函数,后被高斯命名为正态分布。因此正态分布又称高斯分布。这项研究又是当代统计学中重要思想——最大似然估计的源头。
正态分布的导出
在测量中若为
<svg style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 603 658">
svg>真值,为
<svg style="vertical-align: -0.357ex;width: 1.959ex;height: 1.357ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 866 599.8">
svg>观察值,而误差
<svg style="vertical-align: -0.489ex;width: 6.089ex;height: 1.808ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -583 2691.4 799">
svg>的分布概率密度为
<svg style="vertical-align: -0.566ex;width: 8.987ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 3972.4 1000">
svg>。经验表明
<svg style="vertical-align: -0.566ex;width: 4.192ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1853 1000">
svg>关于
<svg style="vertical-align: -0.186ex;width: 5.442ex;height: 1.692ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -666 2405.6 748">
svg>对称,而且对一切
<svg style="vertical-align: -0.025ex;width: 1.294ex;height: 1.025ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 572 453">
svg>成立。为了推导方便,还假设
<svg style="vertical-align: -0.566ex;width: 4.192ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1853 1000">
svg>具有连续导函数。
如果有独立同分布的观察值
<svg style="vertical-align: -0.439ex;width: 12.818ex;height: 1.439ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 5665.4 636">
svg>,其似然函数为
<svg style="vertical-align: -0.777ex;width: 21.892ex;height: 2.563ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -789.6 9676.3 1132.9">
svg>,它表征了这组观察值落在
<svg style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 603 658">
svg>的附近的可能性大小。高斯的假定是:观察值的平均值
<svg style="vertical-align: -0.798ex;width: 24.112ex;height: 2.755ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -864.9 10657.6 1217.7">
svg>作为未知参数
<svg style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 603 658">
svg>的估值使
<svg style="vertical-align: -0.566ex;width: 4.665ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 2062 1000">
svg>达到最大。
下面利用这个假定导出正态分布 若
<svg style="vertical-align: -0.025ex;width: 1.294ex;height: 1.491ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -648 572 659">
svg>使似然函数
<svg style="vertical-align: -0.566ex;width: 4.665ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 2062 1000">
svg>达到最大,则
记
<svg style="vertical-align: -0.798ex;width: 13.81ex;height: 3.167ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -1047.1 6103.9 1399.9">
svg>,则
<svg style="vertical-align: -1.238ex;width: 11.502ex;height: 3.621ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -1053.5 5083.7 1600.6">
svg>,这时:
当n=2时,方程化为:
由于
<svg style="vertical-align: -0.566ex;width: 19.071ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 8429.6 1000">
svg>,以及
<svg style="vertical-align: -0.439ex;width: 5.42ex;height: 1.439ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 2395.8 636">
svg>的任意性得到
<svg style="vertical-align: -0.566ex;width: 14.804ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 6543.6 1000">
svg>对一切实数
<svg style="vertical-align: -0.025ex;width: 1.294ex;height: 1.025ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 572 453">
svg>成立
当n=3时,方程又可以化为:
由于
<svg style="vertical-align: -0.566ex;width: 31.122ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 13756 1000">
svg>,可知对一切实数
<svg style="vertical-align: -0.464ex;width: 3.409ex;height: 1.464ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 1506.7 647">
svg>成立
这是柯西函数方程,很容易证明其解比为
<svg style="vertical-align: -0.566ex;width: 9.415ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 4161.6 1000">
svg>.
事实上,若记
<svg style="vertical-align: -0.566ex;width: 11.406ex;height: 2.587ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -893.3 5041.4 1143.3">
svg>,则方程化为:
这方程对一切
<svg style="vertical-align: -0.464ex;width: 3.409ex;height: 1.464ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -442 1506.7 647">
svg>成立,且
<svg style="vertical-align: -0.566ex;width: 4.299ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 1900 1000">
svg>是连续函数,因此可令
<svg style="vertical-align: -0.566ex;width: 15.892ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -750 7024.2 1000">
svg>,从而得知
因此
,
<
svg style="vertical-align: -0.566ex;width: 4.192ex;height: 2.262ex;" xmlns="http://www.w3.org/2000/
svg" viewbox="0 -750 1853 1000">
svg>为密度函数,因此
<
svg style="vertical-align: -0.09ex;width: 5.119ex;height: 1.661ex;" xmlns="http://www.w3.org/2000/
svg" viewbox="0 -694 2262.6 734">
svg>,记
<
svg style="vertical-align: -0.99ex;width: 8.302ex;height: 2.947ex;" xmlns="http://www.w3.org/2000/
svg" viewbox="0 -864.9 3669.7 1302.4">
svg>,则
有规范化条件
<svg style="vertical-align: -0.902ex;width: 15.701ex;height: 3.04ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -944.8 6940.1 1343.6">
svg>知
<svg style="vertical-align: -1.334ex;width: 10.014ex;height: 3.291ex;" xmlns="http://www.w3.org/2000/svg" viewbox="0 -864.9 4426.1 1454.5">
svg>,故
这就是著名的误差函数,它正是正态密度函数。
python绘制图像
点我