Python/python ml normal data distribution
来自菜鸟教程
<languages />
机器学习-正常数据分发
正常数据分配
在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。
在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。
在概率论中,这种数据分布称为 normal data distribution , 或者 Gaussian data distribution 之后,数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)提出了这种数据分布的公式。
例
典型的正态数据分布:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
结果:
注意: 正态分布图也称为 bell curve 因为它具有钟形特征。
直方图解释
我们使用
numpy.random.normal()
具有100000个值的方法绘制100条的直方图。
我们指定平均值为5.0,标准偏差为1.0。
这意味着该值应集中在5.0左右,并且距离平均值的距离应远小于1.0。
从直方图中可以看到,大多数值在4.0到6.0之间,最高值大约是5.0。