Python/python ml normal data distribution

来自菜鸟教程
跳转至:导航、​搜索

<languages />

机器学习-正常数据分发

正常数据分配

在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。

在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。

在概率论中,这种数据分布称为 normal data distribution , 或者 Gaussian data distribution 之后,数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)提出了这种数据分布的公式。

典型的正态数据分布:

  import numpy
import matplotlib.pyplot as plt

x = 
  numpy.random.normal(5.0, 1.0, 100000)

plt.hist(x, 100)
plt.show()

结果:

文件:Img numpy normal.png


注意: 正态分布图也称为 bell curve 因为它具有钟形特征。


直方图解释

我们使用 numpy.random.normal() 具有100000个值的方法绘制100条的直方图。

我们指定平均值为5.0,标准偏差为1.0。

这意味着该值应集中在5.0左右,并且距离平均值的距离应远小于1.0。

从直方图中可以看到,大多数值在4.0到6.0之间,最高值大约是5.0。