加入收藏 | 设为首页 | 交流中心 | 我要投稿 | RSS
您当前的位置:首页 > 技术中心 > 高谈阔论

机器学习领域需要掌握的12种概率分布(附Python代码实现)

时间:2023-10-24 22:08:16  来源:  作者:

 机器学习领域需要掌握的12种概率分布(附Python代码实现)RBZ快充网络

1. 均匀分布(连续型)RBZ快充网络

均匀分布是指闭区间 [a, b] 内的随机变量,且每一个变量出现的概率是相同的。RBZ快充网络

 RBZ快充网络

RBZ快充网络

 RBZ快充网络

2. 伯努利分布(离散型)RBZ快充网络

伯努利分布并不考虑先验概率 P(X),它是单个二值随机变量的分布。它由单个参数φ∈ [0, 1] 控制,φ 给出了随机变量等于 1 的概率。我们使用二元交叉熵函数实现二元分类,它的形式与对伯努利分布取负对数是一致的。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

3. 二项分布(离散型)RBZ快充网络

 RBZ快充网络

二项分布是由伯努利提出的概念,指的是重复 n 次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

4.Multi-Bernoulli 分布(离散型)RBZ快充网络

 RBZ快充网络

Multi-Bernoulli 分布又称为范畴分布(Categorical distribution),它的类别超过 2,交叉熵的形式与该分布的负对数形式是一致的。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

5. 多项式分布(离散型)RBZ快充网络

 RBZ快充网络

范畴分布是多项式分布(Multinomial distribution)的一个特例,它与范畴分布的关系就像伯努利分布与二项分布之间的关系。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

6.Beta 分布(连续型)RBZ快充网络

 RBZ快充网络

贝塔分布(Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,它指一组定义在 (0,1) 区间的连续概率分布。均匀分布是 Beta 分布的一个特例,即在 alpha=1、 beta=1 的分布。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

7. 狄利克雷分布(连续型)RBZ快充网络

 RBZ快充网络

狄利克雷分布(Dirichlet distribution)是一类在实数域以正单纯形(standard simplex)为支撑集(support)的高维连续概率分布,是 Beta 分布在高维情形的推广。在贝叶斯推断中,狄利克雷分布作为多项式分布的共轭先验得到应用,在机器学习中被用于构建狄利克雷混合模型。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

8.Gamma 分布(连续型)RBZ快充网络

 RBZ快充网络

Gamma 分布是统计学中的常见连续型分布,指数分布、卡方分布和 Erlang 分布都是它的特例。如果 Gamma(a,1) / Gamma(a,1) + Gamma(b,1),那么 Gamma 分布就等价于 Beta(a, b) 分布。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

9. 指数分布(连续型)RBZ快充网络

 RBZ快充网络

指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进入机场的时间间隔、打进客服中心电话的时间间隔等等。当 alpha 等于 1 时,指数分布就是 Gamma 分布的特例。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

10. 高斯分布(连续型)RBZ快充网络

 RBZ快充网络

高斯分布或正态分布是最为重要的分布之一,它广泛应用于整个机器学习的模型中。例如,我们的权重用高斯分布初始化、我们的隐藏向量用高斯分布进行归一化等等。RBZ快充网络

 RBZ快充网络

RBZ快充网络
RBZ快充网络

 RBZ快充网络

 RBZ快充网络

当正态分布的均值为 0、方差为 1 的时候,它就是标准正态分布,这也是我们最常用的分布。RBZ快充网络

 RBZ快充网络

11. 卡方分布(连续型)RBZ快充网络

 RBZ快充网络

简单而言,卡方分布(Chi-squared)可以理解为,k 个独立的标准正态分布变量的平方和服从自由度为 k 的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。RBZ快充网络

 RBZ快充网络

RBZ快充网络

 RBZ快充网络

12. 学生 t-分布RBZ快充网络

学生 t-分布(Student t-distribution)用于根据小样本来估计呈正态分布且变异数未知的总体,其平均值是多少。t 分布也是对称的倒钟型分布,就如同正态分布一样,但它的长尾占比更多,这意味着 t 分布更容易产生远离均值的样本。RBZ快充网络

 RBZ快充网络

RBZ快充网络

 RBZ快充网络

代码实现可以打开他的github下载RBZ快充网络

 RBZ快充网络

RBZ快充网络

 RBZ快充网络

 RBZ快充网络

来顶一下
返回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
相关文章
    无相关信息
栏目更新
栏目热门