加入收藏 | 设为首页 | 会员中心 | 我要投稿 我爱制作网_潮州站长网 (http://www.0768zz.com/)- 物联安全、建站、操作系统、云计算、数据迁移!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

科学家都应该知道这5个概率分布

发布时间:2021-04-28 15:20:27 所属栏目:外闻 来源:互联网
导读:识成为统计学家构建工具箱的基

识成为统计学家构建工具箱的基础。如果你正在思考如何成为一名数据科学家,那么这是***步。

废话少说,让我们开门见山吧!

什么是概率分布?

在概率论和统计学中,随机变量是一个可以随机取不同值的变量,比如“我看到的下一个人的身高”或“我下一个拉面碗里厨师头发的数量”。

给定一个随机变量X,我们想描述它取哪个值。更重要的是,我们想要描述变量取某个值x的可能性有多大。

例如,如果X是“我女朋友养了多少只猫”,那么这个数字可能是1,甚至可以是5或10。

当然,一个人不可能拥有负数的猫。

因此我们希望用一种明确的数学方法来表示变量X可以取的每一个可能的值,以及事件(X= x)的可能性。

为了做到这一点,我们定义了一个函数P,使得P(X = x)是变量X值为x的概率。

我们也可以用P(X < x)或者P(X > x)来代替离散值。这非常重要。

P是变量的密度函数,它表征变量的分布。

随着时间的推移,科学家们已经意识到,自然界和现实生活中的许多事物往往表现相似,变量共享一个分布,或具有相同的密度函数(或类似的函数)。

要使P成为一个实际的密度函数,需要一些条件。

  • P(X =x) <= 1 对于任意值X, P(X =x)必须小于等于1
  • P(X =x) >= 0 对于任意值X, P(X =x)必须大于等于0
  • 对于任意值X,P(X =x) 所有值的和为1(X取任意值的概率,加起来等于1)

离散与连续随机变量分布

随机变量可以分为两组:离散随机变量和连续随机变量。

离散随机变量

离散变量有一组离散的可能值,每个值的概率都是非零的。

例如,当我们抛硬币时,如果我们说

  • X = " 1如果硬币是正面,0如果是反面"

P(X = 1) = P(X = 0) = 0.5

但是请注意,离散集不一定是有限的。取任何非负的正整数。

注意所有可能值的概率之和仍然是1。

连续随机变量

如果说

  • X =“从我头上随机拔下的一根头发的长度,以毫米为单位(没有舍入)”

X可以取哪些值?我们知道负数在这里没有任何意义。

但是,如果你说的是1毫米,而不是1.1853759……或者类似的东西,我要么怀疑你的测量技能,要么怀疑你的测量报告错误。

连续随机变量可以取给定(连续)区间内的任何值。

如果X为连续性随机变量,则用f(x)表示X的概率分布密度函数。

用P(a < X < b)表示X位于值a和b之间的概率。

为了得到X取任一指定实数a的概率,需要把X的密度函数从a积分到b。

现在您已经知道了概率分布是什么,让我们来学习一些最常见的分布!

一、伯努利概率分布

伯努利分布的随机变量是最简单的随机变量之一。

它表示一个二进制事件:“这件事发生”vs“这件事没有发生”,并以值p作为唯一的参数,表示事件发生的概率。

伯努利分布的随机变量B的密度函数为:

  • P(B = 1) = p, P(B =0)= (1- p)

这里B=1表示事件发生了,B=0表示事件没有发生。

注意这两个概率加起来是1,因此不可能有其他值。

二、均匀概率分布

均匀随机变量有两种:离散随机变量和连续随机变量。

离散均匀分布将取(有限的)一组值S,并为每个值分配1/n的概率,其中n是S中的元素数量。

这样,如果变量Y在{1,2,3}中是均匀的,那么每一个值出现的概率都是33%。

骰子就是一个非常典型的离散均匀随机变量,典型骰子有一组值{1,2,3,4,5,6},元素数量为6,每个值出现的概率是1/6。

连续均匀分布只取两个值a和b作为参数,并在它们之间的区间内为每个值分配相同的密度。

这意味着Y在一个区间(从c到d)取值的概率与它的大小相对整个区间(从b到a)的大小成正比。

因此,如果Y在a和b之间均匀分布,则

(编辑:我爱制作网_潮州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读