概率分布是什么?
概率分布是一种数学分布,它用于描述随机变量的概率分布。随机变量是无法确定的,但可以进行测量的值。概率分布定义了随机变量取值的概率。
概率分布的定义:
- 概率质量函数 (PMF) 定义了随机变量取值的概率。
- 概率密度函数 (PDF) 定义了随机变量在任何给定点取值的概率密度。
- 累积分布函数 (CDF) 定义了随机变量取值小于或等于特定值的概率。
概率分布的类型:
- 离散概率分布:随机变量取值是离散的,例如掷骰子获得的点数。
- 连续概率分布:随机变量取值是连续的,例如身高、体重和时间。
一些常见的概率分布包括:
- 均匀分布:随机变量取值均匀地分布在一定范围中。
- 正态分布:随机变量取值符合正态分布,也称为高斯分布。
- 二项分布:随机变量取值是独立的二项随机变量的总和。
- 泊松分布:随机变量取值是独立的泊松随机变量的总和。
概率分布在机器学习中的应用:
概率分布在机器学习中用于:
- 模型训练:通过使用概率分布来定义模型的输出变量。
- 模型评估:通过使用概率分布来评估模型的性能。
-
决策:通过使用概率分布来做出决策。