说明,【】为个人批注,其余为原文翻译。
原文🔗:https://medium.com/swlh/probability-vs-likelihood-cdac534bf523
你可能经常看到这两个词,但你可能会分不清,实际上识别并理解它们还是比较困难的。本文就是为了帮助你更好的理解可能性和概率的区别。
Important note!
敲重点!
最大的问题,是学习和理解的方法有问题。很多人就只匆匆忙忙的去实现数据科学的算法,而不去理解某个特定的算法内部是如何工作的。
这个学习的方法是完全错的,甚至很差。但遗憾的是很多人就这样错误的学的。【很遗憾我被说中了。。调包多于理解。】
很多人脑海中有一个虚假的印象(hype),就是大多数的地方、情景或情境深度学习是有用的,在一些情况下,机器学习有用的,最后就是在很少的情况下,统计学才有用(Statistics)。这个 hype/mindset 是完全错误的,现实实际上是相反的。
现实中,深度学习是机器学习的子集,机器学习又依赖于统计学。现在,如果你有点逻辑,那你肯定就指的了,不理解统计学,你不会理解机器学习的核心的。
这就是为什么 只有当你明白了统计学,才会看清算法的真面目。这个主题是统计学的问题,可能是一些对数据科学不感兴趣的人提出的,可能只是对很小的部分感兴趣,但是真正的真相是,这小部分在数据科学这块还非常的基础,是基石(building blocks)一般的存在。你不对数据科学感兴趣也没关系,但即便是你,也可以理解一些数据科学领域的一些逻辑或基石(building blocks)。
理解这个非常重要。开始吧!
Difference between the Probability & Likelihood!
区别
概率:
给定样本分布的数据中,发现某件事的机会。
似然性/可能性 (likelihood):
在给定数据的一些特征和情况中,发现数据的最佳分布。
Example of Probability!
概率的例子!
思考一个数据集有某个国家所有人的身高。比方说身高均值是 170,方差是 3.5。
当概率被计算的时候,那么这些数据特征,均值和方差是不会改变的,是一个常量。
那么我们可以计算出来说,身高大于 170 cm 的概率就可以这样表示:

u 是均值,sigma 就是方差。在计算概率的时候,特征值可能会变。【特征值在这里就是 170cm。】但是数据分布的特征,这批数据的均值和方差是不会变的。
如果在同一个数据集,概率大于 190 cm ,那么上面的表达式也就只有 170 cm 变成 190 cm 的差别而已。
Example of Likelihood!
可能性的例子!
【似然性,有时候也叫似然分布】
计算似然性包括计算数据的最佳分布、最佳特征,在给定一个特征值或情况的时候(given a particular feature value or situation)。
比如上面的例子,如果要计算他们身高大于 170cm 的可能性:
在计算可能性的时候,这个条件概率和概率的计算刚好反过来了。
这时,数据集的特征可能会改变,均值和方差就会开始改变,来取得 身高大于 170 cm 最大的可能性。
简单的翻译:增加特定情境发生的可能,通过改变数据集的分布特征。
Fine & Crisp Probability VS Likelihood Use-Case! 😉
概率是用来发现某个 situation(情境、事件) 发生的 chance(机会、可能)。
似然性仅仅指一般的扩大某个 situation 发生的 chances。