贝叶斯分类器(朴素贝叶斯)的实例应用——以品种鉴定为例
什么是贝叶斯分类器?


解释说明
1. 三个概率是谁是谁
-
先验:。不看特征,样本属于类 的“总体比例”。
-
似然:。如果它真是 ,出现这些特征 的概率。
-
后验:。看到了特征 之后,它属于 的概率(我们真正想比较的)。
贝叶斯公式:.
分母 对所有类别都一样,所以**做“谁最大就选谁”**时可以忽略,只比分子大小。
2. “朴素”两个字从哪来
直接算 很难,因为 可能有很多维。朴素贝叶斯假设:
在给定类别的条件下,各特征相互独立
于是
带回去就得到决策规则:
实际实现中,为了防止下溢,一般取对数:
\hat P(x_k=a\mid y_i)=\frac{\text{count}(x_k=a, y_i)+\alpha}{\text{count}(y_i)+\alpha\cdot |\mathcal{A}_k|}
P(\text{AA}\mid y)=p_{ky}^2,\quad P(\text{Aa}\mid y)=2p_{ky}(1-p_{ky}),\quad P(\text{aa}\mid y)=(1-p_{ky})^2.
P(x_k\mid \mathbf{w})=\sum_{b} w_b, P(x_k\mid \text{breed}=b).
P(A\mid ind1)==\frac{P(ind1\mid A),P(A)}
P(ind1\mid A) = P(g1=2|A)×P(g2=0|A)=p1^2×(1-p2)^2 =0.64 × 0.64 = 0.4096
P(A)=1/3
P(ind1\mid B) = P(g1=2|B)×P(g2=0|B)=p1^2×(1-p2)^2 =0.09 × 0.09 = 0.0081
P(ind1\mid C) = P(g1=2|C)×P(g2=0|C)=p1^2×(1-p2)^2 =0.3025 × 0.36 = 0.1089