FS S.9
Formel 1)
\[ d_i(x)= ln(f(x|i)) + ln(p(i))= -log(\sqrt{2\pi\sigma^2}) -\frac{(x-\mu_i)^2}{2\sigma^2} + ln(p(i)) \]
Formel 2)
\[ d_i(x)= - \frac{1}{2}(x-\mu_i)^T \Sigma^{-1} (x-\mu_i) + ln(p(i)) \]
Formel 3)
\[ d_i(x)= \mu_i^T \Sigma^{-1} x - \frac{1}{2} \mu_i^T \Sigma^{-1} \mu_i + ln(p(i)) \]
Als beispiel nehmen wir \[ \mu_1=20,\ \mu_2=30,\ x= 35.2,\ \sigma^2=200,\ p(1)=0.2,\ p(2)=0.3 \]
# Funktionen nach Formel definieren
formel.1 <- function(mu, sigmasq, x, p) {
d <- -log(sqrt(2 * pi * sigmasq)) - (x - mu)^2/(2 * sigmasq) + log(p)
return(d)
}
formel.2 <- function(mu, sigmasq, x, p) {
d <- (-0.5) * (x - mu)^2/sigmasq + log(p)
return(d)
}
formel.3 <- function(mu, sigmasq, x, p) {
d <- mu/sigmasq * x - 0.5 * (mu^2/sigmasq) + log(p)
return(d)
}
formel.1(20, 200, 35.2, 0.2)
## [1] -5.755
formel.1(30, 200, 35.2, 0.3)
## [1] -4.84
formel.2(20, 200, 35.2, 0.2)
## [1] -2.187
formel.2(30, 200, 35.2, 0.3)
## [1] -1.272
formel.3(20, 200, 35.2, 0.2)
## [1] 0.9106
formel.3(30, 200, 35.2, 0.3)
## [1] 1.826
Drei Formeln liefern zwar unterschiedlichen Ergebnisse, jedoch wenn man die Differenzen, also das, was für die Entscheidungsregel wichtig ist, betrachtet:
formel.1(30, 200, 35.2, 0.3) - formel.1(20, 200, 35.2, 0.2)
## [1] 0.9155
formel.2(30, 200, 35.2, 0.3) - formel.2(20, 200, 35.2, 0.2)
## [1] 0.9155
formel.3(30, 200, 35.2, 0.3) - formel.3(20, 200, 35.2, 0.2)
## [1] 0.9155
Kommt man mit aller drei Formeln auf das selbe Ergebniss für die Entscheidung.