Mathe Kovarianz / Gemeinsame Verteilung binomialverteilter Zufallsvariablen

Bart

Member
24 Januar 2008
23
2
Hallo.

Gegeben sind zwei binomialverteilte Zufallsvariablen X~Bin(n,p) und Y~Bin(n,q). Dazu suche ich die gemeinsame Verteilung (X,Y), also im Prinzip P(X=x, Y=y).
Zur Erläuterung: das Endziel ist es, cov(X_i,X_j) für die (jeweils binomialverteilten) Komponenten X_i eines multinomialverteilten Zufallsvektors zu bestimmen. Alternativ ginge also auch ein Beweis für cov(X_i,X_j)=-npq oder für E(XY)=n(n-1)pq.
Freue mich über jede Antwort.


Viele Grüße,

Bart


*edit: Alles geklärt... kA wie ich den Beitrag lösche.
 
Zuletzt bearbeitet:
*edit: Alles geklärt... kA wie ich den Beitrag lösche.

Gar nicht, hier wird nicht rumgelöscht. :p

Verrat uns doch lieber allen die Lösung?

Wenn sie unabhängig sind wäre ja die Verbunddichte einfach das Produkt der Randdichten, also
P(X=x[sub]i[/sub], Y=y[sub]i[/sub]) = P(X=x[sub]i[/sub]) * P(Y=y[sub]i[/sub]).

Da Du aber etwas von Kovarianz schreibst, nehme ich an sie sind nicht unabhängig? Wie ist deren Korrelation denn modelliert?
 
Okay, hier die Lösung: ;)


Sei der Zufallsvektor X=(X_1,...,X_r) multinomialverteilt mit Parametern n und p=(p_1,...,p_r).
Dann sind die einzelnen Komponenten X_i binomialverteilt mit Parametern n und p_i. Man kommt nämlich mit Hilfe des multinomischen Lehrsatzes auf P(X_i=k)=(n über k)(p_i)^k(1-p_i)^(n-k).

Damit wir nicht zu viele Indizes bekommen, seien X und Y zwei (verschiedene) dieser Komponenten und deren Parameter p und q. Also X~Bin(n,p) und Y~Bin(n,q).

Zu bestimmen ist die Kovarianz von X,Y:

cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXEY

Die letzte Gleichung lässt sich relativ leicht nachrechnen.
Die Erwartungswerte EX und EY kennen wir: EX=np, EY=nq.

Also brauchen wir E(XY). Dazu stellen wir X bzw. Y als Summe von Bernoulli-Verteilungen dar:

X=sum(X_i), Y=sum(Y_j) mit X_i~Ber(p), Y_i~Ber(q)

Dann ist wegen der Linearität des Erwartungswertes

E(XY) = E( \sum_(i,j) X_iY_j ) = \sum_(i,j) E(X_iY_j)
= \sum_(i != j) E(X_iY_j) + \sum_(i=j) E(X_iY_j)
= n(n-1)pq + 0

Die erste Summe besteht aus n(n-1) Summanden, die alle gleich pq sind.
Die zweite Summe ist 0, da die Zufallsvariablen X und Y (, die ja verschiedene Komponenten eines multinomialverteilten Vektors sind) disjunkte Ereignisse beschreiben.

Damit gilt dann (jetzt wieder mit den alten Indizes)

cov(X_i,Y_j) = n(n-1)pq - n²pq = -npq,

was zu zeigen war.