🚎 ☺️ 🌱 Wilcoxon-Test: ein Sweet Spot für Praktizierende 🧡 😹 👨🏿‍⚖️

In der Praxis der Verarbeitung von Beobachtungsergebnissen ist die Verteilung der Allgemeinbevölkerung unbekannt oder unterscheidet sich (für kontinuierliche Zufallsvariablen) von der Normalverteilung, sodass die Verwendung klassischer statistischer Methoden nicht zumutbar ist und zu Fehlern führen kann. In diesem Fall werden Methoden verwendet, die unabhängig (oder frei) von der Verteilung der Allgemeinbevölkerung sind - nichtparametrische Methoden.

Der Artikel beschreibt unter einheitlichen Gesichtspunkten drei Einzelstichproben-Tests, die in der Praxis häufig vorkommen: den Vorzeichentest, den T-Test und den Wilcoxon-Test mit Vorzeichen, ein nichtparametrisches Verfahren, dessen Leistung mit der Leistung des vergleichbar ist t-Test im Fall einer normalverteilten Probe und überschreitet die Leistung des t-Tests, wenn die Verteilung der Probe im Vergleich zur Normalverteilung "schwerere Schwänze" aufweist.

1. Definieren Sie ein Modell für das Standortmodell wie folgt. Lassen $X_1, X_2, \ ldots, X_n$ - bezeichnen eine Stichprobe gemäß dem folgenden Gesetz erhalten

$X_i = \ theta + e_i,$

wobei angenommen wird, dass zufällige Fehler $e_1, e_2, \ ldots, e_n$ unabhängige und gleichmäßig verteilte Zufallsvariablen mit einer kontinuierlichen Verteilungsdichte sind, die f (t) um Null symmetrisch ist.

2 . Unter der Bedingung der Symmetrie ist jeder Positionsparameter X_i , einschließlich Mittelwert und Median, gleich $\ Theta$ . Betrachten Sie die Hypothese

$H_0: \ theta = 0, ~~~ H_a: \ theta> 0.$

3. Um diese Hypothese zu testen, betrachten Sie drei Tests, die in der Praxis häufig verwendet werden: den Vorzeichentest, den t-Test und den Wilcoxon-Test.

3.1. Der klassische Zeichentest (Zeichentest) basiert auf Statistiken

$S = \ sum_ {i = 1} ^ nsign (X_i),$

wo Vorzeichen (t) = - 1,0,1 für t <0, t = 0, t> 0 jeweils. Lassen

$S ^ + = \ #_ i \ {X_i> 0 \}.$

S = 2S ^ + - n . , X_i ( , , ). H_0 , S ^ + 1/2 . s ^ + – S ^ + p-value $P_ {H_0} (S ^ + \ geq s ^ +) = 1-F_B (s ^ + - 1; n; 0,5)$ , F_B (t; n; p) – (R pbinom

cdf ).

, H_0 () f (t) .

3.2. t- (t-test) .

$T = \ sum_ {i = 1} ^ nsign (X_i) \ cdot | X_i |.$

, f (t) . t- t-

$t = \ frac {\ bar {X}} {s / \ sqrt {n}},$

$\ bar {X}$ , . , t- n-1 . t_0 . p-value t- $P_ {H_0} (t \ geq t_0) = 1-F_T (t_0; n-1)$ , $F_T (t; \ nu)$ – t- c $\ nu$ (R pt

cdf t-). p-value , .

3.3. t- , t- .

(signed-rank Wilcoxon test) , . R | X_i | X_i $| X_1 |, \ ldots, | X_n |$ , .

$W = \ sum_ {i = 1} ^ nsign (X_i) \ cdot R | X_i |.$

t-, , H_0 f (t) .

. , , W ^ + ,

$W ^ + = \ sum_ {X_i> 0} R | X_i | = \ frac {1} {2} W + \ frac {n (n + 1)} {4}.$

p-value $P_ {H_0} (W ^ + \ geq w ^ +) = 1-F_ {W ^ +} (w ^ + - 1; n)$ , $F_ {W ^ +} (x; n)$ – (R psignrank

cdf W ^ + ).

4. . : , t- $\ Theta$ . .

4.1. $\ Theta$ ,

$\ hat {\ theta} = med \ {X_1, X_2, \ ldots, X_n \}.$

$0 <\ alpha <1$ $\ Theta$ $(1- \ alpha) 100 \%$ $\ left (X _ {(c_1 + 1)}, X _ {(n-c_1)} \ right)$ , $X _ {(i)}$ – ich - , c_1 – $\ alpha / 2$ p = 1/2 . e_i . , - $\ alpha$ .

4.2. $\ Theta$ , t- $\ bar {X}$ . $\ bar {X} \ pm t _ {\ alpha / 2, n-1} \ cdot [s / \ sqrt {n}]$ , $t _ {\ alpha / 2, n-1}$ – $\ alpha / 2$ t- n-1 . e_i .

4.3. $\ Theta$ , - (Hodges-Lehmann)

$\ hat {\ theta} _W = med_ {i \ leq j} \ left \ {\ frac {X_i + X_j} {2} \ right \}.$

$A_ {ij} = (X_i + X_j) / 2$ , $i \ leq j$ (Walsh averages) . $A _ {(1)} <\ cdots <A _ {(n (n + 1) / 2)}$ . $(1- \ alpha) 100 \%$ $\ Theta$ $\ left (A _ {(c_2 + 1)}, A _ {(n (n + 1) / 2-c2)} \ right)$ , c_2 – $\ alpha / 2$ signed-rank Wilcoxon . e_i . , W ^ + – $\ left \ {0,1, ..., n (n + 1) / 2 \ right \}$ n ^ 2 . , , , $\ alpha$ .

5. ( ) A B . , ?

, A B. $\ Theta$ . R t- $H_0: \ theta = 0, H_a: \ theta> 0.$

> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B

> wilcox.test(response, alternative = "greater", conf.int = TRUE)

	Wilcoxon signed rank exact test

data:  response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
   1 Inf
sample estimates:
(pseudo)median 
          7.75 

> t.test(response, alternative = "greater", conf.int = TRUE)

	One Sample t-test

data:  response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 1.781971      Inf
sample estimates:
mean of x 
     8.75

wilcox.test()

W ^ + , p-value , - $\ Theta$ $95 \%$ $\ Theta$ . - t.test()

. , 0,05 , , A .

, . , t- t- « » .

Wilcoxon-Test: ein Sweet Spot für Praktizierende

More articles: