Wilcoxon-Test: ein Sweet Spot für Praktizierende

In der Praxis der Verarbeitung von Beobachtungsergebnissen ist die Verteilung der Allgemeinbevölkerung unbekannt oder unterscheidet sich (für kontinuierliche Zufallsvariablen) von der Normalverteilung, sodass die Verwendung klassischer statistischer Methoden nicht zumutbar ist und zu Fehlern führen kann. In diesem Fall werden Methoden verwendet, die unabhängig (oder frei) von der Verteilung der Allgemeinbevölkerung sind - nichtparametrische Methoden.





Der Artikel beschreibt unter einheitlichen Gesichtspunkten drei Einzelstichproben-Tests, die in der Praxis häufig vorkommen: den Vorzeichentest, den T-Test und den Wilcoxon-Test mit Vorzeichen, ein nichtparametrisches Verfahren, dessen Leistung mit der Leistung des vergleichbar ist t-Test im Fall einer normalverteilten Probe und überschreitet die Leistung des t-Tests, wenn die Verteilung der Probe im Vergleich zur Normalverteilung "schwerere Schwänze" aufweist.





1. Definieren Sie ein Modell für das Standortmodell wie folgt. Lassen X_1, X_2, \ ldots, X_n- bezeichnen eine Stichprobe gemäß dem folgenden Gesetz erhalten





X_i = \ theta + e_i,

wobei angenommen wird, dass zufällige Fehler e_1, e_2, \ ldots, e_nunabhängige und gleichmäßig verteilte Zufallsvariablen mit einer kontinuierlichen Verteilungsdichte sind, die f (t)um Null symmetrisch ist.





2 . Unter der Bedingung der Symmetrie ist jeder Positionsparameter X_i, einschließlich Mittelwert und Median, gleich \ Theta. Betrachten Sie die Hypothese





H_0: \ theta = 0, ~~~ H_a: \ theta> 0.

3. Um diese Hypothese zu testen, betrachten Sie drei Tests, die in der Praxis häufig verwendet werden: den Vorzeichentest, den t-Test und den Wilcoxon-Test.





3.1. Der klassische Zeichentest (Zeichentest) basiert auf Statistiken





S = \ sum_ {i = 1} ^ nsign (X_i),

wo Vorzeichen (t) = - 1,0,1für t <0, t = 0, t> 0jeweils. Lassen





S ^ + = \ #_ i \ {X_i> 0 \}.

S = 2S ^ + - n. , X_i ( , , n). H_0, S ^ + n 1/2. s ^ +S ^ + p-value P_ {H_0} (S ^ + \ geq s ^ +) = 1-F_B (s ^ + - 1; n; 0,5), F_B (t; n; p)n p(R pbinom



cdf ).





, S. H_0 () f (t).





3.2. t- (t-test) .





T = \ sum_ {i = 1} ^ nsign (X_i) \ cdot | X_i |.

, T. f (t). t- t-





t = \ frac {\ bar {X}} {s / \ sqrt {n}},

\ bar {X} s, . , t t- n-1 . t_0 t. p-value t- P_ {H_0} (t \ geq t_0) = 1-F_T (t_0; n-1), F_T (t; \ nu)– t- c \ nu (R pt



cdf t-). p-value , .





3.3. t- , t- .





(signed-rank Wilcoxon test) , . R | X_i | X_i | X_1 |, \ ldots, | X_n |, .





W = \ sum_ {i = 1} ^ nsign (X_i) \ cdot R | X_i |.

t-, W., S. H_0 f (t).





W. . , W., W ^ +,





W ^ + = \ sum_ {X_i> 0} R | X_i | = \ frac {1} {2} W + \ frac {n (n + 1)} {4}.

p-value P_ {H_0} (W ^ + \ geq w ^ +) = 1-F_ {W ^ +} (w ^ + - 1; n), F_ {W ^ +} (x; n)n(R psignrank



cdf W ^ +).





4. . : , t- \ Theta. .





4.1. \ Theta,





\ hat {\ theta} = med \ {X_1, X_2, \ ldots, X_n \}.

0 <\ alpha <1 \ Theta (1- \ alpha) 100 \% \ left (X _ {(c_1 + 1)}, X _ {(n-c_1)} \ right), X _ {(i)}ich- , c_1\ alpha / 2 n p = 1/2. e_i. , - n \ alpha.





4.2. \ Theta, t- \ bar {X}. \ bar {X} \ pm t _ {\ alpha / 2, n-1} \ cdot [s / \ sqrt {n}], t _ {\ alpha / 2, n-1}\ alpha / 2 t- n-1 . e_i.





4.3. \ Theta, - (Hodges-Lehmann)





\ hat {\ theta} _W = med_ {i \ leq j} \ left \ {\ frac {X_i + X_j} {2} \ right \}.

A_ {ij} = (X_i + X_j) / 2, i \ leq j (Walsh averages) . A _ {(1)} <\ cdots <A _ {(n (n + 1) / 2)} . (1- \ alpha) 100 \% \ Theta \ left (A _ {(c_2 + 1)}, A _ {(n (n + 1) / 2-c2)} \ right), c_2\ alpha / 2 signed-rank Wilcoxon . e_i . , W ^ +\ left \ {0,1, ..., n (n + 1) / 2 \ right \} n ^ 2. , , , \ alpha .





5. ( ) A B . , ?





, A B. \ Theta . R t- H_0: \ theta = 0, H_a: \ theta> 0.





> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B

> wilcox.test(response, alternative = "greater", conf.int = TRUE)

	Wilcoxon signed rank exact test

data:  response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
   1 Inf
sample estimates:
(pseudo)median 
          7.75 

> t.test(response, alternative = "greater", conf.int = TRUE)

	One Sample t-test

data:  response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 1.781971      Inf
sample estimates:
mean of x 
     8.75 
      
      



wilcox.test()



W ^ +, p-value , - \ Theta 95 \% \ Theta. - t.test()



. , 0,05, , A .





, . , t- t- « » .








All Articles