In der Praxis der Verarbeitung von Beobachtungsergebnissen ist die Verteilung der Allgemeinbevölkerung unbekannt oder unterscheidet sich (für kontinuierliche Zufallsvariablen) von der Normalverteilung, sodass die Verwendung klassischer statistischer Methoden nicht zumutbar ist und zu Fehlern führen kann. In diesem Fall werden Methoden verwendet, die unabhängig (oder frei) von der Verteilung der Allgemeinbevölkerung sind - nichtparametrische Methoden.
Der Artikel beschreibt unter einheitlichen Gesichtspunkten drei Einzelstichproben-Tests, die in der Praxis häufig vorkommen: den Vorzeichentest, den T-Test und den Wilcoxon-Test mit Vorzeichen, ein nichtparametrisches Verfahren, dessen Leistung mit der Leistung des vergleichbar ist t-Test im Fall einer normalverteilten Probe und überschreitet die Leistung des t-Tests, wenn die Verteilung der Probe im Vergleich zur Normalverteilung "schwerere Schwänze" aufweist.
1. Definieren Sie ein Modell für das Standortmodell wie folgt. Lassen - bezeichnen eine Stichprobe gemäß dem folgenden Gesetz erhalten
wobei angenommen wird, dass zufällige Fehler unabhängige und gleichmäßig verteilte Zufallsvariablen mit einer kontinuierlichen Verteilungsdichte sind, die
um Null symmetrisch ist.
2 . Unter der Bedingung der Symmetrie ist jeder Positionsparameter , einschließlich Mittelwert und Median, gleich
. Betrachten Sie die Hypothese
3. Um diese Hypothese zu testen, betrachten Sie drei Tests, die in der Praxis häufig verwendet werden: den Vorzeichentest, den t-Test und den Wilcoxon-Test.
3.1. Der klassische Zeichentest (Zeichentest) basiert auf Statistiken
wo für
jeweils. Lassen
. ,
( , ,
).
,
.
–
p-value
,
–
(R
pbinom
cdf ).
,
()
.
3.2. t- (t-test) .
,
. t- t-
, . ,
t-
.
. p-value t-
,
– t- c
(R
pt
cdf t-). p-value , .
3.3. t- , t- .
(signed-rank Wilcoxon test) , .
, .
t-, ,
.
. ,
,
,
p-value ,
–
(R
psignrank
cdf ).
4. . : , t- . .
4.1. ,
,
–
- ,
–
.
. , -
.
4.2. , t-
.
,
–
t-
.
.
4.3. , - (Hodges-Lehmann)
,
(Walsh averages) .
.
,
–
signed-rank Wilcoxon .
. ,
–
. , , ,
.
5. ( ) A B . , ?
, A B. . R t-
> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B
> wilcox.test(response, alternative = "greater", conf.int = TRUE)
Wilcoxon signed rank exact test
data: response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
1 Inf
sample estimates:
(pseudo)median
7.75
> t.test(response, alternative = "greater", conf.int = TRUE)
One Sample t-test
data: response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
1.781971 Inf
sample estimates:
mean of x
8.75
wilcox.test()
, p-value , -
. -
t.test()
. , , , A .
, . , t- t- « » .