T-Test vs. Z-Test: Wann man welchen verwendet

Als Datenwissenschaftler müssen Sie oft analysieren, testen und Beziehungen zwischen Variablen in einem Datensatz herstellen, um sinnvolle Schlussfolgerungen zu ziehen. Ein Konzept namens hypothesenprüfung, sowie verschiedene Tests, einschließlich t-Tests und z-Tests, sind einige der häufig verwendeten Werkzeuge in der Analyse, um Beziehungen zwischen Datenpunkten herzustellen.

Dieser Leitfaden wird Ihnen die Differenz zwischen einem t-Test und einem Z-Test mit echten Beispielen beibringen. Ich werde auch zusätzliche Ressourcen für weiteres Lernen bereitstellen.

Eine Kurzfassung: t-Tests vs. Z-Tests

Der Wählen zwischen einem t-Test und einem Z-Test kann mit diesen Leitlinien zusammengefasst werden:

  • Verwenden Sie eine t-Test-Methode:Wenn die Stichprobengröße klein ist (n < 30) und/oder die Populationsvarianz unbekannt ist.
  • Verwenden Sie einen Z-Test:Wenn die Stichprobengröße groß ist (n ≥ 30) und die Populationsvarianz bekannt ist.

In beiden Fällen sollten die Daten normalverteilt sein. Lesen Sie weiter, um sich detailliert über jeder der Tests und ihre Unterschiede zu informieren. Zuerst werden wir mit einer kurzen Einführung in die Hypothesentestung beginnen.

Eine Einführung in die Hypothesentestung

Hypothesentestung ist ein grundlegendes statistisches Verfahren zur Ablesung von Populationsparametern auf der Basis von Stichproben Daten. Es bietet einen strukturierten Ansatz zur Bewertung von Behauptungen oder Annahmen über eine Population anhand empirischer Belege.

Der Kern der Hypothesentestung besteht aus zwei komplementären Aussagen:

  • Die Nullhypothese (H₀) ist eine Aussage von keinem Effekt, Unterschied oder Beziehung. Sie repräsentiert den Status Quo oder den aktuellen Verständnis.
  • Die alternative Hypothese (H₁) ist eine Aussage, die die Nullhypothese widerspricht. Sie stellt die Behauptung oder die neue Erkenntnis dar, die der Forscher beweisen will.

Zum Beispiel wollen Sie feststellen, ob ein neues Lehrmethode die Noten von Schülern verbessert. Sie könnten folgende Hypothesen bilden:

  • Nullhypothese (H₀): Die neue Lehrmethode hat keine Wirkung auf die Noten von Schülern.
  • Alternativehypothese (H₁): Die neue Lehrmethode verbessert die Schülerleistungen in Prüfungen.

Hypothesentestung umfasst das Sammeln von Stichproben, die Berechnung von Teststatistiken und die Bestimmung der Wahrscheinlichkeit, dass solche Ergebnisse beobachtet werden, wenn die Nullhypothese wahr ist. Auf der Basis dieser Wahrscheinlichkeit kann man entscheiden, ob die Nullhypothese zugunsten der Alternative abgelehnt oder nicht abgelehnt werden soll.

Aufgrund der Datentypen und der untersuchten Forschungsfragen stehen für die Hypothesentestung verschiedene statistische Tests zur Verfügung. In diesem Lehrbuch konzentriert sich auf den t-Test und den Z-Test.

Was ist ein t-Test?

Ein t-Test ist ein statistischer Test, der verwendet wird, um zu bestimmen, ob es eine signifikante Differenz zwischen den Mittelwerten von zwei Gruppen gibt oder zwischen einem Stichprobenmittelwert und einem bekannten Wert. Er ist besonders nützlich, wenn man mit kleinen Stichprobengrößen befasst oder die Populationsstandardabweichung unbekannt ist.

Der t-Test-Wert für einen einfachen t-Test wird mit der Formel berechnet:

t-Test-Gleichung. Bild von Autor.

wobei:

  • Xˉ der Stichprobenmittelwert ist
  • μ die Populationsmittelwert ist (oder der Mittelwert der Vergleichsgruppe).
  • s ist die Sample-Standardabweichung und 
  • n ist die Stichprobengröße.

Arten von t-Tests

Es gibt drei Hauptarten von t-Tests. Jeder vergleicht Mittelwerte unter unterschiedlichen Bedingungen:

  • Ein-Sample-t-Test: Dieser Test vergleicht das Mittelwert einer einzelnen Stichprobe mit einem bekannten Wert oder der Populationsmittelwert. Er bestimmt, ob der Sample-Mittelwert signifikant von einem bestimmten Vergleichswert abweicht. Zum Beispiel können wir einen ein-sample t-Test verwenden, um zu prüfen, ob der Durchschnittscore einer kleinen Klasse von der nationalen Durchschnittsnote unterscheidet.
  • Unabhängige Zweigruppentest: Dieser Test vergleicht die Durchschnittswerte von zwei unabhängigen Gruppen, um festzustellen, ob zwischen ihnen eine statistisch signifikante Differenz besteht. Er wird häufig in Experimenten verwendet, wo zwei Gruppen unterschiedliche Behandlungen oder Bedingungen durchlaufen. Zum Beispiel könnten wir einen unabhängigen Zweigruppentest verwenden, um die Noten von Schülern zu vergleichen, die mit zwei unterschiedlichen Lehrmethoden unterrichtet wurden, um zu überprüfen, ob eine Methode effizienter ist.
  • Paartest: Dieser Test vergleicht die Durchschnittswerte innerhalb einer Gruppe bei unterschiedlichen Zeitpunkten oder unter unterschiedlichen Bedingungen. Er beurteilt, ob es eine signifikante Änderung innerhalb der gleichen Gruppe nach einer Intervention oder im Verlauf der Zeit gibt. Ein Beispiel ist die Messung der Leistung von Schülern vor und nach der Implementierung einer neuen Lehrerobjektivierung, um ihren Effekt zu bewerten.

Annahmen des t-Tests

Der t-Test hängt von bestimmten Annahmen ab, um gültige Ergebnisse zu liefern:

  • Normalität der Daten: Der t-Test setzt voraus, dass die Daten in jedem der Gruppen annähernd normalverteilt sind. Dies ist besonders wichtig beim Umgang mit kleinen Stichproben. Wenn die Daten nicht normalverteilt sind, können die t-Test-Ergebnisse unzuverlässig sein.
  • Varianzhomogenität: Für den unabhängigen Zweigruppentest ist anzunehmen, dass die Varianzen der beiden verglichenen Gruppen gleich sind. Diese Annahme stellt sicher, dass der t-Test die Variabilität innerhalb jeder Gruppe korrekt berücksichtigt. Wenn die Varianzen ungleich sind, kann das die Genauigkeit des Tests beeinträchtigen.
  • Unabhängigkeit von Beobachtungen: Die Beobachtungen innerhalb jedes Gruppen sollten unabhängig sein. Dies bedeutet, dass der Wert einer Beobachtung die anderen Beobachtungen nicht beeinflussen oder mit ihnen in Beziehung stehen sollte. Die Verletzung dieser Annahme kann zu falschen Schlussfolgerungen führen.

Es ist wichtig, diese Annahmen vor der Anwendung des t-Tests in jeder Analyse zu überprüfen, um die Validität der Ergebnisse sicherzustellen. Lesen Sie unser T-Tests in R-Leitfaden oder unsere Einführung in Python-t-Tests, um zu lernen, wie t-Tests in R oder Python durchgeführt werden.

Was ist ein Z-Test?

Ein Z-Test ist ein statistisches Testverfahren, das zur Bestimmung von signifikanten Unterschieden zwischen der Stichprobenmittelwert und derPopulationsmittelwert oder den Mittelwerten von zwei Gruppen verwendet wird, wenn die Populationsvarianz bekannt ist und die Stichprobengröße groß ist.

Es wird hauptsächlich dann verwendet, wenn die Stichprobengröße über 30 exceediert, erlaubt die Verwendung der Normalverteilung, um die Verteilung der Teststatistik zu annähern.

Der Z-Test-Statistik für eine einfache Z-Test-Z ist die Formel verwendet:

Z-Test-Gleichung. Bild von Autor.

wobei:

  • Xˉ die Stichprobenmittelwert,
  • μ der Populationsmittelwert,
  • σ ist die Populationsstandardabweichung und
  • n ist die Stichprobengröße.

Arten von Z-Tests

Es gibt drei Hauptarten von Z-Tests:

  • Ein-Stichproben-Z-Test: Dieser Test vergleicht die Mittelwert einer einzelnen Stichprobe mit einem bekannten Populationsmittelwert. Er wird verwendet, wenn man prüfen möchte, ob der Stichprobenmittelwert signifikant vom Populationsmittelwert abweicht, angenommen, dass die Populationsvarianz bekannt ist. Zum Beispiel könnte ein ein-stichproben-z-Test verwendet werden, um zu bestimmen, ob der Durchschnittshöhe einer Gruppe von mehr als 30 Menschen von der bekannten nationalen Durchschnittshöhe unterscheidet.
  • Zweifelters Z-Test: Der Test vergleicht die Mittelwerte von zwei unabhängigen Stichproben, um festzustellen, ob zwischen ihnen ein signifikanter Unterschied besteht. Er wird verwendet, wenn beide Stichproben groß sind und die Populationsvarianzen bekannt sind. Ein Beispiel wäre die Vergleich der Durchschnittspunkte von Schülern aus zwei verschiedenen Schulen, um zu überprüfen, ob es zwischen den beiden Schulen einen signifikanten Unterschied in der Leistung gibt.
  • Prozentsatz-Z-Test: Der Test vergleicht den Prozentsatz einer bestimmten Eigenschaft in einer Stichprobe mit einem bekannten Populationsprozentsatz oder zwischen zwei Stichprobenprozentsätzen. Er wird verwendet, um festzustellen, ob der beobachtete Prozentsatz in der Stichprobe signifikant von dem erwarteten Prozentsatz basierend auf der Populationsprozentsatz unterscheidet. Zum Beispiel könnte ein Prozentsatz-Z-Test verwendet werden, um den Prozentsatz der Wähler, die sich für einen bestimmten Kandidaten aussprechen, in einer Stichprobe mit dem Prozentsatz zu vergleichen, der in vorherigen Wahlen beobachtet wurde.

Es gibt zusätzliche Varianten des Tests, wie den paarweisen Z-Test, den Z-Test für Regressionskoeffizienten und den Z-Test für die Unterschiede in den Mittelwerten.

Annahmen des Z-Tests

Der Z-Test hängt von bestimmten Annahmen ab, um gültige Ergebnisse zu liefern:

  • Bekannte Populationsvarianz: Der Z-Test setzt voraus, dass die Populationsvarianz bekannt ist. Dies ist eine wesentliche Unterscheidung zu dem t-Test, wo die Populationsvarianz typischerweise unbekannt ist. Die bekannte Varianz ermöglicht die Verwendung der Z-Verteilung, um die Signifikanz des Teststatistik zu beurteilen.
  • großer Stichprobenumfang: Der Z-Test setzt voraus, dass der Stichprobenumfang groß ist, typischerweise größer als 30. Bei größeren Stichproben nähert sich die Stichprobenverteilung der Sample-Mittelwerte normal an, auch wenn die ursprünglichen Daten nicht normalverteilt sind, gemäß dem Zentralen Grenzwertsatz.
  • Normalverteilung der Population: Es wird angenommen, dass die Daten aus einer normalverteilten Population gezogen werden. Diese Annahme ist für große Stichproben weniger kritisch, aber immer noch wichtig, wenn der Stichprobenumfang mittelgroß ist.

Wesentliche Unterschiede zwischen t-Tests und Z-Tests

Der t-Test und der Z-Test werden verwendet, um Stichprobenstatistiken mit Populationsparameter zu vergleichen, aber sie unterscheiden sich in ihren zugrunde liegenden Annahmen, Anwendungen und den Bedingungen, unter denen sie am besten geeignet sind.Lassen Sie uns analysieren und verstehen, wie sich die beiden Tests unterscheiden:

Erwägungen bezüglich der Stichprobengröße

  • t-Test: Der t-Test wird typischerweise dann verwendet, wenn die Stichprobengröße klein ist, normalerweise weniger als 30. Er ist dafür konzipiert, robust zu sein, wenn die Stichprobengröße nicht den Schwellenwert erreicht, der für die Anwendung des Zentralen Grenzwertsatzes notwendig ist.
  • Z-Test: Der Z-Test wird verwendet, wenn die Stichprobengröße groß ist, typischerweise größer als 30. In großen Stichproben stimmt die Stichprobenverteilung der Mittelwerte annähernd normal zu, was die Verwendung des Z-Tests rechtfertigt.

Kenntnis der Populationseigenvariance

  • t-Test: Der t-Test wird verwendet, wenn die Populationseigenvariance unbekannt ist. Anstatt der Populationseigenvariance wird die Stichprobenvarianz verwendet, um den Teststatistik zu berechnen. Die t-Verteilung, die im Vergleich zur Normalverteilung längere Flügel hat, kompensiert die zusätzlichen Unsicherheiten, die durch die Schätzung der Populationseigenvariance entstehen.
  • Z-Test: Der Z-Test setzt voraus, dass die Populationsvarianz bekannt ist. Dies ist eine wichtige Voraussetzung, weil sie erlaubt, den Standardnormalverteilung zu verwenden, um den Testkoeffizienten zu berechnen. Wenn die Populationsvarianz bekannt ist, liefert der Z-Test genauere Schätzungen.

Verteilungsannahmen

  • t-Test: Der t-Test setzt voraus, dass die Daten innerhalb jedes Gruppens innerhalb eines Größenvorganges annähernd normalverteilt sind. Dies ist besonders wichtig bei der Behandlung kleiner Stichprobengrößen. Der Testkoeffizient in einem t-Test folgt einer t-Verteilung, die im Vergleich zur Normalverteilung längere Flügel hat. Dies deckt die zusätzliche Variabilität und Unsicherheit ab, die auftreten, wenn die Populationsstandardabweichung aus einer kleinen Stichprobe berechnet wird.
  • Z-Test: Der Z-Test setzt voraus, dass die Daten normalverteilt sind oder dass die Stichprobengröße ausreichend groß ist, um das Zentrale Limitensatz anwenden zu können. Der Zentrale Limitensatz stellt sicher, dass, für große Stichproben, die Verteilung der Sample-Mittelwerte annähernd normal ist, selbst wenn die zugrunde liegenden Daten nicht perfekt normal verteilt sind.

Praktische Anwendungen und Anwendungsfälle

  • t-Test: Der t-Test wird häufig in kleinen Stichprobenuntersuchungen verwendet, wie z.B. in Pilotstudien, wo die Populationsvarianz unbekannt ist. Beispiele reichen von der Vergleichbarkeit der Wirksamkeit zweier Behandlungen in einer kleinen Gruppe bis zur Bewertung von Änderungen innerhalb derselben Gruppe über die Zeit.
  • Z-Test: Der Z-Test wird in Studien mit großen Stichproben oder bei der Behandlung gut erforschter Populationen verwendet, wobei die Varianz bekannt ist. Er wird oft in Qualitätskontrolle, Erhebungsanalysen und großflächigen Experimenten angewendet.

Hier ist eine Tabelle mit den wichtigsten Unterschieden:

Wichtige Unterschiede zwischen t-Test und Z-Test. Bild von Autor.

Fazit

Dieser Leitfaden hat Ihnen den Hypothesentesting und zwei häufig verwendeten Tests – t-Tests und Z-Tests – gezeigt. Wir haben auch die Definitionen jedes Tests, verschiedene Arten und Annahmen gelernt und verstanden ihre wichtigsten Unterschiede. Wir haben festgestellt, in welcher Situation welcher Test am besten verwendet werden sollte, was Ihnen die Lage von Variablen mittels Hypothesentesting mit Confidence erlaubt.

Nachdem du die statistischen Konzepte hinter Hypothesentesting mit unserem Einführung in die Statistik-Kurs festgelegt hast, würde ich dich ermutigen, diese Konzepte mit einer der beliebten Technologien durchzusetzen, indem du auf die folgenden Ressourcen zurückgreifst:

Viel Spaß beim Lernen!

Source:
https://www.datacamp.com/tutorial/t-test-vs-z-test