где:
- Xˉ — среднее значение выборки,
- μ — среднее значение популяции,
- σ – это размах популяции, а
- n – это размер выборки.
Типы тестов Z
Имеется три основных типа тестов Z:
- Один Sample Z-тест: Это тест сравнивает среднее значение单个 выборки с известным средним значением популяции. Он используется, когда вы хотите оценить, связано ли среднее значение выборки с значительным отклонением от среднего значения популяции, предполагая, что varianza популяции известна. Например, один-sample z-тест может быть использован, чтобы определить, различается ли средняя высота группы более чем 30 человек от известной национальной средней высоты.
- Двухгрупповой Z-тест : Это тест сравнивает средние значения двух независимых выборки, чтобы определить, есть ли значительное различие между ними. Он используется, когда обе выборки крупными и выравнивается variances. Пример такого теста может быть сравнение средних баллов тестов студентов из двух разных школ, чтобы узнать, есть ли значительное различие в показателях выполнения работы между двумя школами.
- <Пропорционный Z-тест : Это тест сравнивает долю определенного характеристики в выборке с известной доле населения или между двумя долями выборки. Он используется, чтобы оценить, является ли наблюдаемая доля в выборке значительно отличается от ожидаемой на основе доли населения. Например, пропорционный Z-тест может быть использован для сравнения доли избирателей, поддерживающих определенного кандидата, в выборке с долей, наблюдаемой в предыдущих выборах.
Есть дополнительные вариации теста, такие как парный Z-тест, Z-тест для коэффициентов регрессии и Z-тест для различий в средствах.
Параметры Z-теста
Z-тест основывается на определённых предположениях, чтобы обеспечить правильные результаты:
- известный размер ошибки: Z-тест предполагает, что размер ошибки популяции известен. Это ключевая разница с t-тестом, где размер ошибки популяции обычно неизвестен. Знание размера ошибки позволяет использовать распределение Z для оценки значимости статистического теста.
- большой размер выборки: Тест Z-типа предполагает большой размер выборки, обычно более 30. При более крупных выборках распределение выборки среднего значения становится ближе к нормальному, даже если исходные данные не нормально распределены, согласно теореме центрального ограничения.
- нормальное распределение популяции: предполагается, что данные берутся из нормально распределенной популяции. Это предположение менее важно для больших выборок, но все еще важно, когда размер выборки средний.
ключевые различия между t-тестами и Z-тестами
Т-тест и Z-тест используются для сравнения выборки с популяционными параметрами, но они различаются по подходящим предпосылкам, области применения и условиям, в которых они наиболее адекватны. Давайте анализируем и понимаем различия между двумя тестами:
Рассмотрение размера выборки
- Т-тест: Т-тест обычно используется, когда размер выборки маленький, обычно менее 30. Он спроектирован для того, чтобы быть устойчивым, когда размер выборки не соответствует порогу, необходимому для применения теоремы центральной выборки.
- Z-тест: Z-тест используется, когда размер выборки крупенький, обычно более 30. В крупных выборках распределение среднего значения приближается к нормальному, что оправдывает использование Z-теста.
Знание размера популяционной среднеквадратической
- t-тест: t-тест применяется, когда популяционная среднеквадратическая неизвестна. Вместо популяционной среднеквадратической используется выборочная среднеквадратическая для вычисления статистики теста. t-распределение, которое имеет более тяжелые хвосты, чем нормальное распределение, учитывает дополнительную неопределенность, связанную с оценкой популяционной среднеквадратической.
- Z-тест: Z-тест требует, чтобы популяционный разброс был известен. Это ключевая предпосылка, поскольку она позволяет использовать стандартное нормальное распределение для вычисления статистического показателя. когда популяционный разброс известен, Z-тест обеспечивает более точные оценки.
Предпосылки распределения
- t-тест: t-тест предполагает, что данные внутри каждой группы приблизительно нормально распределены. Это особенно важно при работе с малыми размерами выборки. Статистический показатель в t-тесте соответствует распределению t, которое имеет ширее хвостовое отношение, чем нормальное распределение. Это компенсирует дополнительную неопределенность и неустойчивость, возникающие при оценке популяционной标准差 с малой выборки.
- Z-тест: Z-тест предполагает, что данные нормально распределены или что размер выборки достаточно большой, чтобы применить теорему центральной оси. Теорема центральной оси гарантирует, что для больших выборок распределение среднего значения примерно нормально, даже если базовые данные исходно не совершенно нормальны.
Практическое применение и сценарии использования
- t-тест: t-тест широко используется в исследованиях с малыми выборками, таких как пилотные исследования, для которых неизвестна variance населения. Примеры включают сравнение эффективности двух лечений в небольшой группе или оценку изменений в течение времени внутри同一组.
- Z-тест: Z-тест используется в исследованиях с большими выборками или когда работают с хорошо установленными популяциями, где variancia известна. Он часто применяется в качественном контроле, анализе опросов и крупномасштабных экспериментальных исследованиях.
Вот таблица с ключевыми различиями:
Ключевые различия между t-тестом и Z-тестом. Ilustración por la autora.
Заключение
В этом учебнике мы вас ввели в испытание гипотез и два наиболее распространенных теста — t-тесты и z-тесты. Мы также leaned определения каждого теста, различных типах и предпосылках и более глубоко понимаем их ключевые различия. Мы заключили, какой тест лучше использовать в каждой сценарий, тем самым позволяя вам уверенно устанавливать связи между переменными с помощью испытания гипотез.
После укрепления статистических понятий, лежащих в основе тестирования гипотез, в нашем курсе Introduction to Statistics, я советую вам применить这些 понятия с помощью любой из популярных технологий с помощью следующих ресурсов:
- Hypothesis Testing in Python course
- Hypothesis Testing in R course
- Hypothesis Testing (chi-square test) in Excel tutorial
Happy learning!