가설 확인 이라는 개념과, t-test, z-test 등의 다양한 시험, 이들이 분석에서 데이터 지점들之间的 관계를 설정하기 위해 일반적으로 사용되는 도구들이니가.
이 튜토리얼은 실제 예제를 사용하여 t-test와 Z-test의 차이를 가르쳐 줍니다. urther 공부를 위한 extra 자료도 제공하겠습니다.
t-test와 Z-test를 사용할지 결정하는 가이드 라인은 다음과 같습니다:
- t-检验 사용:샘플 사이즈가 작고 (n < 30) 또는 总体方差가 알 수 없다 때.
- Z-检验 사용:샘플 사이즈가 large (n ≥ 30) 且 总体方差가 알 수 있다 때.
두 경우 모두 데이터가 정규 분포를 보이る 것을 期待하며, 각 시험과 그들의 차이를 자세히 배울 수 있는 내용을 계속 읽어 보세요. まず, hyothesis testing에 대한 빠른 소개를 시작하겠습니다.
hyothesis testing 소개
가설 검정은 샘플 데이터를 기반으로 모집단의 파라미터를 추론하기 위한 기본적인 통계 방법입니다. 이는 경험적 증거를 사용하여 모집단에 대한 주장이나 가정을 평가하는 구조화된 접근 방식을 제공합니다.
가설 검정의 핵심은 두 가지 상호 보완적인 진술입니다:
- 귀무가설 (H₀)은 효과, 차이 또는 관계가 없다는 진술입니다. 이는 현상 유지 또는 현재 이해를 나타냅니다.
- 대안적 仮 hyptheses (H₁)는 虚无的 仮 hypthesis와 충돌하는 陳述입니다. 研究者가 믿고 싶은 claime나 새로운 이해를 나타냅니다.
예를 들어, 새로운 교육 方法이 학생의 시험 성적에 영향을 미치는지 deterine하고자 하면, 다음과 같은 hyptheses를 形성할 수 있습니다.
- 虚无的 仮 hypthesis (H₀): 새로운 교육 方法이 학생의 시험 성적에 영향을 미치지 않습니다.
- 대체 가정 (H₁): 새로운 교육 方法이 학생의 시험 성적을 改善시킵니다.
가정 検証은 표본 数据分析를 통해 檢定統計量을 구하고, null 가정이 真際이면 那样的 결과를 관찰하는 것의 확률을 deterine한다. 이러한 확률에 따라, null 가정을 대신하여 대체 가정을 reject하는 것이 적절한지 여부에 대해 결정할 수 있다.
표본 数据分析 유형과 실험 문제가 다르면, 가정 検証을 위한 여러 가지 統計 検定이 있다. 이 튜토리얼에서는 t-test와 Z-test에 초점을 맞추겠습니다.
t-test는 무엇입니까?
t-test는 두 그룹의 평균 사이나 표본 평균과 알 수 있는 값 사이에 유의미한 차이가 있는지 여부를 결정하기 위한 통계 시험입니다. 특히, 작은 표본 사이즈를 다룰 때나 总体 표준 편차가 알 수 없을 때 유용합니다.
个案 t-test의 통계량은 다음 公式을 사용하여 계산합니다:
t-test 公式. 저자의 이미지.
그 Where 구문은 다음과 같습니다:
- Xˉ은 표본 평균
- μ은 总体 평균(또는 比較 그룹의 평균)
- 표본 표준편차로,
- 표본 크기 n이다.
t-시험의 유형
t-시험은 세 가지 주요 유형이 있다. 각각 다른 조건에 따라 평균을 비교한다:
- 단일 표본 t-시험: 이 시험은 단일 표본의 평균을 알려진 값이나 总体 평균과 비교하는 것을 목적으로 있다. 표본 평균이 특정 기준치에 유의 정도로 차이가 나는지 여부를 결정한다. 예를 들어, 소형 班级의 평균 시험 성적이 전국 평균과 다르다는 것을 평가하기 위해 단일 표본 t-시험을 사용할 수 있다.
- 독립 두 样本 t-test: 이 시험은 두 독립 그룹의 평균을 比较하여 그들 사이에 統計적으로 중요한 차이가 있는지 determin하는 것입니다. 두 그룹이 다른 처리 또는 조건을 겪는 실험에서 자주 사용되며, 예를 들어 두 가지 다른 교육 방법을 적용한 것이 더 효과적인지 여부를 확인하기 위해 학생들의 시험 점수를 比较하는 것이 가능합니다.
- 쌍 t-test: 이 시험은 같은 그룹의 평균을 다른 시기에 또는 다른 조건下调查하여 중요한 변화가 있는지 평가합니다. 조치 또는 시간 지나고 같은 그룹 내에서 중요한 변화가 있는지 여부를 평가하는 것입니다. 예를 들어 새로운 교육 전략을 적용한 다음 그 영향을 评定하기 위해 학생의 성적을 测评하는 것이 가능합니다.
t-test의 仮론
t-검정은 유효한 결과를 제공하기 위해 ceratin 가정을 依存한다.
- 데이터의 정규성: t-검정은 각 그룹의 데이터가 대략 정규 분포로 구성되어 있다고 가정한다. 이는 작은 サンプル 사이즈를 处理하는 것과 특히 중요하다. 데이터가 정규 분포가 아니면, t-검정 결과가 신뢰할 수 있지 않을 수 있다.
- 方差의 同质性: 독립 두 그룹 사이의 t-검정을 行う 때, 比較되는 두 그룹의 方差가 같다고 가정한다. 이 가정은 각 그룹 내에서 变异性를 正確하게 ACCOUNTING FOR하는 것을 担保한다. 方差가 같지 않으면, 이 검정의 정확성에 영향을 줄 수 있다.
- 관찰의 독립性: 각 그룹 내의 관찰 값은 독립적이어야 합니다. 这意味着一个观测值不应影响或与另一个观测值相关联。 이 가정을 위반하면 잘못된 結論을 도출할 수 있습니다.
이러한 가정을 적절히 확인하는 것은 결과의 正当性를 보장하기 위해 어느 분석에서も t-test를 적용하기 전에 중요합니다.我们的R 中的 T-test 教程 或者我们的 Python 中的 T-test 简介 以学习如何在 R 或 Python 中进行 t-test。
Z-test 是什么呢?
Z-test는 总体方差이 알려져 있고 樣本 크기가 적당히 large일 때, 표본 평균과 总体평균, 또는 두 그룹의 평균 사이에 유의 차이가 있는지 여부를 결정하기 위한 통계 시험입니다.
시험 サンプル サイズ가 30을 초과하는 경우 주로 사용되며, 정규 분포를 사용하여 시험 통계 분포를 근사하는 것이 가능해집니다.
하나의 サンプル 대상의 하나 サンプル Z 시험 통계는 다음 수식을 사용하여 계산됩니다:
Z 시험 이차식. 著者 이미지.
어디에서:
- Xˉ은 표본 평균이며,
- μ은 总体 평균입니다.
- σ는 모집단의 표준 편차이고,
- n은 표본 크기입니다.
Z-검정의 유형
세 가지 주요 Z-검정 유형이 있습니다:
- 단일 표본 Z-검정: 이 검정은 단일 표본의 평균을 알려진 모집단 평균과 비교합니다. 모집단 분산이 알려져 있다고 가정할 때, 표본 평균이 모집단 평균과 유의하게 다른지 평가하고자 할 때 사용됩니다. 예를 들어, 단일 표본 z-검정은 30명 이상의 그룹의 평균 키가 알려진 국가 평균 키와 다른지 여부를 결정하는 데 사용될 수 있습니다.
- 두 샘플 Z-test: 이 시험은 두 독립적 샘플의 평균을 比较하여 그들之间의 중요한 차이가 있는지 여부를 결정합니다. 두 샘플이 large가 되고 인구 方差이 known인 경우에 사용되며, 이러한 예는 두 다른 학교의 학생들의 평균 시험 score를 比较하여 두 학교之间의 성과가 중요한 차이가 있는지 여부를 보기 위한 것입니다.
- 비율 Z-test: 이 시험은 샘플에서 특정 특성의 비율을 시험 샘플 비율과 知られる 인구 비율 사이, 또는 두 시험 샘플 비율 사이에 比较하여, 시험 샘플에서 観察한 비율이 인구 비율에 따라 期待され는 것과 유의하게 다르지는 않는지 여부를 评价합니다. 예를 들어, 비율 Z-test은 시험 샘플에서 특정 候補에 대해 인阀하는 elector의 비율과 이전 選挙에서 관찰된 비율을 比较하는 것입니다.
시험에 대한 extra 변형이 존재하며, 比如 Z-test for regression coefficients, 조상 Z-test, 以及 平均差异 Z-test이 있습니다.
Z-test의 仮가
Z-test는 妥当한 결과를 제시하기 위해 특정 仮가에 依存합니다:
- known Population Variance: Z-test는 总体方差가 알 수 있다는 仮가를 사용합니다. 이것은 t-test과 달리 总体方差가 通常是 unknown 인 것을 나타냅니다. 알 수 있는 方差를 사용하여 z-distribution을 사용하여 시험 통계의 중요성을 평가할 수 있습니다.
- 대량 標本: Z-시험은 대량 標本을 仮定하며, 일반적으로 30이상이어야 합니다. 更大的 標本 サンプル 사이즈로, 標本 평균의 サンプリング 분포가 원리적인 통계 이론에 따라 정규 분포로 趋近하며, 원본 데이터가 정규 분포가 아닌 것에도 해결 가능하다고 합니다.
- 인구의 정규 분포: 데이터는 정규 분포의 인구에서 抽样 한 것이라고 仮定합니다. 큰 標本 사이즈에서는 이 仮定性이 중요하지 않지만, 標本 사이즈가 중간 sized일 때는 여전히 중요합니다.
t-시험과 Z-시험의 주요 차이점
t-test과 Z-test은 모두 표본 통계를 总体 parametric을 比较하는 데에 사용되ますが, 그들은 기반 仮設, 응용 사례, 그리고 가장 적절한 조건에 의해 서로 다르게 untuber합니다.두 시험의 차이를 분석하고 이해하겠습니다:
표본 규모 고려
- t-test: t-test은 일반적으로 표본 규모가 작을 때에 사용되며, 일반적으로 30을 넘지 않습니다. 표본 규모가 중앙 渐进 定理을 적용하기 위한 임계값을 만족하지 못하는 경우에도 鲁莽하게 DESIGNED 합니다.
- Z-시험: Z-시험은 標本 규모가 大局에 대해 큰 경우에 사용되며, 일반적으로 30이상이 되는 것이다. 大局에 대해 큰 標本에서는 평균의 標本 분포가 ≈ 정규 분포로 근사되며, 이를 이용하여 Z-시험을 사용할 수 있다.
인구 方差 지식
- t-시험: 인구 方差이 未知하다면 t-시험을 사용한다. 인구 方差를 대신에 標本 方差를 사용하여 시험 통계를 계산한다. 정규 분포보다 heavier tails를 가지는 t-분포는 인구 方差 추정에 의한 额外의 불확실성을 대응한다.
- Z-test: Z-test은 인구 분산이 알 수 있어야 합니다. 이것은 표준 정규 분포를 사용하여 통계 인자를 계산할 수 있는 중요한 仮設입니다. 인구 분산이 알 수 있으면 Z-test은 더 精密度이 높은 추정을 제공합니다.
분포 仮設
- t-test: t-test은 각 그룹 내 데이터가 근사적으로 정규 분포로 나누어진다고 仮設합니다. 이것은 작은 サンプル 사이즈를 处理할 때 특히 중요합니다. t-test의 통계 인자는 t-분포를 따라가며, 정규 분포보다 넓은 굵은 꼬리를 가지고 있습니다. 이것은 작은 サンプルから 인구 표준 편차를 추정하는 것에 대한 extra 변异性와 불확실성을 대비합니다.
- Z-测验: Z-测验은 데이터가 정규 분포라고 가정하거나, 대상 サンプル 사이즈가 충분히 grande가 되어 중앙 제어 이론을 적용할 수 있음을 가정한다. 중앙 제어 이론은 대형 サンプル의 경우, 이하에 의해 지시하는 평균의 サンプリング 분포가 정규 분포가 되는 것을 보장한다. 이론은 완전히 정규 형태가 아닌 하이dden 데이터에도 대응할 수 있다.
실용적인 응용과 사용 사례
- t-测验: t-测验은 인구 분산이 알 수 없는 작은 サンプル 연구, 예를 들어 조조 연구 등에서 자주 사용되며, 같은 그룹 내에서 시간 동안 변화를 평가하는 것도 includes
- Z-검정: Z-검정은 표본 크기가 큰 연구 또는 분산이 알려진 잘 확립된 모집단을 다룰 때 사용됩니다. 품질 관리, 설문 분석, 대규모 실험 연구에 자주 적용됩니다.
다음은 주요 차이점을 정리한 표입니다:
t-검정과 Z-검정의 주요 차이점. 이미지 출처: 작성자.
결론
이 튜토리얼에서는 가설 검정과 일반적으로 사용되는 두 가지 테스트인 t-검정과 z-검정을 소개했습니다. 각 테스트의 정의, 유형 및 가정을 배우고 주요 차이점을 이해했습니다. 어떤 상황에서 어떤 테스트를 사용하는 것이 가장 좋은지 결론을 내렸으며, 이를 통해 가설 검정을 통해 변수 간의 관계를 자신 있게 확립할 수 있게 되었습니다.
수사 기반 통계 이론 과정을 통해 통계 이론을 이해하고 이를 실제로 적용하기 위해서는 다음과 같은 자료를 통해 인기있는 기술을 사용해보시기 促します.
열심히 배워보세요!