Z 分数到 P 值计算器

 

Z分数:
P值类型(μ):   单尾双尾
  1. 使用 z 分数到 p 值计算器
  2. 什么是“p 值”
  3. 如何解释低 p 值(统计显著性结果)
  4. p 值的常见误解
  5. Z 分数到 P 值转换表
  6. 单尾 p 值与双尾 p 值

使用 z 分数到 p 值计算器

如果您从给定数据集中获得了 Z 分数统计数据,并希望将其转换为相应的 p 值(百分位数),则此 Z 到 P 计算器适合您。只需输入您知道的 Z 分数并选择显著性检验的类型:单尾或双尾,即可使用正态 CPDF(正态分布的累积概率密度函数)计算相应的 p 值。如果要进行方向推断(说明效应的方向或符号),请选择单尾,它对应于单侧复合原假设。如果效应的方向无关紧要,请选择双尾,它对应于点原假设。

由于正态分布是对称的,因此计算的是左尾还是右尾 p 值并不重要:只需选择单尾,您将获得观测效应方向的正确结果。如果你想要分布另一尾部的 p 值,只需从 1 中减去它。

什么是“p 值”

p 值用于零假设统计检验 (NHST) 的上下文中,它是观察观察到的结果的概率,或者更极端的概率,假设原假设为真 1.它本质上是在观察到的 Z 分数点处截断的 Z 分布的比例面积。在表示法中,这表示为:

p(x0) = Pr(d(X) > d(x0);H0)

哪里x0是观测数据 (x1,x2...xn),d 是一个特殊函数(统计,例如计算 Z 分数),X 是一个随机样本(X1,X2...Xn) 来自原假设的抽样分布。这可以通过以下方式可视化:

p value statistical significance explained

就可能的推理错误而言,p 值表示犯类型 I 错误的概率:如果原假设确实为真,则拒绝原假设。p 值是该概率上的最坏情况。p 值可以被认为是标准差度量的百分位表达式,Z 分数是,例如,Z 分数 1.65 表示结果与原假设下的算术平均值相差 1.65 个标准差。因此,可以将 p 值视为一个更用户友好的表达式,表示给定观测值与正态相差多少个标准差。

如何解释低 p 值(统计显著性结果)

如果说结果在统计意义上显著,则意味着 p 值低于在执行测试之前为检验确定的证据阈值。例如,如果观察到在原假设为真的情况下仅发生 1 次中有 20 次的事情被认为是否定原假设的充分证据,则阈值将为 0.05。在这种情况下,观察 p 值 0.025 意味着结果在统计意义上显著。

让我们看看当看到一个结果时,如果零为真,这是完全不可能的,那么哪些推论是必要的。观察到低 p 值可能是由于以下三个原因之一[2]:

  1. 测试的治疗或干预有真正的效果。
  2. 没有真正的效果,但我们碰巧观察到了一个罕见的结果。p 值越低,结果越罕见(可能性越小,可能性越小)。
  3. 统计模型无效(不反映现实)。

显然,不能简单地跳到结论 1.)并以百分之百的确定性声称它,因为这将违背 p 值的整个概念。为了将 p 值用作决策过程的一部分,您需要考虑外部因素,这是实验设计过程的一部分,其中包括确定显著性阈值、样本大小和功效(功效分析)以及预期效应大小等。

如果你对p值所指示的这么多(或这么小)的不确定性感到满意,那么你就有了与你所测试的任何内容的效果和未来性能相关的可量化保证。有关 p 值含义、解释和常见误解的更深入理解,请参阅我们关于统计中 p 值的文章。

p 值的常见误解

对 p 值和统计显著性有几种常见的误解,没有计算器可以使您免于上当。最常见的错误是将低 p 值与证据误认为缺乏效果或差异,将统计显著性与实际显著性误认为,以及将 p 值视为与假设相关的概率,例如 p 值为 0.05 意味着原假设为真的概率为 5%,或者备择假设为真的概率为 95%。>关于这些误解的更多细节。

Z 分数到 P 值转换表

下面是一些常见的标准分数及其相应的 p 值和百分位数,假设单侧假设。

p 值和百分位数的标准分数
标准分数 (Z) P 值 百分比
0.8416 0.2000 80%
1.2816 0.1000 90%
1.6449 0.0500 95%
1.9600 0.0250 97.5%
2.0537 0.0200 98%
2.3263 0.0100 99%
3.0902 0.0010 99.9%
3.2905 0.0005 99.95%

上表可用于从 z 分数中获取某些 Z 值的 p 值,但为了获得准确的结果,像我们这样使用正态分布 CDF 来计算精确 p 值的计算器是必不可少的。

单尾 p 值与双尾 p 值

关于单尾检验和双尾检验(通常称为单侧和双侧假设)及其相应的 p 值存在广泛的误解[4].这并不奇怪,因为即使是关于该主题的维基百科文章也犯了错误,指出只有当“估计值可以在一个方向上偏离参考值”时,单侧检验才是合适的。因此,人们通常更喜欢双侧检验,因为他们认为使用单侧检验会导致偏差,和/或高于标称错误率(I型误差),以及它涉及更多的假设(关于效应的方向)。

事实并非如此。在实际或理论上,没有适合进行双尾检验的情况,因为要使它合适,无论感兴趣的效果的方向如何,得出的推论或采取的行动都必须相同。事实并非如此。

“只有当我们发现任何方向存在统计学上的显着差异时,才应该使用双侧假设和双尾检验。 [3].否则会导致许多问题,包括报告比实际和不受控制的III型错误更高的错误率:推断效应的方向与观察到的方向相同,而事实并非如此。

另一方面,“当我们发现特定方向的统计显着差异时,应该使用单侧假设和单侧检验,当我们以某种方式行事或得出某些结论时,而不是在另一个方向上。 [5]它描述了 p 值的所有实际和科学应用以及一般的显著性检验。如果你仔细制定你的假设,你会发现你总是想陈述一些关于零假设和备择假设的方向。

因此,单侧检验不仅可以回答您实际提出的问题,而且假设使用相同的显著性阈值,它们的效率也更高,从而使实验速度提高 %20-%60[3].没有充分的理由使用双尾测试,因为这会导致测试速度慢 20-60%,无法回答一个人没有问的问题。更深入的阅读和解释:单尾与双尾显著性检验和参考#3。从 z 得分获取 p 值时,选择正确的原假设非常重要 - 单侧或点零,具体取决于情况,并且在大多数情况下,正确的 p 值将是单侧/单尾假设。