严元章藏书0233
自学统计学Teach Yourself:Statistics

理查德·古德曼(Richard Goodman)撰写的《自学统计学》一书,该书属于“自学丛书”系列,于1957年首次出版。内容详细介绍了统计学的基本概念和理论模型,包括对“统计学”一词的两种用法、随机抽样的原理,以及如何从样本推断总体性质。书中详细解释了概率分布模型,如二项分布、泊松分布和正态分布,并深入探讨了双变量分布、回归分析和相关性。此外,文本的很大一部分致力于抽样理论(包括t检验和F检验)以及方差分析(ANOVA)技术,旨在分离和检验不同分类因素对变异的影响。
本书旨在帮助那些需要自学统计学、但往往缺乏数学训练的人,使其能够理解一些基本概念和所涉及的数学知识。作者指出,统计学是应用数学的一个分支,因此即使是初步的处理也需要一些数学知识。本书将重点放在基本原理上,因此没有尝试处理质量控制、概率分析(probit analysis)等应用主题。
书中假设的数学水平不高。作者强烈建议读者跟进该系列丛书中阿博特先生(Mr.
Abbott)的著作,尤其是《自学微积分》(Teach Yourself Calculus)。除了第一章外,每章末尾都附有一套练习题。
详细章节评述
第 I 章:初步了解 (A FIRST LOOK AROUND)
本章作为引言部分,探讨了统计学的定义、范畴以及核心概念。
● 统计学和统计数据(Statistics and Statistics): 区分了“统计数据”(Statistics,复数用法)作为数值数据的系统集合,和“统计学”(Statistics,单数用法)作为涉及收集、整理、分析和解释此类数据以及相关一般原理的专门人类活动或科学分支。
● 统计学的演变: 引用了 A. J. Wickens 的观点,指出统计学的重点已从描述过去(描述性统计,Descriptive
Statistics)转变为用于解决问题和制定行动方案(例如私营企业的质量控制测试、科学实验)。
● 变量的类型: 介绍了离散或不连续变量(Discrete or Discontinuous Variable,如板球得分)和连续变量(Continuous
Variable,如跑步距离)的概念。
● 描述性统计: 讨论了整理和总结数据的方法,包括列表、图表展示,以及使用单个数字或一组数字(如平均值、最高分)来概括信息。
● 样本与总体(Samples and Populations): 这是统计学科学的中心思想之一。定义了总体(Population/Universe,即所有项目/观测值的总集)和样本(Sample,从总体中抽取出的有限项目集)。重点强调随机样本(Random Sample)的定义,以及“随机”一词是限定选择方法而非样本本身的特性。
● 统计推断(Statistical Inference)与概率: 阐明了从样本数据得出总体结论的过程(即统计推断)。指出概率概念是所有非纯粹描述性统计理论的基础。
● 统计模型: 介绍了统计学家设定理想分布(如标准分布)作为模型来代表总体变量分布的趋势。
● 显著性检验(Tests of Significance): 讨论了如何检验关于总体的假设是否站得住脚。核心是零假设(Null Hypothesis),如果随机抽样提供的证据“不利于”该假设,则将其否定。检验的严苛程度取决于所选的显著性水平(Level of Significance),通常是 0.05 或 0.01 水平。
第 II 章:频率与概率 (FREQUENCIES AND PROBABILITIES)
本章深入探讨了如何描述和总结频率分布,并奠定了概率论作为统计分析基础的地位。
● 频率分布的展示: 详细介绍了频率表(Frequency Tables)的设置,以及用直方图(Histograms)和频率多边形(Frequency Polygons)进行图示的方法。直方图强调单元格的面积测量频率。
● 累积频率: 介绍了累积频率图(Cumulative Frequency Diagrams)和累积频率多边形(Cumulative
Frequency Polygon),用于显示变量取值等于或小于某一给定值的频率。
● 位置统计量: 介绍了描述分布集中趋势的统计量:众数(Mode,频率最大值)和中位数(Median,将总频率分成两等份的值)。
● 均值(The Mean): 强调了算术平均值(Mean)的重要性,并解释了它在直方图几何意义上是质心(centroid)的横坐标(x-co-ordinate)。
● 离散度量(Measures of Spread): 介绍了范围(Range)、四分位数(Quartiles)、四分位距(inter-quartile range)和方差(Variance,s2
● 矩(Moments): 定义了分布的r
阶矩(rth moment)和r
阶均值矩(rth mean-moment,mr
)。
● 相对频率与概率: 探讨了概率概念如何源于相对频率(Relative Frequencies),即随着抽样继续,事件发生的相对频率趋于一个唯一极限。指出了“随机/均等可能”(equi-probable)概念在概率定义中的循环性困难。
● 概率的基本数学: 介绍了互补事件(Complementary Events)、互斥事件(Mutually Exclusive Events)和独立事件(Independent Events)的概率计算规则(加法定理和乘法定理)。
● 连续分布: 引入了连续变量的概率密度(Probability Density)ϕ(x)
,以及概率的计算涉及积分(Probability P(alexleb)
=∫abϕ(x)dx
)。对于连续变量,谈论它取特定值的概率是无意义的,只能谈论其在某一区间内的概率。
● 连续概率分布的矩: 定义了连续分布的总体参数,如均值μ’
、方差σ2
、偏度μ3
(用于衡量不对称性)和峰度μ4
(用于衡量中心扁平程度)。
● 期望(Expectation): 定义了变量x
的期望mathscr(x)
,是离散变量xi
乘以其相应概率p(xi)
的总和,以及连续变量的相应积分形式。
● 概率生成函数(p.g.f.): 定义了函数G(t)
=mathscr(tx)
,其泰勒展开式的系数是变量x
取特定值的概率。
第 III 章:统计模型 I:二项分布 (STATISTICAL MODELS. I: THE BINOMIAL
DISTRIBUTION)
本章详细介绍了处理离散事件的二项分布模型。
● 模型基础: 探讨了在n
次独立试验中,事件E
发生x
次的概率,其中E
的发生概率p
保持不变。
● 生成函数: 证明了二项分布的概率生成函数是(q+pt)n
,其中q=1-p
。
● 性质: 讨论了二项分布的递推公式(Recursion Formula)。指出当p=q=1/2
时分布对称,否则偏斜,但偏斜度随n
增加而减小。
● 矩生成函数(M.G.F.): 引入了矩生成函数M(t)
=G(et)
,通过对M(t)
求导,推导了二项分布的均值为μ’=np
,方差为 μ2=npq
。
● 拟合: 解释了在缺乏先验p
值时,如何通过计算观测分布的平均值来估计p
并拟合二项分布。
● 累计概率: 讨论了计算“至少k
次发生”的概率Pn(xgek)
,并提到了当k
和n
较大时,可以使用不完全 Beta 函数比率(Incomplete Beta Function Ratio)进行近似计算。
第 IV 章:统计模型 II:泊松分布:统计稀有性 (STATISTICAL MODELS. II: THE
POISSON DISTRIBUTION: STATISTICAL RARITY)
本章介绍了处理罕见事件(rare events)的泊松分布模型。
● 问题背景: 解决了像排版错误或放射性粒子发射次数这类问题,其中事件发生的总次数n
理论上是无限的,但实际发生的次数是有限的。
● 泊松模型: 泊松分布是二项分布在n→ ∞
但np=m
保持有限(即p
极小,事件罕见)时的极限形式。
● 泊松概率: 泊松分布中x
次事件发生的概率为p(x,m) =e-mmx/x!
。
● 性质: 推导出泊松分布的均值 μ=m
和方差 σ2=m
。
● 近似: 泊松分布可作为p
值很小但n
很大的二项分布的有用近似。
● 泊松概率图: 提到可以使用泊松概率图(Poisson Probability Chart)来避免计算累积概率P(xgek,m)
的连续项求和。
● 负二项分布(Negative Binomial Distribution): 简要提到了当观测到的频率分布方差大于平均值,且p
已知不是常数时,负二项分布可能提供更好的拟合。
第 V 章:统计模型 III:正态分布 (STATISTICAL MODELS. III: THE
NORMAL DISTRIBUTION)
本章介绍了统计学中最为重要的连续分布模型。
● 连续分布: 正态分布(Normal Distribution)是对连续变量(如身高)理想化的、无限总体分布的近似描述。
● 历史地位: 正态分布最初由 de Moivre 发现,是二项分布的极限形式。它在观测领域的重要性有所下降,但在抽样理论等理论领域的重要性有所增加。
● 推导与函数: 详细演示了正态分布是如何从二项分布中近似导出的。正态概率密度函数(p.d.f.)为ϕ(x)
=1σ2πexp(-(x-μ)22σ2)
。
● 性质: 正态分布的范围是(-∞,
+∞)
,曲线是对称的(均值、中位数和众数重合),并且所有奇数阶的均值矩都为零。偶数阶均值矩μ2r=
1 ⋅ 3 ⋅ 5dots(2r-1)σ2r
。
● 概率积分: 计算概率需使用概率积分(Probability Integral),通常将变量标准化为T=x/σ
来查表(如表 5.4)。
● 离差范围: 强调了在正态分布中,变量偏离均值超过1σ,
2σ, 3σ
的概率很小,例如,超过2σ
的概率仅约 4.56%。
● 拟合: 介绍了如何通过计算均值和标准差来拟合正态曲线,以及使用概率图纸(probability graph paper)来确定分布是否近似正态并估计参数。
第 VI 章:多于一个变量:二元分布、回归和相关 (MORE VARIATES THAN ONE: BIVARIATE DISTRIBUTIONS, REGRESSION AND
CORRELATION)
本章开始处理两个或多个变量之间的关系。
● 二元分布(Bivariate Distributions): 处理两个变量(如身高和体重)的联合分布。通过相关表(Correlation Tables)、散点图(Scatter Diagrams)、立体图(Stereograms)和频率等高线图(Frequency Contours)来展示数据。
● 矩和协方差: 定义了二元分布的矩m‘rs
,并引入了协方差(Covariance,sxy
),它衡量了x
和y
的共同变化程度。
● 回归(Regression): 探究变量之间的关联性,特别是当散点图显示数据围绕某条曲线聚集时,可能存在函数关系或随机关系(stochastically related)。回归曲线(Regression Curves)描绘了一个变量的平均值随另一个变量变化的情况。
● 线性回归与相关系数: 假定回归是线性的,使用最小二乘法(Method of Least Squares)来确定最佳拟合的回归线。
● 样本积矩相关系数(r
): r
是衡量变量之间关系趋向线性的程度的指标。当r= ± 1
时,为完全相关(perfectly correlated),两条回归线重合;当r= 0
时,变量不相关(uncorrelated),回归线相互垂直。
● 估计的标准误差(Standard Error of Estimate): Sy2=sy2(1
–r2)
进一步证明了r
越接近±
1
,观测值越紧密地聚集在回归线周围。
● 相关比率(Correlation Ratios, ηyx
): 当回归是非线性时,相关比率ηyx
是更合适的关联度量。它总是满足ηyx2ger2
,其差值ηyx2–r2
可作为回归偏离线性的程度的初步度量。
● 秩相关(Rank Correlation): 介绍了斯皮尔曼(Spearman’s)的R
和肯德尔(Kendall’s)的τ
两种系数,用于衡量根据某一特征对个体进行排序后,两个排名的相似程度。
第 VII 章:样本与总体 I:抽样理论基础 (SAMPLE AND POPULATION. I: SOME
FUNDAMENTALS OF SAMPLING THEORY)
本章转向统计推断的核心问题,即如何从样本信息推断总体。
● 随机性的概念: 再次强调随机性(Randomness)指选择方法,并讨论了实际总体和概念总体的类型。
● 抽样方法: 提到了记号抽样(Ticket Sampling)和随机抽样数(Random Sampling
Numbers,如使用 Rand Corporation 等出版的数表)来消除人为偏见。
● 样本均值的分布: 证明了不论总体如何分布,样本均值barx
的期望值mathscr(barx)
等于总体均值μ
。样本均值分布的方差是总体方差的1/n
倍(σbarx2=σ2/n
),其标准差被称为均值的标准误差(Standard Error of the Mean)。
● 中心极限定理的应用: 指出当样本容量n
较大时,即使总体不为正态分布,barx
的分布也近似于正态分布。若总体本身是正态分布,则barx
的分布也精确地是正态分布。
● 自由度: 引入了自由度(Degrees of Freedom)的概念,当对样本施加线性约束方程(如计算样本均值)时,自由度会减少。
● 样本方差: 证明了样本方差s2=(barxi-barx)2/n
是总体方差σ2
的有偏估计量(biased estimator)。而(barxi-barx)2/(n-1)
是σ2
的无偏估计量(unbiased estimator)。
第 VIII 章:样本与总体 II:t、z 和 F (SAMPLE AND POPULATION. II: t, z, AND F)
本章引入了进行统计推断和假设检验的三个核心抽样分布。
● t
分布(Student’s t
): 解决了在总体方差σ2
未知的情况下,检验样本均值barx
是否符合总体均值μ
的问题。变量t= (barx-μ)n-1/s
的分布被称为t
分布,它不依赖于总体方差σ2
。随着自由度ν=n-1
增大,t
分布趋近于正态分布。
● 置信区间(Confidence Limits): 使用t
分布来确定总体均值μ
在给定概率下(如 95%)所处的区间。
● t
分布的扩展应用: 介绍了如何使用t
分布来检验两个独立样本的均值是否存在显著差异(需要先计算联合无偏方差σ2
)。
● 方差比 F
检验(The
Variance-ratio, F
): 讨论了检验两个样本的方差之间是否存在显著差异的重要性。
○ z
分布: 费希尔(Fisher)提出了z=12loge(σ12/σ22)
的分布。
○ F
分布: 斯内德克(Snedecor)为了避免对数计算,将方差比σ12/σ22
命名为F
分布。F
分布也独立于总体方差,是进行方差分析的逻辑基础。
第 IX 章:方差分析 (ANALYSIS OF VARIANCE)
方差分析(ANOVA)是一种重要的统计技术,用于将方差归因于不同原因组。
● 问题核心: 旨在分解总方差,以检验一个或多个分类因素(如牛的品种、饲料种类)是否对变量值(如产奶量)有显著影响。
● 单因素分类(One Criterion of Classification): 将总变异分解为组间变异(Variation between classes)和组内变异(Variation
within classes)。通过零假设(分类因素无效)可以从这两个变异源获得两个独立的、无偏的总体方差估计量。如果组间变异的估计量显著大于组内变异的估计量(通过F
检验),则否定零假设。
● 双因素分类(Two Criteria of Classification): 将变异分解为 A 因素间、B 因素间和残余(Residual)三个部分。分析表提供了检验QA/Qresidual
和QB/Qresidual
的F
检验步骤。
● 交互作用(Interaction): 在三因素或更多因素分类中引入了“交互作用”的概念。交互作用指的是两个或多个因素共同作用时对变量值的影响,即使单独的因素可能没有影响。如果交互作用的方差估计量显著,则有理由怀疑零假设。
