严元章藏书0233

 

自学统计学Teach YourselfStatistics

 



理查德·古德曼(Richard Goodman)撰写的《自学统计学》一书,该书属于自学丛书系列,1957年首次出版。内容详细介绍了统计学的基本概念和理论模型,包括对统计学一词的两种用法、随机抽样的原理,以及如何从样本推断总体性质。书中详细解释了概率分布模型,如二项分布、泊松分布和正态分布,并深入探讨了双变量分布、回归分析和相关性。此外,文本的很大一部分致力于抽样理论(包括t检验和F检验)以及方差分析ANOVA)技术,旨在分离和检验不同分类因素对变异的影响。

 

本书旨在帮助那些需要自学统计学、但往往缺乏数学训练的人,使其能够理解一些基本概念和所涉及的数学知识。作者指出,统计学是应用数学的一个分支,因此即使是初步的处理也需要一些数学知识。本书将重点放在基本原理上,因此没有尝试处理质量控制、概率分析(probit analysis)等应用主题。

 

书中假设的数学水平不高。作者强烈建议读者跟进该系列丛书中阿博特先生(Mr.
Abbott
)的著作,尤其是《自学微积分》(Teach Yourself Calculus)。除了第一章外,每章末尾都附有一套练习题。

详细章节评述

I 章:初步了解 (A FIRST LOOK AROUND)

本章作为引言部分,探讨了统计学的定义、范畴以及核心概念。

●       统计学和统计数据(Statistics and Statistics): 区分了统计数据Statistics,复数用法)作为数值数据的系统集合,和统计学Statistics,单数用法)作为涉及收集、整理、分析和解释此类数据以及相关一般原理的专门人类活动或科学分支。

●       统计学的演变: 引用了 A. J. Wickens 的观点,指出统计学的重点已从描述过去(描述性统计,Descriptive
Statistics
)转变为用于解决问题和制定行动方案(例如私营企业的质量控制测试、科学实验)。

●       变量的类型: 介绍了离散或不连续变量(Discrete or Discontinuous Variable,如板球得分)和连续变量(Continuous
Variable
,如跑步距离)的概念。

●       描述性统计: 讨论了整理和总结数据的方法,包括列表、图表展示,以及使用单个数字或一组数字(如平均值、最高分)来概括信息。

●       样本与总体(Samples and Populations): 这是统计学科学的中心思想之一。定义了总体(Population/Universe,即所有项目/观测值的总集)和样本(Sample,从总体中抽取出的有限项目集)。重点强调随机样本Random Sample)的定义,以及随机一词是限定选择方法而非样本本身的特性。

●       统计推断(Statistical Inference)与概率: 阐明了从样本数据得出总体结论的过程(即统计推断)。指出概率概念是所有非纯粹描述性统计理论的基础。

●       统计模型: 介绍了统计学家设定理想分布(如标准分布)作为模型来代表总体变量分布的趋势。

●       显著性检验(Tests of Significance): 讨论了如何检验关于总体的假设是否站得住脚。核心是零假设Null Hypothesis),如果随机抽样提供的证据不利于该假设,则将其否定。检验的严苛程度取决于所选的显著性水平Level of Significance),通常是 0.05 0.01 水平。

II 章:频率与概率 (FREQUENCIES AND PROBABILITIES)

本章深入探讨了如何描述和总结频率分布,并奠定了概率论作为统计分析基础的地位。

●       频率分布的展示: 详细介绍了频率表(Frequency Tables)的设置,以及用直方图(Histograms)和频率多边形(Frequency Polygons)进行图示的方法。直方图强调单元格的面积测量频率。

●       累积频率: 介绍了累积频率图(Cumulative Frequency Diagrams)和累积频率多边形(Cumulative
Frequency Polygon
),用于显示变量取值等于或小于某一给定值的频率。

●       位置统计量: 介绍了描述分布集中趋势的统计量:众数Mode,频率最大值)和中位数Median,将总频率分成两等份的值)。

●       均值(The Mean): 强调了算术平均值(Mean)的重要性,并解释了它在直方图几何意义上是质心(centroid)的横坐标(x-co-ordinate)。

●       离散度量(Measures of Spread): 介绍了范围(Range)、四分位数(Quartiles)、四分位距(inter-quartile range)和方差Variances2

●     矩(Moments): 定义了分布的r 阶矩(rth moment)和r 阶均值矩(rth mean-momentmr)。

●       相对频率与概率: 探讨了概率概念如何源于相对频率(Relative Frequencies),即随着抽样继续,事件发生的相对频率趋于一个唯一极限。指出了随机/均等可能equi-probable)概念在概率定义中的循环性困难。

●       概率的基本数学: 介绍了互补事件(Complementary Events)、互斥事件(Mutually Exclusive Events)和独立事件(Independent Events)的概率计算规则(加法定理和乘法定理)。

●     连续分布: 引入了连续变量的概率密度Probability Densityϕ(x),以及概率的计算涉及积分(Probability P(alexleb)
=
abϕ(x)dx)。对于连续变量,谈论它取特定值的概率是无意义的,只能谈论其在某一区间内的概率。

●     连续概率分布的矩: 定义了连续分布的总体参数,如均值μ’、方差σ2、偏度μ3(用于衡量不对称性)和峰度μ4(用于衡量中心扁平程度)。

●     期望(Expectation): 定义了变量x 的期望mathscr(x),是离散变量xi 乘以其相应概率p(xi) 的总和,以及连续变量的相应积分形式。

●     概率生成函数(p.g.f.): 定义了函数G(t)
=mathscr(
tx),其泰勒展开式的系数是变量x 取特定值的概率。

III 章:统计模型 I:二项分布 (STATISTICAL MODELS. I: THE BINOMIAL
DISTRIBUTION)

本章详细介绍了处理离散事件的二项分布模型。

●     模型基础: 探讨了在n 次独立试验中,事件E 发生x 次的概率,其中E 的发生概率p 保持不变。

●       生成函数: 证明了二项分布的概率生成函数是(q+pt)n,其中q=1-p

●     性质: 讨论了二项分布的递推公式(Recursion Formula)。指出当p=q=1/2 时分布对称,否则偏斜,但偏斜度随n 增加而减小。

●     矩生成函数(M.G.F.): 引入了矩生成函数M(t)
=G(
et),通过对M(t) 求导,推导了二项分布的均值为μ’=np方差为 μ2=npq

●     拟合: 解释了在缺乏先验p 值时,如何通过计算观测分布的平均值来估计p 并拟合二项分布。

●     累计概率: 讨论了计算至少k 次发生的概率Pn(xgek),并提到了当k n 较大时,可以使用不完全 Beta 函数比率(Incomplete Beta Function Ratio)进行近似计算。

IV 章:统计模型 II:泊松分布:统计稀有性 (STATISTICAL MODELS. II: THE
POISSON DISTRIBUTION: STATISTICAL RARITY)

本章介绍了处理罕见事件(rare events)的泊松分布模型。

●       问题背景: 解决了像排版错误或放射性粒子发射次数这类问题,其中事件发生的总次数n 理论上是无限的,但实际发生的次数是有限的。

●     泊松模型: 泊松分布是二项分布在n→ ∞ np=m 保持有限(即p 极小,事件罕见)时的极限形式。

●     泊松概率: 泊松分布中x 次事件发生的概率为p(x,m) =e-mmx/x!

●     性质: 推导出泊松分布的均值 μ=m 和方差 σ2=m

●     近似: 泊松分布可作为p 值很小但n 很大的二项分布的有用近似。

●       泊松概率图: 提到可以使用泊松概率图(Poisson Probability Chart)来避免计算累积概率P(xgek,m) 的连续项求和。

●       负二项分布(Negative Binomial Distribution): 简要提到了当观测到的频率分布方差大于平均值,且p 已知不是常数时,负二项分布可能提供更好的拟合。

V 章:统计模型 III:正态分布 (STATISTICAL MODELS. III: THE
NORMAL DISTRIBUTION)

本章介绍了统计学中最为重要的连续分布模型。

●       连续分布: 正态分布(Normal Distribution)是对连续变量(如身高)理想化的、无限总体分布的近似描述。

●       历史地位: 正态分布最初由 de Moivre 发现,是二项分布的极限形式。它在观测领域的重要性有所下降,但在抽样理论等理论领域的重要性有所增加。

●       推导与函数: 详细演示了正态分布是如何从二项分布中近似导出的。正态概率密度函数(p.d.f.)为ϕ(x)
=
1σexp(-(x-μ)22σ2)

●     性质: 正态分布的范围是(-∞,
+∞)
,曲线是对称的(均值、中位数和众数重合),并且所有奇数阶的均值矩都为零。偶数阶均值矩μ2r=
1 ⋅ 3 ⋅ 5dots(2r-1)
σ2r

●     概率积分: 计算概率需使用概率积分(Probability Integral),通常将变量标准化为T=x/σ 来查表(如表 5.4)。

●     离差范围: 强调了在正态分布中,变量偏离均值超过1σ,
2σ, 3σ
 的概率很小,例如,超过 的概率仅约 4.56%

●       拟合: 介绍了如何通过计算均值和标准差来拟合正态曲线,以及使用概率图纸(probability graph paper)来确定分布是否近似正态并估计参数。

VI 章:多于一个变量:二元分布、回归和相关 (MORE VARIATES THAN ONE: BIVARIATE DISTRIBUTIONS, REGRESSION AND
CORRELATION)

本章开始处理两个或多个变量之间的关系。

●       二元分布(Bivariate Distributions): 处理两个变量(如身高和体重)的联合分布。通过相关表(Correlation Tables)、散点图(Scatter Diagrams)、立体图(Stereograms)和频率等高线图(Frequency Contours)来展示数据。

●       矩和协方差: 定义了二元分布的矩mrs,并引入了协方差Covariancesxy),它衡量了x y 的共同变化程度。

●       回归(Regression): 探究变量之间的关联性,特别是当散点图显示数据围绕某条曲线聚集时,可能存在函数关系或随机关系(stochastically related)。回归曲线(Regression Curves)描绘了一个变量的平均值随另一个变量变化的情况。

●       线性回归与相关系数: 假定回归是线性的,使用最小二乘法Method of Least Squares)来确定最佳拟合的回归线。

●     样本积矩相关系数(r): r 是衡量变量之间关系趋向线性的程度的指标。当r= ± 1 时,为完全相关(perfectly correlated),两条回归线重合;当r= 0 时,变量不相关(uncorrelated),回归线相互垂直。

●     估计的标准误差(Standard Error of Estimate): Sy2=sy2(1
r2) 进一步证明了r 越接近±
1
,观测值越紧密地聚集在回归线周围。

●       相关比率(Correlation Ratios, ηyx): 当回归是非线性时,相关比率ηyx 是更合适的关联度量。它总是满足ηyx2ger2,其差值ηyx2r2 可作为回归偏离线性的程度的初步度量。

●     秩相关(Rank Correlation): 介绍了斯皮尔曼(Spearman’s)的R 和肯德尔(Kendall’s)的τ 两种系数,用于衡量根据某一特征对个体进行排序后,两个排名的相似程度。

VII 章:样本与总体 I:抽样理论基础 (SAMPLE AND POPULATION. I: SOME
FUNDAMENTALS OF SAMPLING THEORY)

本章转向统计推断的核心问题,即如何从样本信息推断总体。

●       随机性的概念: 再次强调随机性(Randomness)指选择方法,并讨论了实际总体和概念总体的类型。

●       抽样方法: 提到了记号抽样Ticket Sampling)和随机抽样数Random Sampling
Numbers
,如使用 Rand Corporation 等出版的数表)来消除人为偏见。

●     样本均值的分布: 证明了不论总体如何分布,样本均值barx 的期望值mathscr(barx) 等于总体均值μ。样本均值分布的方差是总体方差的1/n 倍(σbarx2=σ2/n),其标准差被称为均值的标准误差Standard Error of the Mean)。

●     中心极限定理的应用: 指出当样本容量n 较大时,即使总体不为正态分布,barx 的分布也近似于正态分布。若总体本身是正态分布,则barx 的分布也精确地是正态分布。

●       自由度: 引入了自由度Degrees of Freedom)的概念,当对样本施加线性约束方程(如计算样本均值)时,自由度会减少。

●     样本方差: 证明了样本方差s2=(barxi-barx)2/n 是总体方差σ2 有偏估计量biased estimator)。而(barxi-barx)2/(n-1) σ2 无偏估计量unbiased estimator)。

VIII 章:样本与总体 IItz F (SAMPLE AND POPULATION. II: t, z, AND F)

本章引入了进行统计推断和假设检验的三个核心抽样分布。

●     t 分布(Student’s t): 解决了在总体方差σ2 未知的情况下,检验样本均值barx 是否符合总体均值μ 的问题。变量t= (barx-μ)n-1/s 的分布被称为t 分布,它不依赖于总体方差σ2。随着自由度ν=n-1 增大,t 分布趋近于正态分布。

●     置信区间(Confidence Limits): 使用t 分布来确定总体均值μ 在给定概率下(如 95%)所处的区间。

●     t 分布的扩展应用: 介绍了如何使用t 分布来检验两个独立样本的均值是否存在显著差异(需要先计算联合无偏方差σ2)。

●     方差比 F 检验(The
Variance-ratio,
F): 讨论了检验两个样本的方差之间是否存在显著差异的重要性。

○     z 分布: 费希尔(Fisher)提出了z=12loge(σ12/σ22) 的分布。

○     F 分布: 斯内德克(Snedecor)为了避免对数计算,将方差比σ12/σ22 命名为F 分布。F 分布也独立于总体方差,是进行方差分析的逻辑基础。

IX 章:方差分析 (ANALYSIS OF VARIANCE)

方差分析(ANOVA)是一种重要的统计技术,用于将方差归因于不同原因组

●       问题核心: 旨在分解总方差,以检验一个或多个分类因素(如牛的品种、饲料种类)是否对变量值(如产奶量)有显著影响。

●       单因素分类(One Criterion of Classification): 将总变异分解为组间变异Variation between classes)和组内变异Variation
within classes
)。通过零假设(分类因素无效)可以从这两个变异源获得两个独立的、无偏的总体方差估计量。如果组间变异的估计量显著大于组内变异的估计量(通过F 检验),则否定零假设。

●       双因素分类(Two Criteria of Classification): 将变异分解为 A 因素间、B 因素间和残余(Residual)三个部分。分析表提供了检验QA/Qresidual QB/Qresidual F 检验步骤。

●       交互作用(Interaction): 在三因素或更多因素分类中引入了交互作用的概念。交互作用指的是两个或多个因素共同作用时对变量值的影响,即使单独的因素可能没有影响。如果交互作用的方差估计量显著,则有理由怀疑零假设。