自学统计学Teach Yourself：Statistics

严元章藏书0233

自学统计学Teach Yourself：Statistics

理查德·古德曼（Richard Goodman）撰写的《自学统计学》一书，该书属于“自学丛书”系列，于1957年首次出版。内容详细介绍了统计学的基本概念和理论模型，包括对“统计学”一词的两种用法、随机抽样的原理，以及如何从样本推断总体性质。书中详细解释了概率分布模型，如二项分布、泊松分布和正态分布，并深入探讨了双变量分布、回归分析和相关性。此外，文本的很大一部分致力于抽样理论（包括t检验和F检验）以及方差分析（ANOVA）技术，旨在分离和检验不同分类因素对变异的影响。

本书旨在帮助那些需要自学统计学、但往往缺乏数学训练的人，使其能够理解一些基本概念和所涉及的数学知识。作者指出，统计学是应用数学的一个分支，因此即使是初步的处理也需要一些数学知识。本书将重点放在基本原理上，因此没有尝试处理质量控制、概率分析（probit analysis）等应用主题。

书中假设的数学水平不高。作者强烈建议读者跟进该系列丛书中阿博特先生（Mr.
Abbott）的著作，尤其是《自学微积分》（Teach Yourself Calculus）。除了第一章外，每章末尾都附有一套练习题。

详细章节评述

第 I 章：初步了解 (A FIRST LOOK AROUND)

本章作为引言部分，探讨了统计学的定义、范畴以及核心概念。

● 统计学和统计数据（Statistics and Statistics）：区分了“统计数据”（Statistics，复数用法）作为数值数据的系统集合，和“统计学”（Statistics，单数用法）作为涉及收集、整理、分析和解释此类数据以及相关一般原理的专门人类活动或科学分支。

● 统计学的演变： 引用了 A. J. Wickens 的观点，指出统计学的重点已从描述过去（描述性统计，Descriptive
Statistics）转变为用于解决问题和制定行动方案（例如私营企业的质量控制测试、科学实验）。

● 变量的类型： 介绍了离散或不连续变量（Discrete or Discontinuous Variable，如板球得分）和连续变量（Continuous
Variable，如跑步距离）的概念。

● 描述性统计： 讨论了整理和总结数据的方法，包括列表、图表展示，以及使用单个数字或一组数字（如平均值、最高分）来概括信息。

● 样本与总体（Samples and Populations）：这是统计学科学的中心思想之一。定义了总体（Population/Universe，即所有项目/观测值的总集）和样本（Sample，从总体中抽取出的有限项目集）。重点强调随机样本（Random Sample）的定义，以及“随机”一词是限定选择方法而非样本本身的特性。

● 统计推断（Statistical Inference）与概率： 阐明了从样本数据得出总体结论的过程（即统计推断）。指出概率概念是所有非纯粹描述性统计理论的基础。

● 统计模型： 介绍了统计学家设定理想分布（如标准分布）作为模型来代表总体变量分布的趋势。

● 显著性检验（Tests of Significance）：讨论了如何检验关于总体的假设是否站得住脚。核心是零假设（Null Hypothesis），如果随机抽样提供的证据“不利于”该假设，则将其否定。检验的严苛程度取决于所选的显著性水平（Level of Significance），通常是 0.05 或 0.01 水平。

第 II 章：频率与概率 (FREQUENCIES AND PROBABILITIES)

本章深入探讨了如何描述和总结频率分布，并奠定了概率论作为统计分析基础的地位。

● 频率分布的展示： 详细介绍了频率表（Frequency Tables）的设置，以及用直方图（Histograms）和频率多边形（Frequency Polygons）进行图示的方法。直方图强调单元格的面积测量频率。

● 累积频率： 介绍了累积频率图（Cumulative Frequency Diagrams）和累积频率多边形（Cumulative
Frequency Polygon），用于显示变量取值等于或小于某一给定值的频率。

● 位置统计量： 介绍了描述分布集中趋势的统计量：众数（Mode，频率最大值）和中位数（Median，将总频率分成两等份的值）。

● 均值（The Mean）：强调了算术平均值（Mean）的重要性，并解释了它在直方图几何意义上是质心（centroid）的横坐标（x-co-ordinate）。

● 离散度量（Measures of Spread）：介绍了范围（Range）、四分位数（Quartiles）、四分位距（inter-quartile range）和方差（Variance，s2

● 矩（Moments）：定义了分布的r 阶矩（rth moment）和r 阶均值矩（rth mean-moment，mr）。

● 相对频率与概率： 探讨了概率概念如何源于相对频率（Relative Frequencies），即随着抽样继续，事件发生的相对频率趋于一个唯一极限。指出了“随机/均等可能”（equi-probable）概念在概率定义中的循环性困难。

● 概率的基本数学： 介绍了互补事件（Complementary Events）、互斥事件（Mutually Exclusive Events）和独立事件（Independent Events）的概率计算规则（加法定理和乘法定理）。

● 连续分布： 引入了连续变量的概率密度（Probability Density）ϕ(x)，以及概率的计算涉及积分（Probability P(alexleb)
=∫abϕ(x)dx）。对于连续变量，谈论它取特定值的概率是无意义的，只能谈论其在某一区间内的概率。

● 连续概率分布的矩： 定义了连续分布的总体参数，如均值μ’、方差σ2、偏度μ3（用于衡量不对称性）和峰度μ4（用于衡量中心扁平程度）。

● 期望（Expectation）：定义了变量x 的期望mathscr(x)，是离散变量xi 乘以其相应概率p(xi) 的总和，以及连续变量的相应积分形式。

● 概率生成函数（p.g.f.）：定义了函数G(t)
=mathscr(tx)，其泰勒展开式的系数是变量x 取特定值的概率。

第 III 章：统计模型 I：二项分布 (STATISTICAL MODELS. I: THE BINOMIAL
DISTRIBUTION)

本章详细介绍了处理离散事件的二项分布模型。

● 模型基础： 探讨了在n 次独立试验中，事件E 发生x 次的概率，其中E 的发生概率p 保持不变。

● 生成函数： 证明了二项分布的概率生成函数是(q+pt)n，其中q=1-p。

● 性质： 讨论了二项分布的递推公式（Recursion Formula）。指出当p=q=1/2 时分布对称，否则偏斜，但偏斜度随n 增加而减小。

● 矩生成函数（M.G.F.）：引入了矩生成函数M(t)
=G(et)，通过对M(t) 求导，推导了二项分布的均值为μ’=np，方差为 μ2=npq。

● 拟合： 解释了在缺乏先验p 值时，如何通过计算观测分布的平均值来估计p 并拟合二项分布。

● 累计概率： 讨论了计算“至少k 次发生”的概率Pn(xgek)，并提到了当k 和n 较大时，可以使用不完全 Beta 函数比率（Incomplete Beta Function Ratio）进行近似计算。

第 IV 章：统计模型 II：泊松分布：统计稀有性 (STATISTICAL MODELS. II: THE
POISSON DISTRIBUTION: STATISTICAL RARITY)

本章介绍了处理罕见事件（rare events）的泊松分布模型。

● 问题背景： 解决了像排版错误或放射性粒子发射次数这类问题，其中事件发生的总次数n 理论上是无限的，但实际发生的次数是有限的。

● 泊松模型： 泊松分布是二项分布在n→ ∞ 但np=m 保持有限（即p 极小，事件罕见）时的极限形式。

● 泊松概率： 泊松分布中x 次事件发生的概率为p(x,m) =e-mmx/x!。

● 性质： 推导出泊松分布的均值 μ=m 和方差 σ2=m。

● 近似： 泊松分布可作为p 值很小但n 很大的二项分布的有用近似。

● 泊松概率图： 提到可以使用泊松概率图（Poisson Probability Chart）来避免计算累积概率P(xgek,m) 的连续项求和。

● 负二项分布（Negative Binomial Distribution）：简要提到了当观测到的频率分布方差大于平均值，且p 已知不是常数时，负二项分布可能提供更好的拟合。

第 V 章：统计模型 III：正态分布 (STATISTICAL MODELS. III: THE
NORMAL DISTRIBUTION)

本章介绍了统计学中最为重要的连续分布模型。

● 连续分布： 正态分布（Normal Distribution）是对连续变量（如身高）理想化的、无限总体分布的近似描述。

● 历史地位： 正态分布最初由 de Moivre 发现，是二项分布的极限形式。它在观测领域的重要性有所下降，但在抽样理论等理论领域的重要性有所增加。

● 推导与函数： 详细演示了正态分布是如何从二项分布中近似导出的。正态概率密度函数（p.d.f.）为ϕ(x)
=1σ2πexp(-(x-μ)22σ2)。

● 性质： 正态分布的范围是(-∞,
+∞)，曲线是对称的（均值、中位数和众数重合），并且所有奇数阶的均值矩都为零。偶数阶均值矩μ2r=
1 ⋅ 3 ⋅ 5dots(2r-1)σ2r。

● 概率积分： 计算概率需使用概率积分（Probability Integral），通常将变量标准化为T=x/σ 来查表（如表 5.4）。

● 离差范围： 强调了在正态分布中，变量偏离均值超过1σ,
2σ, 3σ 的概率很小，例如，超过2σ 的概率仅约 4.56%。

● 拟合： 介绍了如何通过计算均值和标准差来拟合正态曲线，以及使用概率图纸（probability graph paper）来确定分布是否近似正态并估计参数。

第 VI 章：多于一个变量：二元分布、回归和相关 (MORE VARIATES THAN ONE: BIVARIATE DISTRIBUTIONS, REGRESSION AND
CORRELATION)

本章开始处理两个或多个变量之间的关系。

● 二元分布（Bivariate Distributions）：处理两个变量（如身高和体重）的联合分布。通过相关表（Correlation Tables）、散点图（Scatter Diagrams）、立体图（Stereograms）和频率等高线图（Frequency Contours）来展示数据。

● 矩和协方差： 定义了二元分布的矩m‘rs，并引入了协方差（Covariance，sxy），它衡量了x 和y 的共同变化程度。

● 回归（Regression）：探究变量之间的关联性，特别是当散点图显示数据围绕某条曲线聚集时，可能存在函数关系或随机关系（stochastically related）。回归曲线（Regression Curves）描绘了一个变量的平均值随另一个变量变化的情况。

● 线性回归与相关系数： 假定回归是线性的，使用最小二乘法（Method of Least Squares）来确定最佳拟合的回归线。

● 样本积矩相关系数（r）： r 是衡量变量之间关系趋向线性的程度的指标。当r= ± 1 时，为完全相关（perfectly correlated），两条回归线重合；当r= 0 时，变量不相关（uncorrelated），回归线相互垂直。

● 估计的标准误差（Standard Error of Estimate）： Sy2=sy2(1
–r2) 进一步证明了r 越接近±
1，观测值越紧密地聚集在回归线周围。

● 相关比率（Correlation Ratios, ηyx）：当回归是非线性时，相关比率ηyx 是更合适的关联度量。它总是满足ηyx2ger2，其差值ηyx2–r2 可作为回归偏离线性的程度的初步度量。

● 秩相关（Rank Correlation）：介绍了斯皮尔曼（Spearman’s）的R 和肯德尔（Kendall’s）的τ 两种系数，用于衡量根据某一特征对个体进行排序后，两个排名的相似程度。

第 VII 章：样本与总体 I：抽样理论基础 (SAMPLE AND POPULATION. I: SOME
FUNDAMENTALS OF SAMPLING THEORY)

本章转向统计推断的核心问题，即如何从样本信息推断总体。

● 随机性的概念： 再次强调随机性（Randomness）指选择方法，并讨论了实际总体和概念总体的类型。

● 抽样方法： 提到了记号抽样（Ticket Sampling）和随机抽样数（Random Sampling
Numbers，如使用 Rand Corporation 等出版的数表）来消除人为偏见。

● 样本均值的分布： 证明了不论总体如何分布，样本均值barx 的期望值mathscr(barx) 等于总体均值μ。样本均值分布的方差是总体方差的1/n 倍（σbarx2=σ2/n），其标准差被称为均值的标准误差（Standard Error of the Mean）。

● 中心极限定理的应用： 指出当样本容量n 较大时，即使总体不为正态分布，barx 的分布也近似于正态分布。若总体本身是正态分布，则barx 的分布也精确地是正态分布。

● 自由度： 引入了自由度（Degrees of Freedom）的概念，当对样本施加线性约束方程（如计算样本均值）时，自由度会减少。

● 样本方差： 证明了样本方差s2=(barxi-barx)2/n 是总体方差σ2 的有偏估计量（biased estimator）。而(barxi-barx)2/(n-1) 是σ2 的无偏估计量（unbiased estimator）。

第 VIII 章：样本与总体 II：t、z 和 F (SAMPLE AND POPULATION. II: t, z, AND F)

本章引入了进行统计推断和假设检验的三个核心抽样分布。

● t 分布（Student’s t）：解决了在总体方差σ2 未知的情况下，检验样本均值barx 是否符合总体均值μ 的问题。变量t= (barx-μ)n-1/s 的分布被称为t 分布，它不依赖于总体方差σ2。随着自由度ν=n-1 增大，t 分布趋近于正态分布。

● 置信区间（Confidence Limits）：使用t 分布来确定总体均值μ 在给定概率下（如 95%）所处的区间。

● t 分布的扩展应用： 介绍了如何使用t 分布来检验两个独立样本的均值是否存在显著差异（需要先计算联合无偏方差σ2）。

● 方差比 F 检验（The
Variance-ratio, F）：讨论了检验两个样本的方差之间是否存在显著差异的重要性。

○ z 分布： 费希尔（Fisher）提出了z=12loge(σ12/σ22) 的分布。

○ F 分布： 斯内德克（Snedecor）为了避免对数计算，将方差比σ12/σ22 命名为F 分布。F 分布也独立于总体方差，是进行方差分析的逻辑基础。

第 IX 章：方差分析 (ANALYSIS OF VARIANCE)

方差分析（ANOVA）是一种重要的统计技术，用于将方差归因于不同原因组。

● 问题核心： 旨在分解总方差，以检验一个或多个分类因素（如牛的品种、饲料种类）是否对变量值（如产奶量）有显著影响。

● 单因素分类（One Criterion of Classification）：将总变异分解为组间变异（Variation between classes）和组内变异（Variation
within classes）。通过零假设（分类因素无效）可以从这两个变异源获得两个独立的、无偏的总体方差估计量。如果组间变异的估计量显著大于组内变异的估计量（通过F 检验），则否定零假设。

● 双因素分类（Two Criteria of Classification）：将变异分解为 A 因素间、B 因素间和残余（Residual）三个部分。分析表提供了检验QA/Qresidual 和QB/Qresidual 的F 检验步骤。

● 交互作用（Interaction）：在三因素或更多因素分类中引入了“交互作用”的概念。交互作用指的是两个或多个因素共同作用时对变量值的影响，即使单独的因素可能没有影响。如果交互作用的方差估计量显著，则有理由怀疑零假设。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

自学统计学Teach Yourself：Statistics

详细章节评述

第 I 章：初步了解 (A FIRST LOOK AROUND)

第 II 章：频率与概率 (FREQUENCIES AND PROBABILITIES)

第 III 章：统计模型 I：二项分布 (STATISTICAL MODELS. I: THE BINOMIAL
DISTRIBUTION)

第 IV 章：统计模型 II：泊松分布：统计稀有性 (STATISTICAL MODELS. II: THE
POISSON DISTRIBUTION: STATISTICAL RARITY)

第 V 章：统计模型 III：正态分布 (STATISTICAL MODELS. III: THE
NORMAL DISTRIBUTION)

第 VI 章：多于一个变量：二元分布、回归和相关 (MORE VARIATES THAN ONE: BIVARIATE DISTRIBUTIONS, REGRESSION AND
CORRELATION)

第 VII 章：样本与总体 I：抽样理论基础 (SAMPLE AND POPULATION. I: SOME
FUNDAMENTALS OF SAMPLING THEORY)

第 VIII 章：样本与总体 II：t、z 和 F (SAMPLE AND POPULATION. II: t, z, AND F)

第 IX 章：方差分析 (ANALYSIS OF VARIANCE)

相关文章

《蒙特梭利系统：理论与实践》 The Montessori System：In Theory and Practice

《教育中的民族主义威胁》The Menace of Nationalism In Education

《古兰经》The Meaning of the Glorious Koran

You missed

回望伏龙山的青春注脚：《伏龙山讯2008年刊》

《马来亚之前途》郑天忱

《马来亚印象记》

自学统计学Teach Yourself：Statistics

详细章节评述

第 I 章：初步了解 (A FIRST LOOK AROUND)

第 II 章：频率与概率 (FREQUENCIES AND PROBABILITIES)

第 III 章：统计模型 I：二项分布 (STATISTICAL MODELS. I: THE BINOMIAL DISTRIBUTION)

第 IV 章：统计模型 II：泊松分布：统计稀有性 (STATISTICAL MODELS. II: THE POISSON DISTRIBUTION: STATISTICAL RARITY)

第 V 章：统计模型 III：正态分布 (STATISTICAL MODELS. III: THE NORMAL DISTRIBUTION)

第 VI 章：多于一个变量：二元分布、回归和相关 (MORE VARIATES THAN ONE: BIVARIATE DISTRIBUTIONS, REGRESSION AND CORRELATION)

第 VII 章：样本与总体 I：抽样理论基础 (SAMPLE AND POPULATION. I: SOME FUNDAMENTALS OF SAMPLING THEORY)

第 VIII 章：样本与总体 II：t、z 和 F (SAMPLE AND POPULATION. II: t, z, AND F)

第 IX 章：方差分析 (ANALYSIS OF VARIANCE)

相关文章

《蒙特梭利系统：理论与实践》 The Montessori System：In Theory and Practice

《教育中的民族主义威胁》The Menace of Nationalism In Education

《古兰经》The Meaning of the Glorious Koran

You missed

回望伏龙山的青春注脚：《伏龙山讯2008年刊》

《马来亚之前途》 郑天忱

《马来亚印象记》

第 III 章：统计模型 I：二项分布 (STATISTICAL MODELS. I: THE BINOMIAL
DISTRIBUTION)

第 IV 章：统计模型 II：泊松分布：统计稀有性 (STATISTICAL MODELS. II: THE
POISSON DISTRIBUTION: STATISTICAL RARITY)

第 V 章：统计模型 III：正态分布 (STATISTICAL MODELS. III: THE
NORMAL DISTRIBUTION)

第 VI 章：多于一个变量：二元分布、回归和相关 (MORE VARIATES THAN ONE: BIVARIATE DISTRIBUTIONS, REGRESSION AND
CORRELATION)

第 VII 章：样本与总体 I：抽样理论基础 (SAMPLE AND POPULATION. I: SOME
FUNDAMENTALS OF SAMPLING THEORY)

《马来亚之前途》郑天忱