【高中数学笔记】概率论基础
概率论是研究随机现象的学科, 它为我们认识客观世界提供了重要的思维模式和解决问题的方法,同时 为统计学的发展提供了理论基础概率论的研究目的是研究随机事件的概率,寻求随机变量的规律。 统计学是用科学方法收集、整理、描述和分析所得数据资料,并由此进行推断或决策的学科本章所要学习的主要内容就是如何收集数据, 根据所获得的数据提取有用的信息,作出合理的决策。
概率
古典概型
在一定条件下必然发生某种结果的现象称为必然现象,在相同条件下多次观察一种现象,每次观察到的结果不一定相同,称为随机现象。
为了探索随机现象的规律性,需要对随机现象进行观察。我们把观察随机现象或为了某种目的而进行的实验统称为试验,把观察结果或实验结果统称为试验结果。
在同样的条件下重复进行试验时,始终不会发生的结果称为不可能事件,记作 \(\varnothing\),一定会发生的结果称为必然事件,记作 \(\Omega\),可能发生、也可能不发生的结果称为随机事件。
在一次试验中,我们常常关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描绘,这样的事件称为基本事件。如果一个试验满足以下特征:(1) 有限性;(2) 等可能性。我们就称这样的试验为古典概型。
在古典概型中,如果有 \(n\) 个基本事件,如果某个事件 \(A\) 包含的结果有 \(m\) 个,那么事件 \(A\) 的概率有 \(P(A)=\frac{m}{n}\).
因此有以下结论:
- 不可能事件概率为 \(0\),即 \(P(\varnothing)=0\).
- 必然事件的概率为 \(1\),即 \(P(\Omega)=1\).
- 对任意随机事件 \(A\),\(0 \leq P(A) \leq 1\).
- 若 \(\Omega=\{\omega_1,\omega_2,...,\omega_n\}\),则 \(\displaystyle \sum _{i=1}^n P(\omega_i)=1\).
如果事件 \(A\) 和事件 \(B\) 不可能同时发生,则称这两个事件为互斥事件。如果两个互斥事件中有一个必然发生,则称这两个为对立事件,\(P(A)=1-P(B)\).
频率与概率
如果在相同的条件下进行 \(n\) 次重复试验,事件 \(A\) 出现了 \(m\) 次,那么称 \(m\) 为事件 \(A\) 出现的频数,\(\frac{m}{n}\) 为事件 \(A\) 出现的频率。
大数定律:在多次重复试验中,同一件事件发生的频率在某一个数值附近摆动,而且随着试验次数的增加,一般摆动的幅度就越小,而且观察到的大的偏差就越少,频率呈现一定的稳定性。
事件和的概率
\(P(A\cup B)\):事件\(A\) 与事件 \(B\) 至少有一个出现的概率。
\(P(A\cap B)\):事件 \(A\) 和事件 \(B\) 同时出现的概率。
概率的加法公式:\(P(A\cup B)=P(A)+P(B)-P(A \cap B)\). 如果 \(A\) 与 \(B\) 为互斥事件,则 \(P(A \cap B)=0\),\(P(A\cup B)=P(A)+P(B)\).
独立事件积的概率
如果事件 \(A\) 是否发生 对事件 \(B\) 发生的概率没有影响,那么我们称两个事件\(A,B\) 相互独立,并把这两个事件称为相互独立事件。
如果 \(A,B\) 为互相独立事件,则 \(P(AB)=P(A)·P(B)\),这个公式称为互相独立随机事件的概率乘法公式。
在相同的条件下,重复地做 \(n\) 次试验,且各次试验的结果相互独立。称作 \(n\) 次独立重复试验。在 \(n\) 次独立重复试验中,假设事件 \(A\) 发生的概率为 \(p\),则恰好发生 \(k\) 次的概率为 \(P_n(k)=C_n^kp^k(1-p)^{n-k}\).
随机变量与数学期望
随着试验结果变化而变化的变量称为随机变量,所有取值可以一一列出的随机变量,称为离散型随机变量。
若离散型随机变量 \(\xi\) 可能取的值为 \(x_1,x_2,...,x_n\),取到每个值的概率 \(P=p_i\),则称 \(E \xi = \displaystyle\sum_{i=1}^nx_ip_i\) 为随机变量 \(\xi\) 的数学期望。\(D\xi=\displaystyle \sum_{i=1}^n(x_i-E\xi)^2p_i\) 为 \(x_i\) 相对于 \(E\xi\) 偏离程度的加权平均,称作随机变量 \(E \xi\) 的方差,而 \(\sqrt{D\xi}\) 称为 \(E\xi\) 的标准差,记作 \(\sigma\xi\)。
统计
总和和样本
在统计问题中,我们一般把所研究对象的全体称为总体,总体中的每一个对象称为个体.从总体中抽出若干个体所组成的集合称为样本。我们用有限总体中所有个体的平均数来表示总体的平均状态,即一般水平,称为总体均值。 \[ \mu = \frac{1}{N}\displaystyle\sum_{i=1}^nx_i \] 各个个体与平均数 \(\mu\) 的差的平方的平均数叫作总体方差,记作 \(\sigma^2\),反映了各个个体偏离平均数 \(\mu\) 的情况。 \[ \sigma^2=\frac{1}{N}\displaystyle\sum_{i=1}^n(x_1-\mu)^2 \]
抽样技术
在实际研究中,我们可以从总体中抽取一部分个体进行研究,然后对总体进行估计。从总体中抽取的一部分个体所组成的集合叫做样本。样本中所含个体的个数称为样本容量,抽取样本的过程称为抽样。
科学的抽样方法必须使样本具有代表性,能客观的反应总体的情况。具体方法有:1. 随机抽样;2. 系统抽样;3. 分层抽样;
统计估计
统计估计是利用样本数据获取总体信息的重要手段.统计估计分为两类: 一类是用样本中某事件出现的频率估计该事件出现的概率,简称为概率估计(可能性估计);另一类是用样本的算术平均数和样本的标准差估计总体均值和总体标准差,简称为参数估计.
设样本容量为 \(n\),样本为 \(x_1,x_2,...,x_n\)。可以用其平均值 \(\overline{x}\) 作为总体均值的点估计值,用其标准差 \(s\) 作为总体标准差的点估计值。