scipy.stats
是 SciPy 库中用于统计分析的模块,它提供了许多概率分布、统计测试和描述性统计等功能。该模块的成员大致可以细分为:
- 概率分布:例如正态分布、指数分布、伽马分布、二项分布……
- 统计量计算:例如均值、方差、协方差、相关系数……
- 假设检验:判断样本之间是否存在显著差异,例如 t 检验、卡方检验、KS 检验……
- 拟合:拟合分布到数据,即从数据中估计分布的参数,例如最下二乘法拟合、最大似然估计拟合……
- 随机数生成:生成符合特定分布的随机样本
- ……
概率分布
scipy.stats 为每个概率分布函数实现了概率密度函数、累计分布函数、逆累积分布函数。
常见的概率分布函数如下:
连续分布
- 正态分布(Normal ~,
norm
) - 指数分布(Exponential ~,
expon
) - 伽马分布(Gamma ~,
gamma
) - 贝塔分布(Beta ~,
beta
) - 卡方分布(Chi-Square ~,
chi2
) - t 分布(Student's ~,
t
) - F 分布(F ~,
f
) - 威布尔分布(Weibull ~,
weibull
) - 对数正太分布(Lognormal ~,
lognorm
) - 均匀分布(Uniform ~,
uniform
) - ……
离散分布
- 二项分布(Binomial ~,
binom
) - 泊松分布(Poisson ~,
poisson
) - 几何分布(Geometric ~,
geom
) - 超几何分布(Hypergeometric ~,
hypergeom
) - 负二项分布(Negative Binomial ~,
nbinom
) - 多项分布(Multinomial ~,
multinomial
) - ……
统计量计算
描述性统计量
- 均值(Mean,
mean
) - 中位数(Median,
median
) - 众数(Mode,
mode
) - 方差(Variance,
var
) - 标准差(Standard Deviation,
std
) - 最大值(Maximum,
max
) - 最小值(Minimum,
min
) - 百分位数(Percentile,
percentile
)
相关性和协方差
- 协方差(Covariance,
cov
) - 相关系数(Correlation Coefficient,
pearsonr
)
偏度和峰度
- 偏度(Skewness /ˈskjuːnɪs/,
skew
) - 峰度(Kurtosis /kəˈtəʊsɪs/,
kurtosis
)
假设检验
单样本检验
- 单样本 t 检验(
ttest_1samp
) - 单样本 Kolmogorov-Smirnov 检验(柯尔莫哥洛夫 /ˌkɒlmɒˈɡɔːrɒf/, 斯米尔诺夫,
kstest
)
独立样本检验
- 独立样本 t 检验(
ttest_ind
) - Mann-Whitney U 检验(
mannwhitneyu
)
配对样本检验
- 配对样本 t 检验(
ttest_rel
) - Wilcoxon 符号秩检验(/wɪlˈkɒksən/, 秩和检验,
wilcoxon
)
方差分析(ANOVA)
- 单因素方差分析(
f_oneway
) - 二因素方差分析(
f_twoway
)
非参数检验
- Kruskal-Wallis 检验(
kruskal
) - Friedman 检验(
friedmanchisquare
)
卡方检验
- 单样本卡方检验(
chisquare
) - 独立性卡方检验(
chi2_contingency
)
正态性检验
- Shapiro-Wilk 正态性检验(
shapiro
) - Anderson-Darling 正态性检验(
anderson
)
拟合
每个分布都有自己的拟合函数,例如正态分布拟合(norm.fit
)、t 分布拟合(t.fit
)……
随机数生成
每个分布都有自己的随机数生成函数,例如正态分布随机数生成函数(norm.rvs
)……
评论区