Python数据分析(一)
一、使用Python进行数据分析用到的库
python作为一门脚本语言,他拥有大量的库,用Python进行数据分析,同样有许多优秀的依赖库可以使用。
- NumPy
NumPy提供多种数据结构、算法以及大部分涉及Python数值计算所需的接口。 - pandas
pandas提供了高级数据结构和函数,这些数据结构和函数的设计使得利用结构化、表格化数据的工作快速、简单、有表现力。
pandas的主要对象DataFrame,它是用于实现表格化、面向列、使用行列标签的数据结构;以及Series,一种一维标签数组对象。 - matplotlib
matplotlib是最流行的用于制图及其他二维数据可视化的Python库。 - statsmodels
statsmodels是一个统计分析包。statsmodels包含经典的统计学。它所包含的模型如下。
- 回归模型:线性回归、通用线性模型、鲁棒线性模型、线性混合效应模型等
- 方差分析(ANOVA)
- 时间序列分析:AR、ARMA、ARIMA、VAR等模型
- 非参数方法:核密度估计、核回归
- 统计模型结果可视化
statsmodels更专注于统计推理,提供不确定性评价和p值参数。
以上库文件可用pip包管理器进行安装与更新。