Python数据分析(一)


Python数据分析(一)

一、使用Python进行数据分析用到的库

python作为一门脚本语言,他拥有大量的库,用Python进行数据分析,同样有许多优秀的依赖库可以使用。

  1. NumPy
    NumPy提供多种数据结构、算法以及大部分涉及Python数值计算所需的接口。
  2. pandas
    pandas提供了高级数据结构和函数,这些数据结构和函数的设计使得利用结构化、表格化数据的工作快速、简单、有表现力。
    pandas的主要对象DataFrame,它是用于实现表格化、面向列、使用行列标签的数据结构;以及Series,一种一维标签数组对象。
  3. matplotlib
    matplotlib是最流行的用于制图及其他二维数据可视化的Python库。
  4. statsmodels
    statsmodels是一个统计分析包。statsmodels包含经典的统计学。它所包含的模型如下。
  • 回归模型:线性回归、通用线性模型、鲁棒线性模型、线性混合效应模型等
  • 方差分析(ANOVA)
  • 时间序列分析:AR、ARMA、ARIMA、VAR等模型
  • 非参数方法:核密度估计、核回归
  • 统计模型结果可视化
    statsmodels更专注于统计推理,提供不确定性评价和p值参数。

以上库文件可用pip包管理器进行安装与更新。


  目录