Pandas主要统计特征函数:

方法名 函数功能 sum() 计算数据样本的总和(按列计算) mean() 计算数据样本的算术平均数 var() 计算数据样本的方差 std() 计算数据样本的标准差 corr() 计算数据样本的Spearman(Pearman)相关系数矩阵 cov() 计算数据样本的协方差矩阵 skew() 样本值的偏度(三阶矩) kurt() 样本值的峰度(四阶矩) describe() 给出样本的基本描述(基本统计量如均值、标准差等)

cum累积计算函数

cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum()

方法名 函数功能 cumsum() 依次给出前1、2、… 、n个数的和 cumprod() 依次给出前1、2、… 、n个数的积 cummax() 依次给出前1、2、… 、n个数的最大值 cummin() 依次给出前1、2、… 、n个数的最小值

计算出前n项和:

D=pd.Series(range(0,20))
D.cumsum() 
0    0
1    1
2    3
3    6
....
19  190
dtype: int64

rolling滚动计算函数

rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。

方法名 函数功能 rolling_sum() 计算数据样本的总和(按列计算) rolling_mean() 数据样本的算术平均数 rolling_var() 计算数据样本的方差 rolling_std() 计算数据样本的标准差 rolling_corr() 计算数据样本的Spearman(Pearman)相关系数矩阵 rolling_cov() 计算数据样本的协方差矩阵 rolling_skew() 样本值的偏度(三阶矩) rolling_kurt() 样本值的峰度(四阶矩)

依次对相邻两项求和:

pd.rolling_sum(D,2)
0   NaN  
1   1.0
2   3.0
3   5.0
4   7.0
....
19  37.0
dtype: float64

以上这篇Pandas_cum累积计算和rolling滚动计算的用法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!