Pandas 解决dataframe的一列进行向下顺移问题

站长资源 2024/11/25 佚名

2 0 1

最近做比赛，有时候需要造出新的特征，而这次遇到的问题是将一列数据往下顺移一位。同时将开头缺失的那一个数据用其他方式填充。

df['feature'].shift(1)向下顺移一位，这时第一位会置为nan，需要填充。

----------------------历史分割线-----------------

错误方案：

当时首先想到的是用loc来直接进行替换，也就是

  i = len(dt)
 
  dt_new = pd.DataFrame()
 
  dt_new.loc[0, 'test'] = 0
 
  dt_new.loc[1 : i - 1, 'test'] = dt.loc[0 : i - 2， 'data'] #这里会报错

愿望很美好，现实很残酷，这种方法会报错。

不太好的方案：

于是打算用循环的办法一个一个替换

dt_new = pd.DataFrame()
 
dt_new.loc[0, 'test'] = 0
 
for i in range(len(dt) - 1):
  dt_new.loc[i + 1, 'test'] = dt.loc[i, 'data']

然而这个仅仅O(n)算法复杂度的东西，实际检验当用在几万行数据真的可以给你算好久好久，所以这个办法也弃用了。

正确方案：

pandas的dataframe，每一行是有序号的，直接进行替换的话，有时它会将相同序号的进行替换，这个是dataFrame的特性，有时会忽略从你选择的那一行开始替换，而直接从0开始。所以如果想用pandas来进行顺位移动的话，目前没有在API中找到便捷的方法。

最后终于想到了另外一个办法，就是转化为Numpy数组进行移动后，再转回dataFrame。

  dt_v = dt['data'].values
 
  dt_v = dt_v.flatten()
 
  i = len(dt)
 
  dt_new_v = np.zeros(i)
 
  dt_new_v[0] = 0
 
  dt_new_v[1 : i] = dt_v[0 : i - 1] #这里要注意Numpy数组截取[1, i]实际截取的是[1, i - 1]行！
 
  dt_new = pd.DataFrame()
 
  dt_new['test'] = dt_new_v

要注意Numpy数组截取[1, i]实际截取的是第[1, i - 1]行！

以上这篇Pandas 解决dataframe的一列进行向下顺移问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

Pandas,dataframe,向下顺移

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

评论“Pandas 解决dataframe的一列进行向下顺移问题”

暂无评论...

www.wwsws.com 伏龙阁资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

更新日志

2024年11月25日

Pandas 解决dataframe的一列进行向下顺移问题

pandas-resample按时间聚合实例

python 实现简单的FTP程序

评论“Pandas 解决dataframe的一列进行向下顺移问题”

更新日志

友情链接