pandas 实现将两列中的较大值组成新的一列,


最近一个开发需求中要求用pandas实现该需求:

逐行对比两列,选出每行两列中较大的值加到第三列

翻了下好像没有类似的函数,所以没办法要自己造轮子,直接上代码和注释

# 需要对比的值为value_x和value_y
# 新家的列名为value_final
# 1.设置一个flag,值为value_y-value_x,为正代表y较大,负代表x较大
df_test['value_flag'] = df_test['Value_y'] - df_test['Value_x']
# 2.分别取得y较大的部分和x较大的部分
df_test_bigger = df_test[df_test['value_flag'] >= 0].copy()
df_test_litter = df_test[df_test['value_flag'] < 0].copy()
# 3.分别对final进行赋值
df_test_bigger['Value_Final'] = df_test_bigger['Value_y']
df_test_litter['Value_Final'] = df_test_litter['Value_x']
# 4.使用concat函数将其聚合
df_test_1 = pd.concat([df_test_bigger, df_test_litter])

补充:pandas技巧--两列相加形成新一列(eval)

如下:

data.eval('新字段=字段1+字段2',inplace=True)
data.eval("""新字段1=字段1+字段2
  新字段2=字段1+字段2
  新字段3=字段1+字段2""",inplace=True)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持3672js教程。如有错误或未考虑完全的地方,望不吝赐教。

您可能感兴趣的文章:
  • pandas DataFrame实现几列数据合并成为新的一列方法
  • pandas分组排序 如何获取第二大的数据
  • 使用pandas忽略行列索引,纵向拼接多个dataframe
  • pandas group分组与agg聚合的实例
  • Pandas groupby apply agg 的区别 运行自定义函数说明
  • pandas groupby分组对象的组内排序解决方案
  • pandas组内排序,并在每个分组内按序打上序号的操作

评论关闭