登陆

懂Excel就能轻松入门Python数据剖析包pandas(十四):比照更新

admin 2019-10-31 166人围观 ,发现0个评论

转发本文并私信我"python",即可取得Python材料以及更多系列文章(金田一少年事件簿继续更新的)

常常听他人说 Python 在数据范畴有多凶猛,成果学了很长时间,连数据处理都费事得要死。后来才发现,本来不是 Python 数据处理凶猛,而是他稀有据剖析神器—— pandas

前语

有时候咱们需求比照两份数据有哪些不同值,在 Excel 中尽管没有完结比照功用,但经过公式也能够简略完结。不过你或许没想到的是,在 pandas 中完结比照功用,与 Excel 有殊途同归之处。


事例1

你含辛茹苦整理了一份数据表,发给了搭档,几小时后,搭档在表格中修正了某些单元格的值,然后扔下一句话:费事你看看修正的对不对?

  • 此刻你很想问一句:能够告诉我哪懂Excel就能轻松入门Python数据剖析包pandas(十四):比照更新些修正了?

Excel 中,咱们能够简略写一个等号,把两个表的值都比照一下:

尽管上述方法操作简略,可是你每次编写公式规模都要靠"手感"。现在看看 pandas 中怎样完结:

  • pandas 中的原理其实与 Excel 操作是相同的,不过咱们只需求写一次"双等号",pandas 会主动让2个表的每个值做比照

事例2

你会抱怨说,上面给我一堆 bool 值,有啥用?!你当然期望懂Excel就能轻松入门Python数据剖析包pandas(十四):比照更新看看那些被修正的值。上面代码简略修正即可:

  • cond = df_mdf != df_src , 这次咱们把判别条件写成"!=",是"不等于"的意思
  • df_mdf[cond] ,紧接着只要把那些"不等于"的成果放入"修正表",即可显现那些被修正的值

事例3

你的搭档喜爱给你"恶作剧",这次他发过来的数据表,不小心把人名的次序给打乱了:

  • 现在修正后的表格数据,是按销量降序摆放

这次咱们不能直接依据方位判别,不过只需求简略调整即可:

  • 要害1(红线部分),加载数据时,把榜首列作为行索引
  • 要害2(蓝线部分),让"乱序表"按"原始表"的索引重置一下
  • 其他部分不变

实际上,pandas 中的判别是依据队伍索引主动对齐


事例4

有懂Excel就能轻松入门Python数据剖析包pandas(十四):比照更新时候,搭档不会给你完好的数据表,他只提供修正的记载:

这次你不再需求关怀哪些被修正了,而是怎样把修正后的成果更新到"原始表"。

pandas 当然不会让你绝望:

  • 要害在最终一行,DataFrame.update() ,按传入的 DataFrame 作为规范,更新原始表
  • 时间谨记,全部按队伍索引主动对齐

你会发现,即使是非常复杂的表头,也能完结这些操作,由于 DataFrame 能够包括各种多层队伍索引。因而,这事例中的列次序有改变,相同能够完结操作


假如期望从零开始体系学习 pandas ,这个 pandas 专栏不容错失。内含多个数据剖析事例。


总结

  • 留意懂Excel就能轻松入门Python数据剖析包pandas(十四):比照更新 DataFrame 的队伍索引,一切操作都自带索引对齐功用
  • DataFrame.update ,能以另一个 DataFrame 为基准,做更新操作

需求源码的小伙伴请转发本文并私信我"python"

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP