Zaoqi's Blog -> Python数据分析教程 -> 图解Pandas ->
compare - 数据比较
compare - 数据比较¶
compare
用于比较两个数据框之间的差异,👉官方文档
在线刷题
检查 or 强化 Pandas
数据分析操作?👉在线体验「Pandas进阶修炼300题」
Note
本页面代码可以在线编辑、执行!
默认比较¶
输出 df9 和 df10 的差异
import pandas as pd
import numpy as np
df9 = pd.DataFrame(
{
"col1": ["a", "a", "b", "b", "a"],
"col2": [1.0, 2.0, 3.0, np.nan, 5.0],
"col3": [1.0, 2.0, 3.0, 4.0, 5.0]
},
columns=["col1", "col2", "col3"],
)
df10 = df9.copy()
df10.loc[0, 'col1'] = 'c'
df10.loc[2, 'col3'] = 4.0
df9.compare(df10)
col1 | col3 | |||
---|---|---|---|---|
self | other | self | other | |
0 | a | c | NaN | NaN |
2 | NaN | NaN | 3.0 | 4.0 |
保留数据框¶
在上一题的要求下,保留原数据框
df9.compare(df10, keep_shape=True)
col1 | col2 | col3 | ||||
---|---|---|---|---|---|---|
self | other | self | other | self | other | |
0 | a | c | NaN | NaN | NaN | NaN |
1 | NaN | NaN | NaN | NaN | NaN | NaN |
2 | NaN | NaN | NaN | NaN | 3.0 | 4.0 |
3 | NaN | NaN | NaN | NaN | NaN | NaN |
4 | NaN | NaN | NaN | NaN | NaN | NaN |
保留值¶
在上一题的基础上,再保留原始相同的值
df9.compare(df10, keep_shape=True, keep_equal=True)
col1 | col2 | col3 | ||||
---|---|---|---|---|---|---|
self | other | self | other | self | other | |
0 | a | c | 1.0 | 1.0 | 1.0 | 1.0 |
1 | a | a | 2.0 | 2.0 | 2.0 | 2.0 |
2 | b | b | 3.0 | 3.0 | 3.0 | 4.0 |
3 | b | b | NaN | NaN | 4.0 | 4.0 |
4 | a | a | 5.0 | 5.0 | 5.0 | 5.0 |
On this page