df.duplicated(subset=['name'])
✅ 默许检查整行能否反复,你也可以指定只看某几列,比如只看 name:
方法 | 作用 |
df.duplicated() | 前往反复布尔数组 |
df.duplicated(subset=['列名']) | 判别某列能否反复 |
df.drop_duplicates() | 删除反复行 |
keep='first' | 保留第一次出现的(默许) |
keep='last' | 保留最后一次出现的 |
keep=False | 一切反复行都删掉(无情形式) |
方法名 | 功能 |
sort_values() | 按“值”排序(最常用) |
sort_index() | 按“索引”排序(次常用) |
参数 | 作用 |
by='列名' | 指定排序的列 |
ascending=True | 能否升序(默许是True) |
inplace=True | 能否原地修正,不前往新对象 |
ignore_index=True | 重置索引(常用在排序后) |
na_position='last' | 缺失值排在最后(默许)或后面 |
参数 | 作用 |
left/right | 左、右两个要合并的 DataFrame |
on | 指定左右都有的“公共列”,用来对齐 |
left_on/right_on | 假如左右的 key 列名字不一样,用这两个指定 |
how | 合并方式:inner / left / right / outer |
suffixes | 反复列的后缀,例如 ('_left', '_right') |
合并方式 | 描画 |
'inner'(默许) | 取交集,只要左右都有的 key 才保留 |
'left' | 以左表为主,右表婚配不到的值填 NaN |
'right' | 以右表为主 |
'outer' | 取并集,左右都保留,婚配不到的填 NaN |
欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) | Powered by Discuz! X3.5 |