去除重复值
data.drop_duplicates()#data中一行元素全部相同时才去除
data.drop_duplicates([‘a‘,‘b‘])#data根据’a‘,‘b‘组合列删除重复项,默认保留第一个出现的值组合。传入参数keep=‘last‘则保留最后一个data.drop_duplicates([‘a‘,‘b‘],keep=‘last‘)
len(data) 不去重函数
data[" "].values 提取某一列 array
len(np.unique(data[" "].values))
原文:https://www.cnblogs.com/CrazyJioJio/p/12058950.html