手机号、银行卡号,表现为数,实质上是文,方便输入、排序。身份证号最后一位可以是X,相当于十一进制。
Excel以cell为单位,数据缺乏一致性,容易引发数和文混乱,很讨厌。用pandas读取Excel时,设置下dtype参数,避免手机号变科学记数。pandas.DataFrame.dtypes可以返回各列的dtype。至于用pandas.DataFrame.astype事后弥补,纯属浪费时间。
时间的混乱也是个麻烦事,2020-12-31,2020/12/31,20201231,pandas.to_datetime是个解决办法。
原文:https://www.cnblogs.com/ezhou/p/12852647.html