【Tips】

  • 对数据处理过程的一个小总结
  • 其中的函数等主要针对Excel

 一、观察数据

  • 观察数据的列名等各项信息,理解数据各个字段的含义

二、清洗数据

  • 选择子集

    • 选择需要进行分析的数据列
    • 对于不需要的列可以进行隐藏的操作
  • 列的重命名

    • 更改合适的列名方便进行数据处理
  • 删除重复值

    • 通过唯一标识数据进行重复信息的删除
    • 数据——删除重复项——选择依据列
  • 缺失值处理

    • 通过观察每一列的总数确定是否具有缺失项
    • 对缺失项过多的列可做删除处理
    • 对于缺失项较少的可做删除部分行或补全处理
      • 补全可通过Ctrl+G定位进行
  • 分列处理

    • ·对于多信息字段可以进行分列处理
    • 分列可选符号分列或固定长度分列
  • 异常值处理

    • 通过筛选功能快速定位异常值
  • 日期格式处理

    • 通过分列选项,将格式设置为YMD
    • 或设置单元格格式
  • 字符串和数值格式处理

    • 通过选择性粘贴进行处理
  • 截取数据处理

    • 综合运用LEFT、RIGHT、MID、FIND、LEN等函数

版权声明:本文为tuzinn原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/tuzinn/p/13905250.html