您的位置:首页 > 营销百科
线上营销策划方案:上海网络推广对于数据的清洗与整理的看法
曼朗策划 2015-08-17

上回刚分享了一篇《知名网络营销公司介绍数据统计的意义》。今天上海网络推广介绍对于一个完善的数据平台而言,数据必须能够保证完整性、一致性、准确性和及时性,这4点也是数据质量的基本体现。这里除了及时性是与数据采集处理和任务调度的优化相关外,其他几项都是在数据的清洗和整理时需要考虑的内容。在进行数据清洗和整理前可以先用一些统计方法对数据的质量进行验证,通常叫做数据概要或者数据审核,在很多的ETL工具里包含了数据质量检查的功能。

在上海SEO优化看来数据完整性的问题一般体现在数据存在缺失值,比如获取了一月份的一张报表,显示以天为单位的数据,一月份应该包含31天,我们可以先验证是否有缺失的日期,可以通过统计唯①日期的个数,如果唯①日期个数小于31个就说明某个日期的数据缺失;之后再验证是否有某些指标的数值缺失,更简单的方法就是寻找空的单元格,在Excel里可以使用“查找和选择”里面的“定位条件”功能,选择“空值”直接可以定位到表中的空单元格,如果在数据库或日志文件里,某些空的数据可能用“NULL”等文本代替填充。

网络营销公司表示对于这些缺失值,为了之后的统计和分析的需要,我们可以通过某些方法进行填充,常用的有均值、中位数、众数,或者根据指标的变化趋势使用回归分析进行拟合后算出预测值,如果与其他的指标存在相关性,可以结合其他的指标进行估算。

猜你感兴趣的内容