如何校验SQL查询结果是否准确

如何校验SQL查询结果是否准确
总结平常工作中几种校验数据的思路

1、对比其他渠道数据结果


查询需求:从Hive端查询20190909当天的订单量(简单例子),需要校验SQL结果是否正确
校验方法:Hive的上游数据源为Mysql,Mysql端会有一些产出数据可供校验
如上数据流程下,如果在展现订单数据量的情况下,Hive执行查询结果需要验证,可以从Mysql渠道的数据结果进行对比来校验。
举的例子比较简单,但是属于校验数据结果的一个思路和方法。

2、分量累加比较总量
表结构:
订单ID 订单日期 订单渠道
1 20190808 A
2 20190808 A
3 20190808 B
4 20190808 B
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C

查询需求:查询每天,每个渠道的订单量
校验方法:可对每天,每个渠道的订单量进行累加,看看是否与当天总订单量相同

3、分步验证结果(A left join B left join C的情况)有订单表,商品表,用户表查询需求:查询电子产品,用户年龄小于18岁的订单明细校验方法:遇到这类查询场景,首先用订单表 Join 商品表,确定符合电子产品的订单明细以及数据量,这归结为第一步校验;在第一步校验基础上再关联用户表,筛选用户年龄小于18岁的条件,进行第二部校验。

推荐阅读