首页 > 资料知识 > 分析研究
让大数据为居民消费调查赋能
来源:中国信息报     时间:2020年10月09日

    当前,随着数据量的爆炸式增长,大数据浪潮正汹涌而来,它不仅改变了人们的生活方式,同时也在影响着政府统计工作。居民消费调查是住户收支与生活状况调查的一部分,是一项重要的民生统计工作。在大数据背景下,居民消费调查面临着变化和挑战,笔者认为,与大数据的融合将是未来居民消费调查的重要发展方向。
  在居民消费调查中应用大数据,主要是探索将大数据作为抽样调查数据的重要补充。在高度开放共享的基础上,充分挖掘大数据资源价值,深入样本抽样、数据采集、汇总评估等各环节,对抽样调查数据进行补缺、校准、评估、推算,既保证数据质量、满足实际需求,又切实减轻调查对象和统计调查人员的负担。
  样本抽选。目前,如何准确研判村级单位“发展水平位次”,是样本抽选阶段的重点和难点。大数据时代,可充分利用行政记录信息和房产交易数据,综合采集村级单位集体经济发展状况、人均收入情况、二手房单价、外来户比例、低保户比重等相关指标,按城乡属性分别建立相应的发展水平位次排序运算模型,帮助县级专业人员进行全方位评估,提升排序的科学性和准确性,确保村级样本代表性。
  权数校准。一是通过税收记录取得高收入群体总体特征,对抽样数据进行评估和样本校准,取得权数校准因子,相应地调整现有样本中的高收入(消费)群体的权数,以提升此类群体的代表性。二是利用行政记录中样本户社保、个税等行业分布数据,结合问卷调查得到的家庭就业情况,分析样本行业分布与全社会总体情况的差异程度,对差异较大的加以校准,确保各行业就业人群的代表性。
  数据调用。通过共享平台,以身份信息为标识,实现样本个体数据的对接,直接提取相关指标的大数据信息,提升数据采集效率,减轻记账负担,提高数据精度。一是行政记录信息。比如,当前卫健部门的医疗消费记录已经相当完善,而这些数据又是记账中较为繁琐、易出错的部分,可以应用行政记录替代记账内容。二是机构和企业数据。电话费、宽带费等消费数据,可以从电信企业直接调用;从税务部门的购置税中,甄别提取购买生活用汽车的支出。
  数据插补。针对部分容易出现填报不准确的指标,通过大数据插补提高数据精度。一是房价估值。现有调查制度对自有住房市场现价与原值的差额采用折旧法,得出折算租金计入居民消费支出。目前,自有住房折算租金已在消费支出中占据不小的比例,对衡量居民生活消费水平至关重要。可以通过抓取房产交易记录数据,利用住宅板块、建筑面积、小区物业费、楼层朝向等信息建立数据模型推算出房屋市场估值,保证数据准确性。二是食品消费数量。食品支出是最为频繁的居民消费项目,而记账户往往关注消费金额而忽略数量。可使用大数据引入食品平均价格估算消费量,替代记账数量,不仅能确保一定的调查精度,也会大幅减轻记账负担,从而提高开户成功率。三是水、电、宽带、燃气等公用支出。通过相关公用企业,获取居民水、电、燃气缴纳费用数据,替代记账抽样数据。
  可以预见,推进大数据与居民消费调查的融合将是长期渐进的过程,需要我们付出不懈的努力,持续加以研究摸索和完善改进。一要转变思维方式,充分运用大数据思维推动居民消费调查改革发展,完善激励机制,择优定向培养,加快大数据人才建设。二要健全法律法规,赋予统计部门对于大数据的获得权,加强大数据采集、存储、使用的监管,拓展数据来源,保障数据安全。三要完善制度设计,加大行政记录信息和商业金融数据的应用力度,提升统计产品时效性,增强分析的广度和深度。四要开展试点实践,验证大数据应用方案的可行性、合理性及实际操作难易程度,对实践证明行之有效的方案,及时总结完善,再逐步推广。