大数据推动人口学创新发展

2019年07月12日 08:59 来源:中国社会科学网-中国社会科学报 作者:武勇

  随着互联网的广泛应用,大数据开始进入人口科学的研究视野。中国人口学发展现状如何?大数据的出现对人口学研究产生怎样的影响?中国人口学研究成果如何才能更具影响力和前瞻性?围绕这些问题,记者采访了相关学者。

  数据获取是难题

  中国是人口大国,人口学研究对我国人口、户籍、社会保障等方面的政策制定有着重要的参考价值。“在过去70年里,中国人口学研究经历了没数据没方法、有数据没方法、有数据有方法和有方法缺数据的不同阶段。”中国社会科学院人口与劳动经济研究所研究员王广州告诉记者,人口总量、结构和增长问题始终是困扰中国人口发展的重大基础性问题。

  党的十九大报告提出要“加强人口发展战略研究”,面对新时代新的人口发展形势,人口学研究具有广阔的空间。对于人口学研究者来说,基础历史数据的获取是摆在他们面前的一道难题。

  中国人民大学社会与人口学院副教授李丁表示,目前人口学研究对数据较为依赖,如大规模抽样调查数据、人口普查数据和政府行政管理数据等。谁能获得数据谁就占领了研究先机。

  王广州认为,人口问题始终是中国社会经济发展的基础性、全局性和战略性问题。当前有部分人口学研究结论经不起科学检验或推敲,如很多低水平重复研究和一味吸引公众注意的研究“成果”屡见不鲜,其根本原因是科学研究和科学训练不足。“严谨、深入的研究往往需要一个周期,但滥用数据、方法和不负责的研究则缺少对科学的敬畏之心。”北京大学人口研究所教授乔晓春认为,当前人口学研究的问题,既有数据质量问题,也有使用的研究工具太少、跨学科或交叉学科研究不足等问题。

  盲目使用人口大数据面临风险

  那么,大数据的出现是否会为人口学研究提供新的研究视角?受访学者对此表示,人口学要谨慎“赶时髦”。

  乔晓春认为,大数据在商业领域应用较多,但在科学研究领域具有局限性。大数据并不意味着“总体”,换句话说,大数据是有偏数据,不能科学地反映一般客观实际。大数据的最大陷阱,一是数据信度(质量),二是数据效度(有偏)。大数据对人口研究的作用有待观察。

  大数据可以及时回应社会关切,补充人口调查的一些不足之处,但王广州表示,需要注意的是大数据并不能回答所有现实人口问题,很多数据并不是按照特定的研究目标而收集的,因此在研究过程中,还需要已有人口学研究手段的检验和支撑。人口大数据研究是传统人口学研究的补充而不是挤压,只有滥用和垄断人口大数据资源以及盲目发布研究结果,才有可能对传统的人口学研究带来挑战。因此,盲目使用人口大数据可能面临较大风险。

  推动人口“微观数据”开放

  对于如何使人口学研究成果更好地服务于决策,乔晓春认为,要进一步推动脱敏数据的开放。开放数据一定要进行脱敏处理,而且应该通过立法进行保障。实际上,人口普查数据开放更多指的是微观数据的开放,而不是宏观数据。宏观数据实际上已经开放,但对于研究者来说远远不够用,研究者更需要微观数据。

  李丁表示,基础数据服务在大数据时代是最重要的公共服务之一,年轻一代的人口学者应该准备好在开放数据环境下做研究,而不是等、靠、要某些垄断数据。另外,人口学要扩展研究视域,一个可能的路径是将服务的重心由中央转向地方。

  王广州表示,人口大数据的优点是实时反映人口状态和人口过程的某些方面,因此在研究过程中,既需要对人口大数据进行深入研究,也需要其他数据的检验。随着科学技术的进步以及数据收集能力和手段的提高,相信在日益丰富和完善的人口大数据资源帮助下,人口学研究的技术手段必然越来越丰富,研究成果必然越来越及时,研究内容也必然越来越具有前瞻性,人口学创新和发展也必然会越来越落到实处。

    记者 武勇