一种大数据的治理方式。 步骤如下:

  • 根据需要、标准创立新的数据库结构
  • 拿取原表中的字典型数据(只存各种编码的小数据库)、关联、约束等结构相关的内容,不拿原始的记录型数据(包含实际内容的记录)。根据表间关系,找到关联的起始表(如用户id表)
  • 在新数据库中根据上述内容创建初始结构,并根据起始表找建立树状关系,对原数据库抽样(记录型数据)
  • 将抽样数据挪入新数据库
  • 在新数据库中建立新需求的Schema,将原数据表结构映射过去
  • 利用新的Schema进行业务流程的验证、数据质量验证、数据生产验证,以提高效率

备注:

  • 这tm都能写个专利