一种大数据的治理方式。 步骤如下:
- 根据需要、标准创立新的数据库结构
- 拿取原表中的字典型数据(只存各种编码的小数据库)、关联、约束等结构相关的内容,不拿原始的记录型数据(包含实际内容的记录)。根据表间关系,找到关联的起始表(如用户id表)
- 在新数据库中根据上述内容创建初始结构,并根据起始表找建立树状关系,对原数据库抽样(记录型数据)
- 将抽样数据挪入新数据库
- 在新数据库中建立新需求的Schema,将原数据表结构映射过去
- 利用新的Schema进行业务流程的验证、数据质量验证、数据生产验证,以提高效率
备注:
- 这tm都能写个专利