数据资源平台建设目标
- 实时掌握组织内核心的数据资产
- 实时把我数据资产的动态业务价值
- 以数据价值驱动业务创新发展
数据资源平台建设理念
- 汇聚全程异构数据
- 数据治理,融合贯通
- 全量数据,资产管理
- 数据智能,应用服务
智能数仓 + 全景监控
- 数据质量要求
- 数据质量保障
- 数据质量检查
- 数据质量提升
常见数仓分层模型方法论
- 面向业务
- ADM 层
- Application Data Market 数据仓库应用数据集市层,完全贴合前端业务应用
- 面向应用提供数据服务
- 关键词: 高度汇总,应用指标
- DWS 层
- Data Warehouse Subject 数据仓库主题数据层。按分析对象对实体进行数据整个,轻度汇总
- 面向应用提供数据服务
- 关键词: 轻度汇总,公共汇聚指标
- ADM 层
- 面向数据
- DWD 层
- Data Warehouse Detail ,数据仓库明细层数据。面向数据进行数据域分类,整合,清洗,形成一套标准化数据模型
- 关键词: 数据模型标准化、建宽表
- ODS 层
- Operational Data Store,操作型数据,指结构与源系统保持一致的全量数据
- 对STG层数据进行数据全/增量合并以及数据清洗和标准化动作
- 关键词: 溯源、标准
- STG 层
- STAGE,结构与源系统保持一致的增量数据。汇聚业务系统源头数据
- 是ETL加工过程的缓冲区
- 关键词: 汇聚、缓冲
- DWD 层
模型设计规范 - 智能数仓
定义数据元,描述关键业务对象和业务对象属性的数据表达方式和业务语意,规范标准数据字典,便于平台和数据管理者管控治理后数据的一致性和数据质量,同时对模型的设计醚产能明规范性进行标准化约束
模型建设标准规则 - 智能数仓
数据模型管理在数据标准的约束下,表征数据模型的可持续性的维护性及可读性,在数据模型管理模块对整体模型进行层次结构设计、逻辑模型定义等,保证不同的逻辑数据模型设计人员按照统一口径进行操作。
数据质量监控 – 智能数仓
质量规则设计
- ODS 层: 关注数据断流情况,设置重点数据表的表行数监控,保障数据的时效性
- DWD 层: 关注数据股反省,设置数据字段针对关联数据元的数据字段值、数据长度等进行检查
- DWS层: 关注数据准确度,对数据值的值域范围、最大最小阈值等情况进行监控,减少异常值出现
DataQ 智能标签-面向业务提供高价值数据服务
OLT(实体、关系、标签)
数据探索
- 智能数据: 经各系统数据源加工后的数据,业务人员使用智能数据进行参数筛选后作为探索的分析对象,如 “吸毒前科人员”,“赴京人员"等
- 智能算子: 将民警经常使用的数据查询服务、以及计算逻辑、算法服务、AI服务、文本挖掘、时间计算进行语义化封装提供给民警使用,例如: 名单碰撞,地址标准化,聚合计算,文字关键内容挖掘,交并差等。
- 业务模型: 在数据探索中,对智能数据(一般是通过标签筛选后的实体智能标签和各系统的数据底盘查询),按一定业务思路选择智能算子,编排组装得到的一套业务方案,称为业务模型(例如: 疑似社区涉毒人员发现模型,疑似xx等)
- 模型结果集: 用户通过运行编排的业务模型得到数据结果集,可以发布成周期任务(每日)运行,或者导出成excel文件供警员使用,或将结果传输至其他平台或者大屏作进一步研判分析。