新闻网 / 媒体视角

媒体视角

北京建筑大学:从数据中找到“黄金” 构建高校数据治理框架

来源:高校信息化应用 供稿:魏楚元 彭升辉 任彦龙 谢烈虎 孙绪华 审核:高蕾 发布时间:2019-05-22
阅读次数: 【字号:

北京建筑大学:从数据中找到“黄金” 构建高校数据治理框架

 

摘要

  近年来,大数据在我国迅速发展,各行各业都高度重视数据的挖掘和价值分析。大数据的概念深入人心,人们对数据的期望值大幅度提升。在大数据时代背景下,大数据分析为高校办学决策带来了新的机遇和价值。数据作为学校核心资产,对提升现代大学治理能力与治理水平现代化具有重要意义。本文通过对数据管理能力成熟度评估模型进行分析研究,并以此模型作为指导,分析高校在数据治理水平上的优势与劣势。从技术架构、组织架构和治理制度,为研究和分析高校数据治理构建了一个相对完整的治理框架,为高校数据治理提供一种可参考的方法。

 

  在数据时代背景下,高校信息化建设逐步向智能化、大数据挖掘方向发展。在此情况下,智慧校园的概念被提出。智慧校园区别于数字校园的关键在“智慧”上。智慧校园建设,主要技术特征体现在云计算、物联网、大数据、智能化、移动互联等五个方面。智慧校园建设追随当前时代技术的进步,这是区别于数字校园时代的代表性技术。云计算作为先进分布式计算技术为智慧校园信息平台运行计算提供了更强大的环境;物联网将致力于解决校园环境下物理设备的连接与感知;移动互联将校园师生带入到移动终端连接的互联网世界;智能化使得师生对智慧校园建设易用性、体验感、先进性提升到更高的期望。而大数据这热门的概念,从高校管理层到普通师生,期望从数据中找到“黄金”。我们有理由认为,数据价值挖掘与分析支撑办学决策、服务师生,正是智慧校园建设最重要的“黄金”,也是“智慧”的根本所在。

  纵观高校信息化过去二十年的发展历程,高校信息化建设从业者一直致力于数据管理工作,期望能消除信息孤岛,最大化利用数据价值。在数字校园建设时期和如今智慧校园建设时期,对数据管理的期望都是一致的。而在大数据时代,对数据期望更高,更迫切。在数据管理上,高校面临的问题一直存在,从体制机制上数据不开放不共享、数据孤岛依然严重;从数据管理层面,数据不完整、不一致、数据更新不及时等数据质量问题依然突出;数据来源众多且分散,缺少真正有效的整合;数据从生产到使用,中间流程不清晰,数据融合困难等。如此众多的问题长期未得到有效解决,形成了“表面上喊数据重要”而事实上“数据价值无从体现”的尴尬局面。实际上,从业界到高校都未找到破解难题的方法。今天大数据概念的火爆,引发了高校管理层对大数据价值的更高期望,师生对大数据的价值也充满期待。高校信息化从业者急于找到解决现实问题的方法,对数据管理依然迷茫。纷纷提出如下疑问:学校数据管理的水平到底处在什么层次?数据团队如何建设?数据管理应该制定哪些制度?如何提升数据质量?如何建设数据标准?面对这些问题和疑问,数据治理的方法显得尤为重要。

  本文从分析数据管理能力成熟度模型入手,分析高校在数据治理上的优势与问题,提出一种高校数据治理的框架,为高校大数据分析提供参考。

  图1 数据管理能力成熟度模型

 

  数据管理能力成熟度模型及其分析

数据管理能力成熟度模型

  《数据管理能力成熟度评估模型GB/T 36073-2018》给出了数据管理能力成熟度评估模型以及相应的成熟度等级,定义了数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准和数据生存周期等8个能力域,如图1所示。其中8个能力域又包括29个能力项,如表1所示。

 

  表1 DCMM 能力域和能力项

 

  数据管理能力成熟度评价划分为5个等级:初始级、受管理级、稳健级、量化管理级和优化级,具体包括以下几个方面。

  1.等级一:初始级。组织没有意识到数据的重要性,数据需求的管理主要是在项目级来体现,没有统一的数据管理流程,存在大量的数据孤岛,经常由于数据的问题导致低下的客户服务质量、繁重的人工维护工作等。

  2.等级二:受管理级。组织已经意识到数据是资产,根据管理策略的要求制定了管理流程,指定了相关人员进行初步的管理,并且识别了与数据管理、应用相关的干系人。

  3.等级三:稳健级。数据已经被当作实现

  组织绩效目标的重要资产,在组织层面制定了系列的标准化管理流程以促进数据管理的规范化,数据的管理者可以快速地满足跨多个业务系统,准确、一致的数据要求,有详细的数据需求响应处理规范、流程。

  4.等级四:量化管理级。数据被认为是获取竞争优势的重要资源,组织认识到数据在流程优化、工作效率提升等方面的作用,针对数据管理方面的流程进行全面的优化,针对数据管理的岗位进行关键绩效指标(Key performance indicator,KPI)的考核,规范和加强数据相关的管理工作,并且根据过程的监控和分析对整体的数据管理制度和流程进行优化。

  5.等级五:优化级。数据被认为是组织生存的基础,相关管理流程能够实时优化,能够在行业内进行最佳实践的分享。

高校数据治理分析

  数据管理能力成熟度模型给出了一个组织数据管理、应用能力的评估框架,通过数据能力成熟度模型,组织可以清楚地定义数据当前所处的发展阶段以及未来努力的方向。该模型可以作为高校数据治理的一把尺子和一面镜子。对照该模型,能够很好地对大学的数据管理能力成熟度进行评估,也能促进高校数据管理能力的持续提升。结合该模型,我们对高校数据治理的现状给予初步分析。

  1.数据战略。将数据上升为学校战略层面,在国内高校比较少见。高校信息化普遍领导机构为网络安全和信息化工作领导小组或者信息化建设领导小组,具体数据职能部门基本上为信息化办公室或网络信息中心,承担信息化建设职能,鲜见有专门的数据战略或数据职能机构。北京师范大学、西安交通大学等极少数高校专门成立校务数据中心,在数据战略建立和实施上树立了标杆。数据作为全校的核心资产,学校层面制定数据战略并进行全方位推进极为重要。

  2.数据治理。数据治理作为一种重要的理论和方法,为数据建设与管理提供了可行的路径和方法指导。近年来,数据治理被赋予更多关注和重视,对厘清高校数据管理问题具有重要的指导意义。目前很多高校处于数据管理层面而非形成数据治理的组织架构和数据治理的制度。

  3.数据架构。高校普遍建设有共享数据中心(主数据管理平台),各业务系统数据以共享视图或Web Service接口方式进行共享,形成数据从分布到共享的架构。但是,对元数据的管理,数据共享的深度还不够,如学籍变异数据准确无误共享、科研项目中的经费在财务系统与科研系统完全打通等尚未很好实现。

  4.数据应用。数据应用的水平局限在业务系统层面,未形成很好的合力,在综合决策分析上发挥更好的效益。数据虽然在一定程度上共享,但是主数据管理平台中的数据尚未能形成很好的数据开放共享服务。

  5.数据安全。数据安全建设上存在短板和安全隐患,在数据收集、存储、传输和使用过程中缺乏必要的防护措施,使得大量敏感信息、个人信息的安全性无法得到有效保障。在技术层面上,缺乏深度的数据审计机制,数据安全隐私保护、数据库安全访问策略等建设隐患较多,亟需加强。

  6.数据质量。数据质量是高校数据治理面临最大的问题,数据质量是数据治理的生命线。数据质量问题普遍存在,不解决这些数据质量问题,高校信息化建设乃至大数据分析将难以达到理想的效果。

  7.数据标准。虽然制定有数据标准,但是数据标准的执行力度欠佳,数据标准的管理、更新维护能力欠缺,数据标准在某种程度上形同虚设;业务系统的更替,往往数据标准要适应业务系统,而非业务系统建设时以数据标准为主的现象依然普遍。

  8.数据生存周期。数据生存周期对数据运维能力提出了重要挑战,对历史数据的保存和管理,保持历史数据版本及其延续性,具有极为重要的价值。目前普遍缺乏对数据生存周期的科学管理方法和管理手段。

  从以上几个方面来看,高校数据管理水平参差不齐,距离量化管理级和优化级仍然有相当大的差距。数据管理能力成熟度模型的指标和参考项,对高校数据治理具有极为重要的指导价值和参考意义。

 

高校数据治理框架

  数据治理是近几年来逐步得到重视的数据资产管控方法。数据治理是对数据资产管理和控制的活动集合,包括计划、监控和执行等。数据治理是对数据资产进行管理的组织行为,涵盖数据采集、使用到清理的数据全生命周期的政策和流程。数据治理不同于数据管理,数据管理是一种角色和职责,确保在数据治理的指导下提供具有较高数据质量的可靠数据。数据治理则更加全面和深入,强调的是通过治理过程达到良好的数据管理能力成熟度模型中的较高等级,并提升组织的资产回报率。

  可以说,数据质量是数据管理中的重要问题之一。提升数据质量,除了通过技术手段,对数据不一致、数据丢失等进行监测和修复,更重要的是要全面通过数据治理手段,切实加强一个组织的数据管理能力建设,促进组织向着数据管理能力成熟度更高级别,有序规范提升数据质量,为数据提供办学决策发挥价值。

技术架构

  借鉴行业解决方案,结合高校特点,我们设计了高校数据治理技术框架,如图2所示。

  以高校数据治理为例,主要阐述高校数据治理的技术架构和方法。高校数据治理主要包括以下四大模块:

  1.数据源发掘与资产盘点。高校的教育、教学、管理活动构成了一个系统,在系统运行过程中产生了大量的数据,必须对这些数据源进行全面挖掘,找出这些可能存在的数据源的生产单位、管理单位、使用单位、受益单位。有些数据具有一定的隐蔽性、复杂性和综合性,如需要统计出师生平均在校内体育活动的时间,可能要对运动场、体育馆等多个体育运动场馆的数据进行采集,有些单位没有采集数据设备和手段,需要进行补充建设等。资产盘点需要对各系统的数据库、日志、文件等海量数据进行全面梳理。数据源的发掘、建设,数据资产的全面盘点,是做好高校大数据分析的重要前提。

  2.数据集成。数据集成主要是将盘点发现的各个系统的数据进行采集、清洗、交换至构建的中心共享数据库。结合高校的实际情况,采用两套技术平台分别进行处理。对于结构化数据,通常使用ETL构建结构化共享数据中心,将教务、科研、人事、财务、资产等多个重要业务系统的数据交换到共享数据中心;对于非结构化数据,如网络系统日志、视频图像、文本等数据,采用Hadoop/Mapreduce/MongoDB等大数据平台进行接入。

 

  图 2 高校数据治理技术框架

 

  3.数据治理。数据治理是高校大数据分析的关键措施。在学校整体数据战略的指导下,需要建立数据治理组织机构和人员队伍,明确数据生产单位、管理单位、使用单位、收益单位的责任、权利和关系,需要强化对数据质量的管理,对全量数据进行血缘分析、影响分析;还有数据模型建立、元数据管理、数据标准管理、数据安全管理等重要的内容。

  4.数据应用。通过前面几个阶段的工作,最终是促进数据的应用。数据应用主要包括数据可用性服务和数据价值发掘分析。数据可用性服务包括实现可配置的数据交换规则、数据可用服务接口设计,使得数据共享交换的过程简单、易操作,提升对数据分析的可操作性;数据价值发掘分析,重点是结合学校核心业务,设计好分业务主题模型和学校综合校情指数等业务价值模型,通过大数据分析展示价值,支持决策分析。

组织架构

  数据治理的战略层面,关键在于一个高校对数据的重视程度,是否将数据当作核心资产,数据逐渐实现战略化、资产化;并且大数据思维和应用已经开始逐渐渗透到学校管理层和学校治理范畴内,并且致力于发挥数据对学校治理理念、治理范式、治理内容、治理手段等产生的积极影响。高校数据治理的关键在于建立组织有力的管理架构和人员队伍,以实施、执行学校的数据战略。

  在学校网络安全和信息化工作领导小组下,建立数据治理工作组,其工作职责包括:全校范围数据资源的统一规划;学校数据信息标准、编码标准、技术规范、管理规范的制定和完善;为学校数据整合、共享、深度分析和综合应用提供服务保障;为学校各部门的信息化数据管理工作提供指导与业务支撑。数据之类工作组组织机构包括教务、科技、人事、学生工作、研究生、财务、资产等多个业务职能部门和学院,明确各个项目数据主管,建立协作开放合作机制,推动各个业务系统数据开放共享,推进各个业务部门数据源头的数据采集与数据质量负责制,真正推动数据从生产、交换、共享、使用、价值分析全链条数据质量管控,高效完成数据治理工作。

治理制度

  数据治理制度以文件形式明确数据战略实施下各个业务单位的责任担当。必须加强信息化数据的统一规划与管控,建立有效的数据共享、管理与保障体系,保证信息化数据的完整性、规范性和一致性,明确信息化数据的管理和维护责任,保证信息化数据质量,为学校教学、科研、管理以及持续发展提供准确、权威、及时、安全的数据与信息服务。

  近年来,大数据已成为国内外专家学者、产业界、各行各业研究的热点话题,如何充分挖掘和实现大数据的价值,是高等教育领域面临的新课题。本文主要以数据管理能力成熟度评估模型作为参考,简要分析了高校数据管理普遍存在的问题,找出了存在的差距和短板。在相关行业的经验基础上,提出一个可借鉴的高校数据治理框架,为高校数据治理提供参考。(责编:杨洁)

  (作者单位为北京建筑大学网络信息中心 魏楚元 彭升辉 任彦龙 谢烈虎 孙绪华)

参考文献:

  [1] 李建中,杜小勇.大数据可用性理论、方法和技术专题前言.软件学报,2016,27(7):1603?1604.

  [2] 李冰,宾军志.数据管理能力成熟度模型[J].大数据,2017,4:29-37.

  [3] 许晓东,王锦华,卞良,孟倩.高等教育的数据治理研究[J].高等工程教育研究, 2015 (5) :25-30.

 

媒体报道链接:http://mp.weixin.qq.com/s/ykTvyfK_2VQuueDQvjvxpg