== 发布时间:2016年08月05日 ==
您现在位置:首页-科研与评价-构建高等教育自学考试数据分析决策支持系统初探

构建高等教育自学考试数据分析决策支持系统初探

 

    要:我国高等教育自学考试(以下简称自学考试)开考30年来,培养对象和适应人群不断发生着变化,在当前我国高等教育日益普及的情况下,自学考试必须做出相应的调整与改革,才能为新一轮的事业发展提供可能。本文结合数据仓库及数据挖掘技术,提出对目前各类自学考试信息进行全面、多维的分析与研究并建立自学考试数据分析决策支持系统(以下简称分析决策系统)的构想,支持自学考试集成数据管理和全面查询分析,为各级领导在自学考试稳定规模、计划修订以及政策调整等诸多方面进行改革提供科学的决策参考和依据。

关键词:自学考试 数据仓库 数据挖掘 分析决策系统

 

进入21世纪以来,我省自学考试事业取得了长足的发展,报考规模始终在高位运行,为劳动者素质的提高和学习型社会的构建提供了强力支撑,自学考试制度也完成了从补偿教育终身教育的转变。近年来,省教育考试院提出了我省教育考试要争创全国第一的目标,并在《江苏省中长期教育考试招生改革和发展规划纲要》中对自学考试的结构调整提出了具体要求,提出今后必须不断深化自学考试内涵构建适应江苏特点,更加科学、实用的自学考试专业课程体系等等,要想完成这些改革任务,就必须以完善各类数据信息为基础,对我省现有的考生构成、课程设置以及助学单位运行状况等多方面进行综合的调查、分析与判断,掌握最全面的工作资料和最迫切的社会需求,使自学考试的改革更加贴近实际,坚持正确的方向。

一、建立自学考试分析决策系统的背景与必要性

1.目前自学考试信息系统的现状。自学考试工作开展多年以来,在各级领导的重视之下,信息化工作推进迅速,从最初的纯人工操作,到推行计算机辅助管理,近几年,随着网络技术的快速发展,又逐步实现了考生的网上报名并建成了考生网络信息平台,免考、毕生生审核等一系列考务管理工作相继实行网络化管理,为考生报考和考试机构的管理带来了很大的方便,提高了工作效率和准确性。但是,另一方面,目前各类信息系统也还有许多不尽完善之处,例如自学考试考场编排等核心考务工作的管理软件还没有集成到网络系统中来,数据进行二次转换与处理的工作量相当大,试卷征订等关键节点仍然需要人工干预才能完成,在上报和下达环节容易发生严重的考务差错,风险性很高。自学考试各个方面(如助学专业考试、专接本考试)考务管理软件各不相同,数据异构性、分散性仍然比较严重,特别是数据的综合利用率不高,大量的考生自然信息、考试过程信息等对自学考试改革很有说服力的数据信息被束之高阁,没有发挥任何作用。这些问题的存在,都需要考试部门和专业的研发机构进行全面的反思和改进。

2.建立自学考试分析决策系统的必要性与需求。为了能使自学考试更加贴近广大人民群众的需要,服务社会、服务学校、服务用人单位,吸引更多的考生加入到自考队伍,在当前高等教育普及化程度化不断提高、自学考试的生源日益减少的不利局面下,通过完善自学考试政策与服务水平,实现自学考试事业的新跨越,需要对现有的考生队伍构成状况、各专业、课程的考生学习和应考情况及助学单位的运行状况等进行分析,找到考生参加考试的难点和关键点,尝试进行满意度评价,从而探究部分考生不能坚持参考的深层次原因,并决定如何采取措施尽可能地预防考生流失,稳定考生队伍;另一方面,对即将要调整专业、课程等政策性安排时,也必须更好地与考生进行沟通,在提高办考效益的同时,尽可能地保护考生利益不受损害。总的来说,在调整自学考试办考方向、发展事业规模等诸多方面都需要在对目前的自学考试各类信息分析系统进行整合的基础上,充分利用数据资源,尝试构建更为科学的自学考试信息处理及分析决策支持系统,使考试机构更加贴近考生,能提供更多有针对性的帮助,增强考生的归属感,更为重要的是,通过该系统异常强大的多维分析和智能查询功能,为决策者的准确判断提供依据。

3.数据仓库及数据挖掘技术的发展为建立决策支持系统提供可能。随着信息技术的发展,数据仓库(Data warehouse,DW)和数据挖掘(Data mining,DM)的理论日益成熟,正成为一门应用广泛的热门学科,数据仓库理论打破了过去采用面向对象进行数据管理的旧模式,不仅仅针对应用,更多的是面对各个主题,对数据的综合利用率大大提高,而数据挖掘理论不仅是对数据的简单利用,更重要的是在数据当中发现趋势或一定的模式,找出新颖的、有潜在价值的关系模型,并通过这些转化为经营上的成果。目前,在零售业、银行业、电信业等行业中,数据仓库和数据挖掘得到了非常广泛的应用,对改善服务、稳定客户群以及发掘新用户有着很重要的意义,笔者认为,作为自学考试管理机构,同样可以引入数据仓库和数据挖掘的理论,更好地与考生、生源学校、助学单位等进行多向数据交流,特别是在专业课程设置、教材编写等方面形成与考生更有针对性的互动,对考生参加考试所呈现的通过率、毕业率等进行及时响应和预测,从而稳定考生队伍,在当前高等教育诸多形式竞争日益激烈的情况下,充分发挥自学考试灵活高效的特点与优势,扩大事业规模,在竞争中立于不败之地。

二、建立自学考试分析决策系统的总体规划

按照规范、集成、智能的原则,根据自学考试业务需求制定构建数据分析决策系统详细的工作流程计划,通过对历年的自学考试信息进行重新整理与构建,规范基础代码及知识库、形成自学考试基础数据库、考生统计数据库、专业课程统计数据库、统计上报数据、方法库等各类主题数据库,并进行提取和转化,实现自学考试的数据收集与分类建库,再通过对各个工作环节数据的动态管理和分析,加强对考生考试的指导,变被动接收为主动干预,让信息处理实现从面向应用的联机事务处理(on-line transaction processing,OLTP)到面向主题的联机分析处理(on-line analytical processing,OLAP)的转变,在完成各类考务管理工作的同时,重点能及时、准确地对各类数据进行智能分析和预判,提供风险评估和前景展望分析,为各级考试机构的决策制定提供科学依据 (见1)

 

三、实现自学考试分析决策系统的具体设想与架构

要建立更为先进和智能的自学考试分析决策系统,必须经过充分的论证,对现有的数据进行全面的准备,对决策的需求进行仔细的研究,制定可行的工作计划,逐步加以实施,并在过程中不断加强效果的监测与评估,据此,就系统的实施流程与所要实现的功能等,笔者提出了一些初步设想:

1.对各类自学考试信息进行重新整理与加工,建立起完善、齐备的自学考试数据仓库。一是对各类自学考试信息进行归类整理。自学考试的主要业务信息大体可归纳为四类:考生信息、管理信息、成绩档案信息和开考课程计划等各类业务过程信息等。考生信息包括考生自然信息、照片信息、报考专业、报考课程等,这些都是基本信息;成绩档案信息包括考生历次参加自学考试的成绩信息,特别是进入档案的合格课程信息,这些是另一类基本信息;业务过程信息是指考试过程中所产生的过程控制信息,如专业开考计划信息、课程对应教材信息、考生免考信息等,大都是局部信息;管理信息是基本信息和业务过程信息加工得到的,如考生转专业情况、平均考试时间、老考生巩固率等,是派生信息。(见图2所示)


           二是设计自学考试数据仓库的概念模型和逻辑模型。在对已有信息进行统一规范的基础上,首先对各类信息进行准确分类后,规范数据格式、统一数据接口,完成数据信息的提取、转换和净化,确定主题域及其之间的关系,建立概念模型,对现有数据库中的内容有一个完整而清晰的认识。为了准确描述自学考试数据仓库的主题,可以选择关系模型作为数据仓库逻辑模型,其中多维数据模型中的对象包括主题、事实、立方体、维、维层次、度量、属性等,以属性对象为例,可以建立考生构成结构分析、专业发展趋势分析等各个主题星型模型(如图3所示)。

 

三是完成自学考试数据仓库物理模型设计。选择一个成熟的数据库系统,满足其硬件需求,完成从逻辑模型到物理模型的设计,进行数据加载,建立起自学考试数据仓库。在此过程中,可采取其他的一些提高数据仓库性能的技术,如:合并表、建立数据序列、引入冗余、进一步细分数据、生成导出数据、建立广义索引等,为后期数据仓库的使用与维护打下基础。

2.对现有的各类自学考试信息管理系统进行重新整合、规划和设计实施。由于历史原因,我省现有的各类自学考试信息管理、数据维护和考务管理系统分为社会自考、助学专业以及专接本等多个方向模块,各个系统相互独立,需要大量的数据转换和对接工作,数据的集成性和可靠性低,因此首先必须对各个考务层面的应用软件进行梳理和改进,完善各个应用功能,在解决了考务集成管理的基础上,才有可能往分析决策等深层次的应用进行探索。目前,我省大部分的自学考试考务平台及考生信息平台都是基于WEB方式,采用B/S架构进行开发,因而,在建立了统一、规范的自学考试数据仓库基础上,要将不同类型、方向的考试应用整合到一起,继续采用WEB平台,实现考生信息资源共享和考试机构考务处理互通,而在应用层面,还可以结合教育考试标准考场的建设,发挥自学考试数据仓库和统一信息平台的作用,尝试采用考生指纹电子签到、网上评卷以及考试过程网络监控等等,推进自学考试管理的信息化程度,形成更加科学的自学考试考务管理体系。

3.完善与助学单位、考生的信息交流与互动。自学考试是个人自学、社会助学和国家考试相结合的教育制度,考生、助学单位以及考试机构便是这种教育制度下的最重要的三个元素,要想把握自学考试的最新动态,就必须了解考生的实际情况以及助学单位的实际需求,这离不开考试机构、考生和助学单位的互动交流,我们要建立起比当前更为畅通的信息沟通、反馈平台,接收更为及时的数据信息,充实自学考试数据仓库的广度及维度。例如:在目前已建成的考生网络管理平台的基础上,尝试建立自学考试手机平台,使考生通过手机也能进行报名、付费和信息查询修改等应用,更方便地与考试机构进行数据交换。

4.在完成自学考试各类应用整合的基础上,重点开发查询和分析功能。经过数据转换和聚合,将数据仓库中的相关数据,通过联机分析(OLAP),实现更为全面、客观和主动的查询及分析结果。数据联机分析是一种共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术,它允许管理决策人员对数据进行深入观察,从多个角度观察某一指标或多个指标的值,并找出这些指标之间的关系,使决策者对事业的运行有更准确的把握,从而制定正确的方案。在广泛比较的基础上,选择合适自学考试的OLAP工具,如Hyperion EssbaseOracle Express等,实现对自学考试的数据仓库进行快速的分析和查询处理。例如:对全省某个专业考生年龄构成的变化分析,对某个地区各个专业报考比例的变化分析,对各门课程的及格率和具体成绩分布的分析以及考试机构考务管理质量分析等等,通过对数据仓库查询和分析结果的展示,对自学考试的发展状况有更全面的了解。

5.进行更深层次的数据挖掘,初步实现自学考试数据分析和决策支持。借鉴当前在零售、银行、证券等行业部门已建成的数据分析决策系统的经验,自学考试数据分析决策系统建成后,主要有以下几个方面的应用:一是通过对考生信息数据的深入分析,设法稳定考生队伍,挖掘潜在人群。例如:近年省考试院在每次报名结束前对所有未报名的考生进行短信提醒,覆盖面很大,虽有一定效果,但总体成功率并不高,并且随着考生数据库的日益扩大,操作会越来越困难,而通过自学考试分析决策系统,我们就可以通过对全省考生参加考试的活动程度、考试成绩等多个方面进行综合分析,确定一批重点考生,对于他们,不仅要发报名提醒,而是要提供更为细致、周到的服务,如考生参考专业的政策调整通知、课程介绍与讲解以及考试未过关的课程进行试卷评讲等等,通过一对一的沟通,帮助他们克服难点,坚定信心,继续坚持参加考试。再例如,我们可以对某一个专业的报考人群进行分析,确定这一专业的重点报考对象,在自学考试宣传特别是进校园宣传时能更有针对性,提高宣传实效,最大程度的挖掘该专业的潜在生源;二是对考生和助学单位的需求迅速作出响应,能主动作出调整,使自学考试政策更加灵活和贴进实际。通过各类信息交流平台,对考生、助学单位有意或无意反馈的各类问题信息进行汇总分析,并由系统主动作出提醒和风险报告,帮助领导在一定范围内对相关政策进行调整,以更适应考生和助学单位的需求,化解各类矛盾。例如:当某一专业课程设置不合理,连续出现时间冲突,影响考生如期毕业时,通过信息反馈,考试机构能及时进行响应和调整;三是对新出台政策作出更为科学的效益分析。在进行新开专业设置和课程选择等工作时,我们可以借助分析决策平台,对新设专业的前景作一定的效益分析,有没有适应人群?所开设课程以往的参考率、通过率怎么样?预估通过率、毕业率,分析专业前景,从而对决策提供帮助。而对一些报名人数持续偏少的专业停考时,也可以提供更为准确的评估和预测,通过对该专业活动考生的查询和统计,确定停考的时间点和过渡办法,尽量减少社会矛盾;四是对各助学单位的教学质态和办考效益进行更为直观的评价管理。目前各个助学单位特别是主考学校的助学专业的招生、考试的情况基本都由各个学校自己掌握,考试机构所知甚少,如果有学校教学不认真、招生不规范甚至由于通过率过低产生的考生不稳定等问题只能靠学校上报才能发现,一旦学校处置不当可能会导致考生集体上访等不良后果,给自学考试声誉带来严重影响。而利用分析决策系统,各级考试机构可以对学校的招生、教学、考试等行为结果随时进行动态分析,在一些关键环节如某一届毕业率过低或某一课程及格率长期偏低等情况发生时,由系统进行主动预警,提前采取应对措施,防止矛盾激化;五是对考试机构考试管理质量的动态分析。自从我省实行自学考试目标评估以来,自学考试无论是质量还是规模都取得了显著成绩,但是在具体的评价标准上,除了报考规模比较直观以外,在考试管理方面评分则比较抽象,而有了系统的帮助,我们就可以结合各类数据信息,如考生的反馈意见,考务事项的办结率、满意率等诸多方面进行更为全面、公正、客观的评比,不仅提高了说服力,还可以帮助各级考试机构不断加以改进,提高办考质态和效益。

四、进一步展望与研究的方向

将来,随着我我省自学考试事业在十二五阶段不断有新的发展,我们可以根据历史及现存的数据进行更广、更深的挖掘和分析,如在防止生源流失方面,可以尝试对不同地区不同专业的考生人群进行细分,力争为每一位考生的独特需求设计量身定制的考试产品,针对考生的需求优化WEB网站和手机平台,根据考生考试周期,确定更科学的计划调整时间等等方面作出进一步改进和研究,更加方便考生学习和考试的安排。在政策调整方面,可以根据社会的需求,在和计算机、英语等各类证书考试信息管理的互通上进行深层次的研究,实现参加学历考试和证书考试的信息共享和平台互通,相互促进和发展,将自学考试学历认定和技能考核功能进行更有机的结合,充分发挥数据分析和辅助决策的巨大的优越性,为我省的自学考试事业以及教育考试事业中长期发展规划的实现打下坚实的基础。

 

参考文献

[1] 胡孔法. 数据库原理及应用[M]. 北京: 机械工业出版社,2008.

[2] 夏火松. 数据仓库与数据挖掘技术[M]. 北京: 科学出版社, 2004.

[3] 李昭勇. 决策支持与数据仓库系统[M]. 北京: 电子工业出版社,2001.

[4] 徐洁磐. 数据仓库与决策支持系统[M]. 北京: 科学出版社, 2005.

[5] 吴晓寅. 新形势下现代考务管理的策略选择[J].中国考试,2004(1):3-5.

[6] 构建自考生学习过程教育的运行机制[J].江苏自学考试,2009(3):34-36.

[7] 胡建平,符耀章. 浅淡信息技术在江苏自考中的应用[A].创新·实践·探索[C].南京:南京大学出版社 2008:389-393.

[8] 崔晓东.高等教育自学考试开展网上报名业务简析[A].创新·实践·探索[C]. 南京:南京大学出版社,2008:404-414.

 

(作者:程飞  扬州教育考试院)

 

 

1  基于数据仓库的自学考试决策支持系统的体系结构


院校风采