香港教育大學
善用大数据分析 规划学校持续发展
教育资讯
教育传媒
教育专业
教育专业25期
香港教育大学
郑志强博士
数据科学
大数据
自1970年代以来,计算机系统通过业务流程的自动化为各行业机构提供了竞争优势,从而为持份者及客户提供更高效、更具成本效益的服务。时至今天,很多机构的操作数据库 (operational databases) 已经积累越来越多的数据。学校的数据库也不例外,储存了大量有关教与学、学生支援及学业成绩的数据。现代企业机构均以分析及运营数据来优化及支持决策,作为获得竞争优势的一种手段。对于学校而言,分析这些教与学数据有助课程发展、改善教学策略及提升学生的学习成效。分析数据以发现新决策方案的重要性已被广泛运用,数据科学(Data Science)便成为新兴的学科,而以大数据(Big Data)分析生成的数据量和不同的格式更加成为研究发展的讨论焦点。
数据科学和大数据是现代社会的两大趋势。数据科学是一种从数据中推断出可操作的见解的方法,它是一门不断发展的学科,涵盖运用统计方法(Statistic)和算法(Algorithms)从结构化(Structural)和非结构化(Unsturtural)数据中提取及发掘知识。数据科学是一个技术、算法开发和数据干扰复杂融合的平台。数据科学的发展涉及各种工具和技术的运用,如数据挖掘(Data Mining)、机器学习(Machine Learning)和大数据。大数据内巨大的数据量,且各种数据的格式均存在差异,故此使用传统方法难以分析。但为什么我们使用大数据?这可以简单地回答,突出两个关键点。它提供了提取大量数据以获得关键和有用知识的能力。分析过程由机器学习(Machine Learning)管理,人工干预最少,因此分析更简单且无错误。
学校需要将他们的数据档案转变为知识来源,并用以规划学校持续发展。学校可以应用数据科学处理所产生的原始数据,去发掘学校管理及教学的知识,并建立学生学习模式,以了解教学成效趋势及潜在影响学生学习的因素等。学校有需要认识数据仓库(Data Warehouse),多维分析、在线分析处理(OLAP)数据挖掘、数据可视化(Data Visualization)、简单查询及用于报告和大数据技术的分析工具。这些技术允许涉及教学流程业务的单位和部门收集、存储、撷取和分析数据,以提高管理及教学决策能力。