人工智能=人工+智能?

文: 教育传媒

专家分享 教育传媒 人工智能 Artificial Intelligence 机器 科技 ai 李嘉敏 林冰冰 香港理工大学 AlphaGo

「人工智能( Artificial Intelligence,AI)」一词最早诞生于1956年的DARTMOUTH学会上,探究的是如何让机器拥有像人类一样的智慧。但在早期阶段,由于计算机本身运算能力和存储处理速度不足,AI发展进程缓慢。随着科技的进步,计算机内部零件的体积缩小了好几倍且其计算能力提升了好几番,AI发展迅速。特别是2016年Google AlphaGo以比分4:1打败围棋棋手李世石后,全世界对AI风潮的追捧更上了一层,成为燎原之势,各个企业公司争相开发AI产品以抢占市场。然而,在追赶热潮的过程中不可避免地出现了一些瓶颈与障碍,值得我们深思。

香港理工大学工业及系统工程学系与企业合作的智能仓库项目,提供标注了人类、
货架与货物等不同类别事物的标签数据,帮助仓库机器人识别周遭环境,有效避障。


人工伪装智能


由于创建一个真正的AI产品并不是一件容易的事情,有些公司为了拉拢融资与抢占先机,鱼目混珠,用人力代替AI,让人类模仿机器。例如,Spinvox公司雇用人工听语音邮件并将其转换成文字短信,以伪装成AI语音识别产品;提供Chatbot行程自动设置服务的X.ai和Clara公司被曝用人力来假装程序;智能扫描收据的Expensify公司也是聘请低薪工人来转录数据。这些乱象的出现主要是源于开发人工智能需要面临大量的技术和业务挑战,假AI成本很低且能很快实现理想效果。但是,这样的行为不仅无法实现技术变革,打乱了市场,而且使得投资者对AI领域的投资更加谨慎小心,不利于实际的AI开发。要减少这些披着AI外壳的人工服务的存在,从人才培育角度来说,主要是要增设AI相关课程以及鼓励学生多参加AI开发方向的活动与研讨会。一方面,这些学生将来步入社会,可作为AI开发技术人员,为AI研发公司注入新血液,推动AI方面的技术革新,缩短开发周期,提升公司的研发信心;另一方面,学生作为未来社会劳动力市场的中坚力量,提升了他们对AI技术的认识,也可提高将来社会各界从业人员对新兴技术的理解,减少投资被骗的概率。

理工大学工业及系统工程学系研发的网络实体物流系统,综合考虑了历史配送路径数据和当前配送计划表,
建立配送路径优化模型。


人工训练智能


除了人为模仿的假AI外,市场上的各类AI产品背面也离不开人类的支援,因而有人也声称「有多少智能背后就有多少人工」。现任创新工厂董事长一职的AI专家李开复指出,AI的发展需要4个先决条件——海量数据、资料标注、专注在垂直领域上发展和有顶尖科学家的加入。目前通信技术与设备的高速发展使得数据获取相对容易,然而数据标注道路却是荆棘满途。 AI金字塔的底层基础是数据,数据标注识别之后,再交予机器学习算法训练调教智能。现阶段的数据标注主要依赖人力。在数据标注工厂,标注员们通常需要加班加点才能完成任务。 AI算法的优化取决于数据标注的精确性,可从事标注工作的一般都是完全不懂技术的门外汉。整个作业流程更像是传统手工行业,出错在所难免。参照投中研究院发布的数据,虽然在2018年上半年,中国人工智能行业获得了超过400亿元的融资,然而流入数据标注行业的总资金不超过1亿元。整体而言,数据标注技术的发展仍是滚芥投针。

目前,工业界的机器学习优化方法的主要步骤是先观察数据,然后总结规律,并依此建立模型,之后按照数据调整模型参数,最后将模型用于实际案例。这种主流应用主要依靠的是监督学习方法,通过人类标注好的数据并用算法训练机器,使机器变得越来越智能。在这种情况下,提供越多的数据就能让机器从中吸取更多的经验教训,不断强化改进,因而有人说:「大数据是好算法」。香港理工大学工业及系统工程学系研究员在研发网络实体物流系统,透过学习物流从业员的历史驾驶路径,从而优化配送路线。GPS数据可以作为原始资料来创建模型,而之后生成的新数据会源源不断成为新的输入资料来进一步调教机器,形成正向反馈。在整个监督学习过程中,人的干涉程度始终还是较高。


无人工也智能


AI可分为3个层次:一是弱AI,指擅长单领域的AI;二是强AI,指能在各方面与人类比肩的AI;三是超AI,指在所有领域都超越人类的AI。迄今为止,AI的发展现状是实现了部分强大的弱AI和非常弱小的强AI。备受瞩目的AlphaGo就是围棋领域里的弱AI里的翘楚,它不仅仅研习了人类历史上的所有棋局,还通过Monte Carlo Tree Search方法不断自我对战以提升棋艺。这表明了研发已经到达了无监督学习阶段,可用没有标注过的数据达到目标效果,无需人类的指导。Facebook的AI部门负责人Yann LeCun指出,AI的下一个变革核心是无监督学习、常识学习。 AI的训练过程类似婴幼儿培养。在早期阶段,需要家长引导,告诉它客观的一些概念、元素等,也就是监督学习阶段;而在后期,由于人类所掌握知识是有限的,需要年轻人自由主动探索世界、发现新事物,也就是无监督学习阶段。当前无监督学习发展较为滞后,技术不如监督学习成熟,因而精确度和有效性都较差。为了让机器学习脱离由人类所决定的极限,发展真正的通用智能,无监督学习研究仍任重道远。


小结


人工智能发展了60多年,经历了几度热潮与寒冬,诞生了许多影响深远的理论与算法。虽然有些公司在这时代热题中浑水摸鱼,用人工伪装AI扰乱市场,但是也有很多企业抓住机遇,培养AI人才,为AI技术的发展增砖添瓦。然而,现阶段的AI技术侧重于采用监督学习算法,需要大量人工标注数据,局限性较大。未来的AI发展将会将重心逐步转移到无监督学习算法,减少人类的干预,加强机器的自主性。

李嘉敏 博士
香港理工大学
工业及系统工程学系
助理教授

林冰冰
香港理工大学
工业及系统工程学系
研究员