本篇文章5516字,读完约14分钟

9月12日上午,南京金秋交易会“2017中国人工智能峰会(cais 2017)”在南京国际博览中心隆重开幕。本次峰会以“创新、变革和突破”为主题,有两个主题论坛,吸引了人工智能领域30多位著名科学家和商界领袖,1500多名专业访客报名参加。雷(公开号:雷)作为特邀媒体参加了峰会并做了报道。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

在会议上,南京大学计算机科学教授、欧洲科学院外国院士周志华回顾了人工智能的发展和机器学习兴起的根源,并介绍了“学习件”的概念。周志华教授说,经过人工智能发展的第一个阶段,即20世纪60年代,机器的推理能力达到了人类的巅峰水平,然后人工智能先后进入了知识工程和机器学习阶段。在大数据时代,机器学习取得了巨大的进步,这直接导致了今天人工智能的热潮。然而,仍然存在许多技术限制。为此,周志华教授提出了“学习器皿”的概念,期望经过10到15年的探索后,进入一个新的局面。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

周志华教授还引用了现场的一组数据。在今年的国际学术年会上,中国国内研究论文数量首次超过美国,几乎占世界的三分之一,其中北京约占30%,江苏省占14%,位居中国前两位。周志华教授认为,江苏拥有国内领先的人工智能研究力量和国内领先的人工智能产业基地。“在中国各省,同时具备这两个条件的地方并不多。”

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

以下是雷锋编的主要内容。根据大会授权的周志华教授演讲的现场录音:

我从事人工智能的研究。人们经常会问,“人工智能何时会比人类更聪明?”这样的问题对我们来说很难回答。为什么?因为说到人工智能,实际上有两种完全不同的观点,或者非常不同的观点。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

首先,我们称之为“强大的人工智能”。目的是开发和人类一样聪明甚至比人类更聪明的机器;另一个是“弱人工智能”,其主要目的是认为我们在做事时是聪明的,那么我们能从别人那里学习并在做事时让机器变得更聪明吗?事实上,在人工智能科学领域,人们主要探索第二个方面。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

有一个类比可能更容易理解:100多年前,人们看到鸟儿在天空飞翔,然后他们想知道我们是否能造出能飞的东西。经过空空气动力学研究,现在我们有了一架非常好的飞机。但是如果你现在问:这架飞机比鸟飞得好吗?这个问题可能很难说,因为尽管飞机比鸟飞得更远更高,但可能没有鸟灵活地飞行。然而,我们最初的目的已经实现了,我们已经有了可以帮助我们飞行的工具。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

人工智能所做的和这个非常相似,也就是说,我们看到了很多智能行为,希望能借鉴这些东西来做一些工具,帮助我们做更强大的事情。事实上,这是我们真正研究人工智能时的主要考虑。因此,人工智能研究的主要目的不是“人工智能”,而是“智能启发计算”,智能启发计算。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

在人工智能的三个发展阶段,从事人工智能的人在做什么?今天,我们通常说人工智能作为一门学科诞生于1956年。那时,计算机的能力还很弱,但是很多学者都在思考,如果计算机能力发展了,我们能做一些更复杂的事情吗?这些是什么东西?那年夏天,在达特茅斯学院举行了一次会议。在这次会议上,后来被称为人工智能之父的约翰·麦卡锡给这个课题起了个名字叫人工智能。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

经过60多年的历史,如果我们看看主流的研究内容,人工智能的发展大概经历了三个阶段:

第一个阶段可能是从20世纪50年代中期到60年代,这个阶段主要是关于逻辑推理。这是为什么?可能是因为我们的理工科学生对数学家有一种天生的崇拜,认为数学家非常聪明,能够证明一些非常复杂的定理,那么这背后的能力就是逻辑推理的能力。所以在那个时候,每个人都认为,如果我们能赋予计算机系统逻辑推理能力,那么这台机器在做事情的时候就会变得更聪明,所以当时有许多重要的研究成果,例如,图灵奖获得者西蒙和纽厄尔开发的程序“逻辑理论家”就是一个典型的代表。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

那么这种研究成果的水平是多少呢?在上个世纪,有两位伟大的逻辑学家,罗素和怀特海,他们写了一本名为《数学原理》的书,用逻辑构建了整个数学系统。为了证明这本书里的定理,他们花了十年时间,而这个程序只用了不到两个月的时间就证明了所有的定理,而且一个定理的证明比这两位伟大的逻辑学家所证明的更聪明、更简短、更容易阅读。因此,我们可以看到,在20世纪60年代,机器的推理能力已经达到了人类的巅峰水平。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

但是在那个时候,机器并没有真正变得非常聪明,所以每个人都慢慢意识到逻辑推理能力是不够的。就连数学家也不仅需要逻辑推理能力,还需要数学知识来证明数学定理。因此,人工智能的研究自然进入第二阶段。在这个阶段,每个人都在思考我们是否能总结知识并将其传授给计算机系统。因此,这已经进入了我们所说的“知识工程”时期,在这个时期,有代表性的人物,如后来的图灵奖获得者爱德华·费根鲍姆,他被称为知识工程之父。在这个阶段,我们主要做的是总结人类专家解决问题的知识,例如,“如果你看到红色从岩石中渗出,那么这一个可能是铁矿石”,总结这一知识,然后将其编入计算机系统,从而产生许多“专家系统”,真正解决许多应用问题。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

但是后来,慢慢地,每个人都发现总结知识并把它交给系统是非常困难的。一方面,有时我们人类专家可以解决一些问题,但可能不清楚这些知识是什么。一些人类专家可能不愿意分享他的知识。然后每个人都想,那么我们现在应该做什么呢?因为我们人类的知识主要是学习的,所以先驱者们自然会思考我们是否能让机器自动学习知识。因此,自20世纪90年代以来,人工智能的主流研究进入了第三阶段,这一阶段一直持续到今天,即我们的机器学习阶段。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

机器学习处于大数据时代,所以我们可以看到,机器学习最早诞生,它的出现解决了知识获取的瓶颈。机器学习的经典定义是“利用经验来提高系统本身的能力”。不管是什么样的体验,一旦它被放入计算机系统,它就必须以数据的形式存在。因此,如果机器学习想要研究如何使用经验,它必须分析数据。所以这个领域发展到今天,实际上,它主要研究如何用计算机来分析数据的理论和方法。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

我们可以看到,事实上,机器学习已经走上了历史的舞台,因为它是解决知识获取的瓶颈所必需的。然而,在20世纪末,我们人类发现自己淹没在数据的海洋中。我们需要分析数据,我们需要这样的技术。机器学习就在这个时候走上了舞台,所以它给我们提供了这个机会,我们对它的需求也迅速上升。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

今天,我们都说现在是“大数据时代”,但事实上,拥有大数据并不意味着获得价值。大数据就像一座矿山。我们拥有一个矿。如果我们想获得其中的价值,我们必须拥有强大的数据分析技术。这是什么数据分析技术?今天,我们主要依靠机器学习。因此,在大数据时代,机器学习技术对于数据工作是不可或缺的。因此,可以看出,机器学习可以说是无处不在,无论是互联网搜索还是人脸识别,或者是汽车的自动驾驶,或者是火星机器人的战场数据分析,包括美国总统大选甚至军事。只要你有数据,你就可以使用机器学习技术,只要你想用计算机来帮助你进行数据分析。可以说,我们今天在这里举办这个论坛,是因为人工智能现在非常热门,而人工智能也有这样的热潮。事实上,正是因为机器学习,尤其是深度学习技术,在过去的十年里取得了巨大的进步,并在大数据时代发挥了巨大的作用。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

我们现在有很多问题,很多企业都是基于深度学习技术,这可以解决很多问题,但是我们要注意深度学习、机器学习和人工智能之间的关系:深度学习是机器学习的一个分支,机器学习是人工智能的核心领域,但它不是整个人工智能技术。虽然深度学习取得了巨大的成功,但它不能赢得世界,还有许多其他的机器学习技术在许多方面发挥着作用。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

机器学习的技术局限和下一步发展。我想谈谈我个人的浅薄想法,这些想法可能是错误的,仅供你批评和参考。

当我们今天谈论机器学习时,许多熟悉机器学习的人会想到什么?有些人可能会想到算法,而有些人会想到数据。我们可以说,今天的机器学习以“算法加数据”的形式存在。在这种形式下,我们的技术存在哪些技术限制?让我列举一些。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

对数据的需求很大。首先,我们可能需要大量的训练样本。每个人都可能会说,今天我们处于大数据时代,所以大量的训练样本可能不再是问题。事实上,有几种典型的情况可以告诉我们,这仍然是一个大问题。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

首先,在某些应用中,我们的总样本量可能非常小。例如,当我们进行油田定位时,这些数据必须通过人工诱发地震获得,因此获得这些数据的成本非常高。有很多数据可以使用;

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

在第二种情况下,可能有很多数据,但我们真的不在乎。例如,当我们在银行进行这种欺诈检测时,银行每天可能有数百万的信用卡交易数据,但真正的信用卡欺诈数据可能很少;

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

在另一个例子中,我们有大量的数据,但是我们标记结果的东西很少。例如,我们必须做软件缺陷检测。我们有很多程序代码,但这些程序代码确实标志着缺陷。这样的数据非常少;

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

环境适应能力弱

其次,我们今天训练了一个机器学习模型,如果环境稍有变化,就可能导致这个模型的失败,至少会大大降低它的性能。例如,在我们这个只有一个传感器的世界里,我们放出了100个传感器,一个月后,60个传感器失灵了。这时,我部署了60个新传感器,所以你说我还是100个。我的原始模型能被使用吗?很抱歉,此时模型的性能将会大大降低,因为您很难将新传感器放在原来的位置,而且它发出的信号质量和强度也会发生很大变化。此时,我们的模型可能已经难以适应,所以这是另一个非常重要的问题。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

许多人都知道第三个问题,即解释能力差。今天的大多数机器学习系统都是黑匣子,我们可以做出预测,甚至是非常准确的预测。然而,我们很难解释为什么我们会做出这样的预测,这将使这样的系统难以在一些高风险的应用中使用。例如,我们必须做地震预测,我们说明天会有地震,所以请撤离。领导肯定会问你为什么做出这样的决定。如果这个模型是一个黑匣子,他只能告诉你,而我会告诉你,绝对是这样的。我不知道具体的原因。如果是这样的话,没有人知道它是否是盲目的,所以采纳这个建议肯定不容易。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

事实上,还有许多其他问题。例如,当我们今天使用机器学习技术时,即使对于相同的数据,普通用户可以获得的结果和专家可以获得的结果之间的差异可能非常大。如何使用这些数据以及如何使用这个模型,知识和经验的差异将导致结果模型的巨大差异。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

数据共享很困难。此外,还有一个问题可能会被更少的人提及。让我给你举个例子。例如,我们现在有一个大医院,他有很多病例数据。如果我们现在想做聪明的医疗,他可以根据这些数据做一个很好的诊断系统。但是,我们社区医院的病例数据可能比较少,所以很难直接根据其数据建立这样一个好的模型。社区医院说你的大医院能帮我?大医院说我愿意帮助你,但即使它愿意帮助,也可能很难帮助,因为一旦它想分享他的病例数据,它会立即涉及数据隐私、数据所有权、数据保护等等,所以有一堵数据共享墙。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

学习文档还有很多其他问题。在几个方面,我们今天有研究人员在做相关的探索,但是如果我们把所有这些方面分开,一个一个地解决,可能很难摆脱目前治疗头痛和脚的状况。所以我们想,有没有可能在一个整体的框架下综合考虑这些问题?最近,我们提出了一个想法,我们称之为学习软件。这是什么想法?许多人可能已经在他们自己的机器学习应用中建立了好的模型,并且他们愿意分享这些模型。假设我们有一个市场让每个人分享这些模型。当一个新用户想要做他自己的机器学习应用程序时,他不需要从头开始建立模型,但是他可以去“学习资料”市场寻找是否有合适的可以作为基础的。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

例如,如果用户想要找到切肉刀,他肯定不会在打铁的时候重建采矿刀,而是首先检查市场上是否有这样的刀。如果有合适的,那就更好了,即使没有合适的,例如,如果他找到一把西瓜刀,他可以把它拿回来,用自己的数据再“擦亮”,这可能会成为一个非常适用的工具。因此,这个想法的关键是部分重用他人的成果,而不必“从头开始”。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

为了实现这个目标,我们设想教科书由两部分组成,一部分是模型,另一部分是描述这个模型的规范。该模型需要满足三个重要要求:可重用性、可进化性和可理解性,并且协议应该能够为模型提供足够的描述。现在在技术上可能有一些初步的想法和探索,今天不会推出。如果学习真的能成为现实,也许我们刚才提到的所有问题都可以得到全面解决。我们预计,经过10到15年的探索,也许我们的机器学习将来可以从“算法加数据”的形式过渡到学习材料的形式。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

最后,因为我今天代表江苏省人工智能学会,我将在两分钟内谈谈我们江苏省的人工智能事业。我们可以做出两个判断:江苏省拥有全国领先的人工智能研究力量和全国领先的人工智能产业基地。在中国各省市,具备这两个条件的地方并不多。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

让我们给你看下面的一些数据,这些数据反映了人工智能的研究力量。在2017年人工智能领域的顶级国际会议ijcai上,我们在中国的地方单位的就业论文数量首次超过了美国,北京约占各省市地区分布的30%。江苏省有14%,排名第一和第二。让我们来看看过去几年的发展和增长速度。2013年,北京雇佣的报纸数量是江苏省的两倍多,2017年,江苏省雇佣的报纸数量是北京的两倍多。这在一定程度上反映了江苏人工智能基础人才的发展在过去几年可能会有一个快速的增长。江苏省人工智能研究所是在省科协的指导下于8月28日成立的,得到了省科技厅、经济和信息化委员会、民政厅等单位以及高校科研院所和企业的大力支持,这也体现了各方对人工智能发展的高度重视。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

人工智能时代最昂贵的东西是什么?最缺乏的是什么?答案大家都很清楚,那就是人工智能人才。可以说,没有好的“人工智能”,就没有好的“智能人工”。江苏省在这方面有很好的基础,所以我相信江苏人工智能的未来应该是光明的。谢谢大家。

周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

(雷锋。com)

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:周志华CAIS大会现场演讲:人工智能的探讨 | CAIS 2017

地址:http://www.hcsbodzyz.com/hcxw/7507.html