江南大学科研院院长吴小俊教授从人工智能到机器人、大数据及其机遇、大数据时代的人工智能和近期热点等多个维度,深入浅出的为大家上了一堂人工智能公开课。
吴小俊教授表示,人工智能的研究领域经过几十年的发展,目前的主要研究领域有专家系统、自然语言理解、模式识别、计算机视觉、机器学习、机器人、博弈和游戏等细分领域。
他认为,人工智能已经发展演变到机器人时代,很多研发组织发布了形态各异的机器人,这些都将在具体的应用场景当中发挥能力,此外,他认为大数据为人工智能的带来机遇,必须利用好这些数据,让它为我所用,他还补充到,大数据的能量非常大,但是有很多机构进行了滥用,并且,大数据处理还出现了矛盾现象,所以,大数据对行业来说是机遇也是挑战。
与此同时,吴小俊教授还为大家分享了对于近期热点的观点,对于物联网,他认为正是物联网的出现,得以让智慧家居、智慧医疗、智慧农业走进千家万户,物联网还将引发新的革命,感知、定位等等AI技术都可以与物联网融合,这会让很多新的应用得到更快的发展。
最后,他总结到,人工智能发展的道路还非常长,深度学习不能代表人工智能的全部,我们对人工智能的发展充满期待。
今天的人工智能偏机器人。然后我给大家分享对大数据的理解以及大数据给我们带来的机会。后面谈一谈大数据时代的人工智能以及在最近一些研究和产业界的热点,最后给出总结。
首先我们看一下什么是人工智能呢。人工智能诞生于1956年,在美国像今天一样年轻的朋友在大特茂丝开了一个会议,才有了人工智能的词汇。关于什么是人工智能有很多定义,总体认为人工智能是计算机学科的一个分支,当然这些定义和内涵都在发生一些变化。
不同的人给出不同定义,但是整体来讲,认为是计算机的一个学科分支,人工智能是模拟甚至在一定程度上超越大脑的功能。这就是人工智能。
所以从这个意义和角度来说,人工智能就是让机器完成那些由人完成需要智能的科学。
人工智能最近在中国和世界取得了快速的发展,2016年被定为世界人工智能年。人工智能是一个多学科的特性,人工智能与刚才讲的计算机、与数学、哲学、生物学、语言学甚至跟经济学都有密切的关系,所以它是多学科的范畴。
人工智能从1956年从诞生到今天,从1956年到1970年是基础形成期,主要是逻辑为基础。这个阶段代表性的成果就是专家系统,就是利用我们的人工智能程序模拟某一个领域专家的知识,比如中医、采矿、化学的分子结构等等。
第四个阶段是知识工程预智能系统阶段,这个阶段应该说没有完全结束。这个阶段是快速发展阶段。
到了2006年在世界顶级刊物发表了一篇文章。对人工智能非常明显的划分。人工智能的研究领域是非常宽泛的,从专家系统、智能语言的理解,像人脸的识别,用计算机模拟我们大脑的功能,定理证明等等。我们老一辈的科学家吴文军(音)在定理证明作出贡献。还有我们的博弈、游戏,游戏跟我们的人工智能有非常紧密的关系。
为什么国外国内都很关注人工智能?我们不能忽视军事的应用,美国每年支持了大量的人工智能项目。其中还有人机交互,今天很多人关心机器人,所以机器人也是人工智能的一个分支。我们看看有哪些机器人。
有一些长得像人的机器,首先我们要回答什么是机器人,根据我的理解,机器人就是具有一定的机电系统。从这个角度来看,机器人不一定要像人,像这样的也是机器人,但它并不像人。这从个角度来看,机械臂甚至有扫地的机器人,还有救援的机器人,还有水面机器人、空军救援机器人,还有能够爬行楼梯的机器人,这在军事上就很有用。
水下机器人我们是很骄傲的,在无锡蛟龙号为我们中国深海勘探作出重大贡献。
前面这些机器人怎么样认知这个世界呢?就是通过大量的传感器,大量传感器搜集了不同类型不间断的信息,就构成了大数据,我们就进入了大数据时代。更不用说现在社交媒体每天的微信、QQ等社交软件产生了大量的数据。
所以我们进入了大数据时代。大数据时代给我们带来很多的机遇,比如说像欧文的水平面计划,很重要的一个方面就是大数据。比如奥巴马提出的智慧地球,比如说RHV作为全球最大的非盈利机构也是学术组织,提出了RHV的智慧城市试点计划,想在全球选择十个智慧城市。
刚才主持人和杨总提到的中国机器人以及中国的人工智能已经成为了我们的国家战略。今后国家在人工智能、在机器人这块的投资会比较多,所以今天有一些投资人像李总会发表非常好的见解。
我们的邻国日本和韩国分别提出了与大数据有关的计划,带来了很多机遇。我们每天搜集到很多的数据,我们沉浸在数据当中,如何利用这些数据,这是很值得探讨的问题,有人问数据究竟有多大呢?从这张图可以看出数据变化的速度,加速度非常快。
这给我们带来了一些挑战。这样一些不同类型的非常大的数据结构成了大数据。这个地方我引用了维基百科的定义,他说大数据是一个数据结,如此大而复杂,大到什么程度呢?用我们手边县城的数据库管理工具已经无法处理的,才叫大数据。
根据这样一个理念,我们要反思一下,在中国大数据的概念被滥用。作为人工智能的学者和研究者,我们要维护大数据的纯洁性。大数据给我们提供了很大的机遇,有人对大数据总结四个V,分别是不同的类型还有类别,第三数据量庞大,第四可信度。这些都是大数据给我们提出的挑战。
比如世界定级期刊NATURE,讲的是通过大数据能够对糖尿病建模,因为糖尿病是不大容易治的病。通过大数据分析就有可能给出个性化的给药方案。比如世界顶级期刊science,世界主流媒体对大数据给出了足够的根据。这是一个交通堵塞图。通过交通堵塞图的亮度,就可以知道哪个地方交通是比较密集的。
刚才讲大数据,我们有各种不同的大数据,如何利用大数据所包含的价值,靠的就是我们的人工智能。但是大数据的人工智能和传统的人工智能有本质的区别和不同。
下面跟大家谈谈这方面的内容。脸谱的PAOLO谈了一个观点,大数据不是需要大机器而是大智慧,我理解这句话的含义,多方面认为我们对大数据的处理需要新的方法、新的手段才能进行。大数据在处理过程中已经出现了矛盾的情况,因为大数据量很大,品种很多,我们希望有很简单的算法,它的生命力可能会很旺盛。
试想如果算法很复杂、数据量也很大,类型很多,怎么能有效地解决问题。所以这既是一个需求,也是我们对大数据处理算法的期盼。但不幸的是,现在很深度的热门学习,就是CNN转集成网络都是用的大模型,比如转集成模型计算复杂度非常高,无法用普通的PC计算。
像CNN这样的大模型确实得到非常惊人的效果,比如斯坦福大学的李非非教授,由于深度学习的引入,除了在图象识别,在语音等很复杂的领域都获得了惊人的效果。今天在很多场合已经被深度学习所占领。
对大数据的知识发现,三块很重要,首先你是解决哪个领域的,对这个领域知识的了解。我们大数据有一些数据。有人说仅仅有数据还是不够的,还要有分析的方法。
对大数据的人工智能,有人提出一个看法,就是我们在未来的人工智能,人和机器是相互合作的关系,就是人机的协同、人机的交互将比原来的人工智能会更加明显。
下面我对人工智能的热点跟大家做一些交流探讨。从如下四个方面进行:第一个是物联网与智慧城市。第二是大数据聚类,第三深度学习。第四机器人的自觉。
由于物联网的引入,使智能家居成为可能。原来奥巴马讲的智慧地球还没有实现,试想如果没有智慧城市、没有智能家居,怎么可能实现智慧地球呢?这些方面都在做。
比如我们的智慧耨也是所有物联网最简单的应用,因为它的要求不太高。比如说智慧医疗。像南昌这样的省城资源还是比较多的,但是到了井冈山,资源就不一定那么多。
像我们的远程医疗就能够解决资源不足的问题。比如说谷歌这样的公司和网易都很关注物联网,比如谷歌的眼镜、无人驾驶等等方面已经走进我们的生活,它不仅仅有使用价值,比如视觉、听觉等等一些多媒体的处理会给我们的学术带来很多的机会挑战。
有人说物联网掀起了技术革命,也有人说新瓶装旧酒,我们不屈争论这件事,由于物联网的引入,至少使得与人工智能相关的一些技术得到综合运用,得到快速的发展。这张图给出与物联网相关的技术方面的变革。
在物联网当中,几乎用到了人工智能的所有知识。比如我们如何综合感知,比如说说感知到信息要进行定位,这个定位技术很重要。比如如何进一步跟踪,如何进一步优化等等,这些都成功地运用到物联网当中。
由于智慧城市设计的方面很多,比如交通、医疗、工业、农业、安全等等,这些方面不同类型的数据24小时不间断构造了大数据,可以智慧城市的问题可以归结为大数据的问题。
就医疗来看,我们在做一些大数据的分析。进入医院之后,医生给你做各种各样的检查。我们国家已经酝酿差不多了,就是重大研发计划,我们也贡献了我们的智慧,就是智慧城市大数据处理及应用。
关于智慧城市方面,我们也在不断地积累经验,我们跟RHV合作,把无锡的经验向世界传播。在大数据的处理当中有一个技术很重要,叫做聚类分析。
因为在大数据当中数据量非常大,我们现有很多机器学习的方法没有办法有效地使用,用一个物以类聚的方式进行分析。聚类的算法成千上万很多种,如何找到简单有效的算法,这是我们追求的目标。其中在聚类分析当中,其实占据重要地位的K-means很有效,但是在大数据要做一些改善。
国内做了很多工业。以大数据的聚类为例,在思想和方法论上,跟传统的人工智能已经有了明显的区别,比如我这里给出了几个要点。
第一点,就像我们全国代表大会,不能全部到北京去开大会。
第二,算法,小数据慢慢变成了大数据,我们也用一些方法对大数据进行处理。对更复杂的场景,比如对图像库进行分类、抽取其中重要的信息,事实上是有难度的。
说到深度学习,杰弗瑞作出了贡献。我们从生理学解剖发现,人脑当中的信息处理是分层的,基于这样的思考,把这个运用到我们的深度网络模型当中。这是06年杰弗瑞提出的深度学习模型。
提出之后一发而不可收拾。到之后李飞飞的竞赛取得巨大进步以后,我们的谷歌、脸谱包括百度全部进来了,进来以后产生的成果也是非常多。到2017年,深度学习又有一些新的变化。
在深度学习当中占据重要地位的是我们的转集成网络。
如果仅仅从网络原理图来看,跟前面的神经网络结构没有太大差别,这是我们传统的神经网络,前面加入了编码和磁化的过程,不断重复,抽取出有效的支撑。就是这样一些新的变化,导致了深度学习的革命。
这是我们江南大学的美景,用深度学习表示以后,虽然不同的物体表观有很大的不一样,但是在神经网络的底层表现出非常相似的特性,这是很奇特的现象。
我们再来看近期与人工智能相关的主流的国际会议和国际期刊,几乎都被深度学习所占领。比如说我们的CPPR、ICCV、ICPR五,里面有很多深度学习的论文。每天都在产生大量深度学习的论文,如何从这样大量的论文当中找出一些规律呢?近年来肯定有新的方向。
比如由于深度神经网络太复杂,我们能不能找到一些很简单的模型呢?所以最近有很多深度学习的简化模型,结构简化了,但是它的性能并没有降低,它的间壁信息更好了,比如用于图像的分类。
2017年的竞赛结束了,因为在这上面的性能已经比较好了,但是能不能提更高的要求呢?能不能让深度学习网络得到更多的语义信息呢?是有可能的。深度学习的研究像语义化方向发展,这是它新的特点。
大家今天很关心机器人,机器人能够很顺利地工作一个很重要的原因就是认知视觉系统,它能够获得认知方面的信息,有助于机器人的工作。认知视觉当中有很多的内容,比如眼动跟踪。
我们看到很多机器人跟人的交互有一些是不够完善的,比如看它的眼神就不太好,比如说纯动跟踪、动作感应、行为分析等等。近年来我们关心了一些人脸识别,有人说人脸识别没有工作可以做了,我认为这是一个误区。
人脸识别有很多工作要做。在2011年之前是在限制的环境下做。2011年至今有了一些新的变化,就是非限制情况下的人脸识别。我们在这些方面做了一些探索,比如RHV的期刊和会议尤其是顶级期刊做了一些工作。即使对复杂的人脸都可以精确地定位人脸的特征。
这是我们今年在夏威夷开的会议,我们把注意机制、接连机制引入到方法当中来,取得很好的效果,我们参加了CPPR人脸特征定位竞赛,虽然没有取得最好,我们获得了全世界第四名的成绩。但是我们的方法是比较别致的,我们并没有用深度学习的方法。从这个角度来看,我们是非深度学习方法当中最好的性能。
我们在这方面也做了一些尝试性的工作。时间关系就不一一介绍。事实上,人工智能给我们带来很多的挑战。大家能否告诉我这个图当中有多少人呢?你现在用最好的人工智能算法也很难点出里面究竟有多少人,当然这个要求太高了一点。
今天我跟诸位分享了一些我对人工智能的看法,尤其是大数据时代人工智能新的方法论和思想以及我们近期的一些工作。值得指出的是深度学习只是从我们大脑深层结构当中获得了一些简短的启发,所以深度学习只是大脑简单的模拟,它并不代表人工智能的全部,所以我们最近公众有一些误区,门卫一谈到人工智能,马上把人工智能跟深度学习划上等号,这是很大的误区。
除了深度学习以外,我们人工智能研究的内容还有很多很多,人工智能发展的路还会非常长,公众对它的期待或许太高了一些,我从人工智能比较低潮的时期学习人工智能,我们刚开始学人工智能的那段时间,很多看不起学人工智能的人。经过这么多年的发展,现在人工智能已经能做很多事情,有一些让我们自己都无法想象。但是公众的期待如果太高,反而会对这个学科带来一些负面的效果,对它健康的发展会产生负面的效果,这是我个人对它的一些认识。
关于对大数据的分析,我用这张图来结束我今天的演讲。爱因斯坦讲过,每一件事情需要越简单越好,但是不能再更简单。我们在大数据处理当中,我们希望能找到简单而有效的方法,但是如果简单到这个方法不能有效地抓住事物本质的时候,那么这种简单就不可能产生有效的方法。所以这是我对这句话的理解。
今天给大家的演讲和分享到此结束,谢谢各位同行、谢谢各位朋友!