科大讯飞出席2016广东互联网大会:“人工智能+”,未来已来
艾媒网讯 2016年11月25日-26日,由广州市人民政府、广东省互联网信息办公室、广东省通信管理局、中国互联网协会指导发起,广东省互联网协会主办,广东互联网大会组委会、艾媒咨询集团承办的“2016广东互联网大会暨全球移动互联网CEO峰会”在广州琶洲保利世贸博览馆5号、6号馆隆重开幕。
本次大会以“共创•飞粤——互联网助推新经济”为主题,来自全国各地的政府代表、行业协会、互联网企业领军人物、专家学者等,共同探讨新经济常态下互联网的发展与未来。本届大会规模空前,会场占地面积两万平方米,规划了近200个特装及标准展位;参与报道的主流媒体超过200家;大会期间接待知名演讲嘉宾200位、海内外移动互联网CEO约1000名、互联网相关行业人士8万人次,是华南地区规模最大、规格最高的互联网盛会。
科大讯飞高级副总裁杜兰出席了2016广东互联网大会,并作了《“人工智能+”,未来已来》的主题演讲。她表示,人工智能已经在全球掀起了新一轮的热潮,在未来5-10年内,人工智能将像水和电一样无处不在,会进入每一个行业,深刻改变世界。
以下是杜兰的演讲实录:
大家知道,如果从1956年达特茅斯会议开始,人工智能发展到今年已经整整60周年,科大讯飞在去年12月的发布会上就曾经提出“A.I.复始•万物更新”,我们也看到今年人工智能在全球掀起一个热潮,刚才主持人也提到今年3月份,谷歌人工智能系统AlphaGo战胜了世界围棋冠军李世石,可以看到人工智能离我们越来越近了。今天和大家一起来分享一下,今年特朗普入主白宫,CNN和纽约时报等各种主流媒体都说是希拉里稳操胜券,而人工智能预测特朗普将赢得选举。这套人工智能系统曾准确预测美国最近三届总统大选结果,它是从谷歌、Facebook和Twitter这些网站上收集了两千多万的数据点,形成了新一届美国总统的大选结果预测。人工智能真的已经和我们的生活息息相关了。
我们也可以看到,结合大数据和移动互联网不断反馈的信息,可以预判在未来5-10年内,人工智能将改变我们的世界。人工智能已从理论走向了技术,现在正在从技术走向产品。我们也可以看到人工智能的发展不是一蹴而就的,它的发展跌宕起伏,有高峰,也有低谷。
人工智能在1956年被第一次提出来以后,当第一次人工智能的算法语言被发明、第一次人工智能可以证明数学原理,明斯基在1970年非常兴奋的宣告说未来3到8年计算机的智能就可以达到人类的平均水平。但这时经历了第一次的低潮,到了1986年,第一批算法出现,人类再次看到人工智能的希望,同时日本也雄心勃勃提出第五代计算机的发展计划,希望以后能够推出人工智能计算机。
到了2006年,深度学习的概念再次被提出来以后,我们可以进行大规模的深度神经网络的学习,有了这样的学习能力,我们一系列的算法,包括DNN(深层神经网络)、CNN(卷积神经网络)和RNN(递推神经网络),在很多的领域都得到了突破,特别是在科大讯飞做的语音识别和语音合成领域,不断取得新的成果。
我们也可以看到,智能语音目前已经成为全球产业关注的一个焦点。MIT TR每一年会宣布十大突破技术,在2016年,它已经把语音接口放到了第三位;互联网女皇Mary Meeker每年也会出一个互联网报告,中间也提到语音将会成为未来交互非常重要的主导方式;像Gartner公布了2017年十大战略科技发展趋势,其中一、二、三点都说明了人工智能无处不在,而且这种技术和科学方法将不断的进化。
我们再看看各界对人工智能的评价,让我们感受到人工智能的到来会比我们想象中更快。麦肯锡做的分析认为,当前工作的45%是可以被技术自动化的,不光是简单重复性的工作,连CEO工作的20%,甚至更多都会被机器所替代。科学杂志给出来的预测是,2045年人工智能会颠覆全球就业率的50%,这个数字在中国是多少?是77%,也就是说,在未来30年,今天我们3/4的工作会被人工智能替代。德勤提出未来80%世界500强企业的标配是掌握认知技术。埃森哲认为到2035年,人工智能会让12个发达国家经济增长率翻一倍,希望在这个基础上,中国的增长率比这还要高,才能对得起我们今天所面临的时代机遇。
我们可以看到2016世界经济论坛中的一些观点,还有普华永道的报告,还有斯坦福的报告等等,这些都告诉我们人工智能已经在全球掀起了新一轮的热潮。
作为产业界的代表,我们面临着两个方面的机遇:第一,在未来3-5年内以语音为主,以键盘触摸为辅的人机交互时代即将到来。第二,在未来5-10年内,人工智能将像水和电一样无处不在,会进入每一个行业,深刻改变世界。
我接下来会从技术现状和产业界的情况跟大家做一个分享。人工智能的发展分为三个阶段:1、运算智能,2、感知智能,3、认知智能。
运算智能,代表机器能存会算的能力,不论之前我们战胜国际象棋冠军还是现在战胜围棋冠军,都是在运算智能的阶段。感知智能是指我们的机器有一个能听会说和能看会认的能力,其实科大讯飞这么多年来做的很多探索,就是希望机器能像人一样,能听会说,能理解会思考,其中“听”和“说”的能力重点运用的是感知智能。第三个阶段是认知智能,现在也是全球各界在追逐的一个热点,也是我们人类目前要突破的一个痛点,我们希望机器像人一样去思考,去理解,这还是需要一个过程的。
我们可以从认知革命这个方面来看一看,为什么我们现在说语音和语言是人工智能的入口?大家也知道计算机时代的发展,从最初的大型机,一台电脑可以占据一个房间,再到后面个人的台式机,再到自己的手提电脑,乃至发展到互联网的时代,我们发现越来越多的时候我们不用键盘,已经用触摸来代替。再到未来,当这个机器和你有一定的距离,你想和他发生互动的时候,你应该用什么,我们应该用语言。所以我们也可以看看人类发展的历史,这个语言怎么进行广泛使用。
首先给大家推荐一本书《人类简史》,这中间提到人类怎么从200万年前的原始状态发展到7万年前的人类状态。当人类说到河边有一只狮子这样一句话反馈周围环境信息,他们规划和执行一些计划;到后面说到我有一个秘密告诉你这样的信息,他们可以组织和凝聚团队;到了说我们是龙的传人时,我们就把大量陌生人的合作和社会行为进行组织和创新。这样的能力就是通过语言来进行拓展的。
2014年,科大讯飞启动了“讯飞超脑”计划,这是中国首个人工智能的重大项目“类人答题机器人”。无论是美国、欧盟还是日本,最后还是用考试来衡量计算机的能力,这次中国启动这样一个“类人答题机器人”项目,“讯飞超脑”在项目中发挥着一个非常重要的作用,研发基于类人神经网络的认知智能系统。计划发布至今已经2年多了,我们也可以看到一些阶段性的成果。我们最终的目标是希望到2020年,我们的机器人像人一样参加高考,并且考上一本,这就是我们最后一个衡量的标准。经过两年多的发展,我们取得哪些阶段性的成果,我们现在具备了什么样的能力?
首先我们的“听、说”能力取得新突破。从2006年到2016年,我们参加了暴风雪测评的竞赛,这个竞赛是有关语音合成能力评测的,科大讯飞连续11年获得了全球第一,让机器具备像人一样会说的能力。机器像人一样开口说话了,这个标准应该怎么样衡量?比如说我们大家说的话,我们把它分为五分,普通人的说话是4.0分,而播音员的说话是5分,我们希望这个机器能做到什么样的程度?目前中文已经可以达到4.5分,英文是4.2分,是全国唯一一个超过4.0分的,具备比普通人说话更强的能力。
大家如果关注科大讯飞的公众号,回复“老罗”就可以听到根据罗永浩声纹合成的声音,你可以让他为你朗读一篇文章,也可以用他的声音讲段子,中文的能力已经很强了。
语音合成是让机器像人一样具备说话能力,语音识别则是让机器具备能“听”的能力。从2008年开始,我们也参加了全球语音识别竞赛,科大讯飞也是一直夺得全球第一。
我相信在座的各位,作为科技时尚界热情的观众,大家应该看过锤子老罗的发布会。有人问科大讯飞给了老罗多少宣传费,我告诉大家真实的情况,我们没有出一分钱,老罗这样一个和讯飞同样具有工匠精神的企业家,他有非常务实的态度,他说讯飞的语音识别准确率达到97%,我们当时展示的结果超过了这个数据。语音识别能力使得我们的机器具备了一个耳朵,可以听得懂人说的话,能够和人交流。
值得一提的是,目前不仅在语音识别这个领域,我们的技术在自然语言理解和机器口语翻译等领域,也都是全球领先的。2014年,讯飞首次参加国际口语机器翻译评测比赛,即在中英和英中互译方向中以显著优势获得第一。前天,我们的发布会上,我们同步转写了四种语言:中文、英文、日文、维吾尔语,如果大家感兴趣可以上网看一下我们的情况。
认知智能在常识推理方面获得新的突破。当我们说到机器具备能听会说的能力,下一步我们要挑战的是能理解和会思考的能力。在人工智能的测试过程中,我们有一个概念叫做六龄童的测试,人的学习和机器的学习是不同的,作为我们来说,我们6岁以前就掌握了一些常识判断,后来才能不断学习各种各样的知识,后来学习大量的知识成为我们人类很痛苦的学习经历。机器不一样,机器在后面的知识学习几乎是一秒钟就可以全部完成,最难的是六龄童前期的推理和逻辑。我很高兴告诉大家,今年的国际测试,讯飞代表中国拿了全世界第一。
过去大家都尝试过各种各样的考试,我们做了很多客观题,通过2B铅笔和批阅卷,现在我们能做到的是让老师用机器进行阅卷。我们通过很多验证,特别是在教育领域开展了一些实践活动,比如说广东省的高考阅卷,大家参加过高考,有英语口语听说考试,我们评判的对象其实已经不是人人对话,而是人机对话,已经是机器对我们进行一个标准的评判。以后我们的作文,机器改卷都可以达到专家的水准,所以这一点也是我们机器学习能力得到提高的体现。
我们现在做的一些努力,已经把它应用到很多领域,在教育领域,我们可以将日常教学中的一些常态化的数据进行收集,实现教育评价和大数据的分析,针对每个人的不同进行个性化的教学和数据化的管理。所以人工智能,我们的目的是为了因材施教,为的是能够从很多学生中发现你,成就你,希望能够达到让孩子健康和快乐成长的目的。
我们也可以看到,在医疗领域,首先可以应用的一个场景就是语音电子病历,大家去做口腔检查的时候,一个主治医生旁边会有一个小助手,他会记录下医生说的话,但是我们给他戴上一个耳机的时候,他可以非常方便的解放医生的双方。除此之外,我们还有人工智能辅助诊疗系统,这种诊疗系统是根据大数据后台计算,能够帮你做一些诊断,这个也是解决很多一线医生普遍缺失的情况。机器人不仅参加高考,也可以参加医考,他可以获得医学资格证书,帮我们进行一些医学的诊断。
汽车领域,汽车将来会成为娱乐、生活、工作的平台,目前全球有30多家汽车厂商都和我们进行合作,比如去年宝马汽车国际测试中,科大讯飞就是以86%的准确率名列第一,第二名只有74%,相差12%。为什么说汽车领域是一个非常考验人的场景?因为当车开动到一百公里的时候,它的噪音就会非常大。怎么样去处理这样的降噪技术,使得准确率能够提高,人机互动更加顺畅自然,这也是我们在汽车领域需要克服的一些问题,同时也是符合我们语音使用需求的,我们可以通过语音点歌,去找路,甚至是订餐,各种各样的活动都可以实现。在前天的发布会上,长安的董事长也来到现场,我们跟他合作的汽车测试,语音识别的正确率已经达到90%,目前世界上其他的测试活动还没有企业能够超过70%,这证明了我们在各种各样噪声环境下,语音识别技术取得了很大的突破。
我们这项技术应用到客服领域,机器已经替代了30%的人工服务,不仅如此,现在机器不光是能够实现后台的服务,还可以走向前端,客服机器人大概在明年初就会和大家见面。在今年4月份,习总书记第五次来视察科大讯飞的时候,已经和我们的晓曼机器人进行对话。在前天发布会上,我们也展示了晓曼机器人,它可以为你提供各种各样的理财咨询服务,不仅好玩有趣,吸引人气,更重要的是能够帮助我们解决一些现实问题。
所以我们可以看到“人工智能+”的时代正在到来,现在我们不仅有大数据,有海量的用户数据,而且我们有核心的算法,最重要的是我们对这些数据的处理能力,我们有国家级的涉密机制,可以保障这些数据的安全。我们为了带动整个产业的发展,需要把源头核心技术、创新技术开放给社会公众,开放给所有创业者和创新者。
自2010年开始,我们已经开放云平台给社会各界伙伴们,现在开发者伙伴可以通过简单统一的交互接口,接入和调用科大讯飞的云理解技术等等,未来我们也希望各个领域的最新技术都可以对接到我们的AIUI的平台上,而实现向下对接核心技术,向上对接我们的合作伙伴。
这个数据从去年到今年,一年的时间就发生了很大的变化,像日均语音的交互次数已经达到了30亿,而语音云平台终端数累计达到8.9亿,第三方合作伙伴或创业伙伴已经达到了20万个。
我知道广州在全国的创业城市中排在前列。所以我们也很希望越来越多关注人工智能的产业界和技术界的朋友加入我们,一起发展。我们也可以看到当前的状态,其实在发展的过程中,我们还是很希望人工智能能够不断的去克服各种各样的困难,因为到2045年,甚至到更长远的未来,这个过程中会有各种各样的问题,但我们仍然充满着信心。
科大讯飞1999年开始创业,2004年才实现盈亏平衡,到2008年上市,成为了大学生自主创业第一家上市公司,到现在成为亚太地区最大的智能语音和人工智能的上市公司,曾经我们的理想是让中国人把中文做到全球最好,到今天我们希望把人工智能领域做得更好。中国有无可比拟的人工试验田,可以看到中美的对比,还有我们人工智能应用的优势,我们希望以“讯飞超脑”为代表的中国人工智能核心技术实现一个持续的突破。不论是让世界来聆听我们的声音,让机器能听会说,能理解会思考还是用人工智能建设更美好的世界,这些都是我们的愿景和我们的使命。
因为我们相信你所清楚预见的、热切渴望的、真诚追求的都会自然而然地出现。