当前位置:

OFweek云计算网

云资讯

正文

专访陆奇:微软最有权势的华人谈云计算和人工智能

导读: 从2014年5月29日发布以来,“小冰”已经更新到了第四代,年纪也从16岁长到了18岁。过去两年多时间里,小冰在微信、微博、美图等平台上积累了上千万的用户,对话量超过了200亿条。

  上周五,微软为它的人工智能机器人“小冰”举行了一场成人礼。

  从2014年5月29日发布以来,“小冰”已经更新到了第四代,年纪也从16岁长到了18岁。过去两年多时间里,小冰在微信、微博、美图等平台上积累了上千万的用户,对话量超过了200亿条。

  在相互的对话过程中,她也表现得越来越像一个正常人。比如她可以识别你发给她的图片,能在文字和语音之间进行切换,能够采用某种“策略”把你带出消极情绪,甚至,可以跟你打电话。

  “小冰”已经成为了微软在人工智能领域的一个战略级产品,而作为这个项目的领导者之一,微软全球执行副总裁陆奇也从美国飞到了北京。在发布会结束之后,他跟我们聊起了小冰、微软的人工智能战略,还有如何在过去几年进行产品和业务转型升级。

  陆奇认为,人工智能最终将表现在“对话”这个核心的诉求点上。当人工智能可以向电影《她》中那样与人类自然对话,与人类产生情感联系,那么将给整个社会带来巨在的变化。而微软小冰已经在这条路上走了两年多。

  陆奇在进入微软之前,很长一段时间就职于雅虎。当被问到微软这个巨人应该如何转身,而避免雅虎的悲剧时,他觉得两个公司面临的情况并不太相同。雅虎的门户已经被搜索引擎和社交网络取代,而微软在借助云计算技术之后,把原有的产品重新推向了一个更为广阔的市场。

  以下是采访实录:

  关于微软小冰

  问:小冰一个很大的特色是它的情感计算框架。但是人类的情感是很复杂的,包括积极的情感、消极的情感。从目前现看,小冰基本上表现的都是积极的情感,与人平等的对话可能会涉及消极的表达,小冰在这方面会有学习吗?

  陆奇:按照我们人工智能、大数据和机器学习技术,人的情感只要有数字化的介入,行为的规范基本上是可以学出来的。微软想要建立人工智能是代表正能量的,是为人类服务,帮助人类的。所以在这种情况下,我们想要建立的对话,采用的策略,基本上引导人类从他的消极或者负面环境(中走出来)。

  问:小冰已经可以做到和人类打电话了。但人和机器之间文字的交流,实时的讲话,实时的了解人的语境,进行语音的反馈,这方面是挺难的吧?

  陆奇:从某种意义上来讲,我们为人工智能所产生的对话能力,提出了一个新的标准,如何在实时性方向,非常智能的,就像人与人之间交流,确实技术上有很大的问题。

  我们首先要听得懂,语音识别要非常清楚,速度得非常非常快;第二,交互的能力非常广,但是如何把这些技术,有难度的核心技术提高到一定的层次,把它集合起来,使整个的用户体验,真的像人与人之间智能交互,这是非常重要的。

  刚才有一位女士上去试了一下,小冰可能今天没法测试说今天给我打电话的是个男的还是女的,有很多事情要解决。

  问:为什么要赋予小冰这样一种实时对话的能力?

  陆奇:人类跟任何种类不一样的地方,我们发明了语言,人与人之间近距离的交换,后来有了电话以后,可以远距离的交换,就是实时的交换,不光把人类进化,而且产生人类知识,人生整个演进过程中起了非常大的作用,人工智能会成为新的人与人之间交流的基准桥梁。

  其实是蛮振奋人心的,虽然我们没有完全把技术问题解决,但是我们至少定义了这是一个新的里程碑,将来不管是机器人也好,它是一个自然的交流形式,完全可以连续实时的、可以不断的,毫无保留的讲。

  问:我们离这个理想的自然交流状态有多远?

  陆奇:根据我们现在的深度学习技术,只是一个时间问题。把数据输进去,不断地去训练,在2009年之前,错误率接近30%,这么几年已经从30%降到8%,可以预测再过一两年,就差不多1.5%左右,这也是我们技术上可以解决的。

  我们的语音团队是全球性的团队,小冰在开拓性领域,我在美国的语音团队他们讲,他们必须把中文的优先级继续提高,小冰从技术上来讲,用户体验上是全球领先的。今天演示的时候,我们还是比较紧张的,错误率在8%左右,一旦听不准以后,接下来的交互完全不准确了。

  问:在开发小冰日语版的时候,是基于中文翻译平台,还是从零开始,本地语言开发出来?

  陆奇:从零开始,文化语言环境完全不一样。一开始我们跟项目负责人有过讨论,是不是这个产品只有中国玩的转?我们说至少试试,看哪个国家哪个语言跟我们接近,就是日本。试下来以后我们就知道了,这个产品肯定是全球化的。但是每个国家必须要从零开始,因为每个国家的语言和文化不一样,你没法搬过去。

  问:现在做人工智能其实是用深度学习的方式,利用现有的很多样本。那微软是怎么样产生这样的样本的?人工给一个图片,或者一段话分析他的情感,给小冰来训练吗?

  陆奇:从算法上来说,机器学习从整个历史上来讲有几种大的方式,一种是你有样本,真正做到人工智能的有非常大的限制。AlphaGo最大的创新,是使用了增强学习,可以自我学习,但是这也有它的限制,它的限制就是你探索的环境多大,如果探索环境不大的话,你学来学去,就是学一个封闭的系统。

  我们公司的团队研发迁移,我自己个人也做了不少,人与人之间知识可以传输的,迁移也必须要做。最后还要解决一部分问题,人一部分的知识,我没有做增强,也没有人来教我,我自己琢磨。所以人的知识就是三部分把它总结起来,增强学习,这是三部分学习的方式,我们微软这方面做的研发做的比较多。

  问:小冰各方面的能力,对情感的把握和去年相比有很大的提升,微软有没有想过把商业化给提上议程?

  陆奇:小冰的盈利空间是非常大的,我们完全有机会创建新一代盈利形式,跟搜索广告一样,我觉得搜索广告可能是盈利最好的代表。

  为什么搜索广告业务有效性非常强,同时用户体验可以维持在很高的水平,有几个层面,第一个,信息结构。搜索广告和自然搜索的结果是完全一样,都是针对关键词。第二,用户体验也是百分之百吻合;第三,搜索广告效益完全可以百分之百用精准的方法来测试;第四,搜索广告盈利体系是建立市场机制,每个广告商要不断地提高广告的质量。

  像小冰这样的产品,它的战略意义,对整个生态系统的广泛度,在这个阶段我对团队的要求,基本上是完全注重用户体验和生态系统的健康。如果过早的做盈利,用户体验会受到损伤,整个生态系统会受到一些约束,我们觉得这个是不值得,在这方面,一定要把基础打扎实才行。

  问:您刚刚提到了用户体验,要做用户体验可做的事情非常多,而且是一个很庞杂的系统工程,微软在内部有没有一套自己制定的标准或者是方法,把它变成有规划性的事情?

  陆奇:我们整个工业创新的核心是在三个圆圈的结合,第一个圆圈是人类的需求;第二个圆圈是技术上是否可行;第三个圆圈是商业上能不能建立有效的商业,这三个必须都成立才行。其中人的需求是最难预测的,最难预测的是将来。

  目前美国科技公司成绩做的最好,发展潜力最强,第一是Facebook,第二是苹果,这两个共同有共同点,他们都是产品研发,技术对他们来讲是一个工具,他们公司着重点如何把用户体验做的越简单、越精准。在中国,我个人觉得现在实力最强的是腾讯,腾讯完全是一个产品导向。张小龙以前有一个PPT讲微信哲学,我们把它翻译成英文,给我的团队去讲。

  在新一代,在移动和云这块,手机也好,手表也好,这些数字化的用户体验已经不再是一个工具,是个体的延伸,我们对它要求是非常非常高。我个人觉得用户体验的简单、精准,对整个公司起着战略性的作用越来越大,技术当然永远是最重要,但是用户体验是下一代企业核心竞争力。

  微软的传统文化是比较注重技术,这是好事情,我们还是继续重视技术,但是我们必须要改进我们的文化,不断地执着的追求用户体验的简单,世界上可能最复杂的事情把用户体验做的简单,做到简单的用户体验是绝对不容易的。

  问:小冰后面有很多的技术支持,包括云计算平台,云平台在印度,包括像医疗、农业合作非常好,微软会在这方面和中国政府有合作吗?

  陆奇:微软把云计算的技术投入是作为核心。如果没有云的技术,大规模的数据处理,包括语音处理也好,机器学习也好,都没法完全往前推。刚才你讲到在印度做医疗、农业,我们在中国是非常非常有信心,跟中国政府也好,跟中国国企也好,建立双赢的关系。

1  2  下一页>  
声明: 本文由入驻OFweek公众平台的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号