阅读| 订阅
阅读| 订阅
机器人

雷雄国:机器人中的人机交互和后端服务

星之球激光来源:新华网2016-05-04我要评论(0)

  4月28日2016年全球移动互联网大会在北京如期举行,本届GMIC,集结了一大批来自移动互联网,人工智能领域的优秀企业代表共同亮相。而思必驰在本届GMIC可谓是最亮眼的...


  4月28日2016年全球移动互联网大会在北京如期举行,本届GMIC,集结了一大批来自移动互联网,人工智能领域的优秀企业代表共同亮相。而思必驰在本届GMIC可谓是最亮眼的明星之一,展示的“AISpeechInside”系列智能产品十分丰富,携上海庆科、大华乐橙、捷渡中国等众多合作客户参加,更受邀在多场重量级峰会上分享经验。
  在以“阿西莫夫的里程碑”为主题的全球智能机器人大会上思必驰副总裁雷雄国发表了题为“机器人中的人机交互和后端服务”的主题演讲。演讲中,雷雄国详细介绍了思必驰在机器人领域的多项技术特色,以及自身的定位和未来发展方向。同时,他还展示了最新的合作产品:即将正式面世的乐橙小乐机器人。雷雄国表示,现在的思必驰正处在人工智能快速发展的时代,挑战与机遇并存是这个产业的主旋律,除了在语音识别和图像识别技术上要有所突破外,思必驰还将致力于身份识别、声源定位以及智能车载等领域产品的研发,力争达到业界领先水平。
  以下为雷雄国演讲实录:
  对于人工智能这个话题,今天来到现场我特别感慨的是,当今是最好的时代,也是最“坏”的时代。最好的时代包括从阿尔法狗,我们现在这么多的创业者集中在AI智能领域,包括机器人的创业浪潮,我们能看到未来在机器人的时代,人工智能的时代,一定是一个正确的大的方向。
  为什么说这是一个最坏的时代呢?我们发现确实,有很多我们接触做机器人的朋友,他们在聊未来机器人,包括当前机器人做成什么样?有什么样的商业模式?以及在机器人产品里面未来的一些核心方向?可能都不是特别清晰。
  在当今的时代,思必驰在人工智能这块一直在做自己的探索。所以我们也非常高兴生活在这个时代,能够在人工智能的这条道路上一起努力,去解决在这个道路上面与我们所能遇到的很多技术上和商业模式上的,一一系列的困难,推动人工智能走进千家万户。
  思必驰2007年开始做人工智能,从最初做教育到做移动互联网,再做车联网,以及目前的智能方面。我们有幸能够看到包括国际国内已经涌现出非常多的,优秀的,我们能够看得到的机器人产品,我们也在跟一些国内比较大的机器人厂商做深度合作。
  其实在机器人这块,如果从产品的角度来看,刚才我们提到产品的核心定位的需求是非常关键的。从核心的人机交互的角度来看,语音技术、图像识别技术,以及体感等等一系列的多模块的发展是非常关键的。我们希望以语音、人脸、图像等等一系列作为核心的交互手段的这么一些多模态交互的算法,以及产业化的进方面,我们也在做相关的努力。
  首先,从人跟人的交互来看,最自然的是语音的交互。我们延伸到人跟机器的交互,其实语音也是最自然的入口。比较接地气的说法是,我们和100多家机器人厂商交流,他们提出来一个核心的需求,对于语音的交互是非常感性的,我们能够看到在这里面,语音技术确确实实是一个在这个领域里面非常重要的一点。
  在机器人的交互方面思必驰有一些具有突破性的进展,我们可以演示一下,机器在说话的过程中,作为一个语音合成的技术是非常成熟的。传统的语音合成会比较机械一些,我们在机器人的交互里面,机器人可能首先是个人,在这方面的需求它所发出的声音,我们希望它尽量有感情,有韵律。
  其次,从人机交互的角度来看,核心技术的推动,以及对于人机交互更自由的使用场景其实要求非常高。对于机器人上面,其实机器人往往有可能会动,甚至离你有一定距离的产品,这样的话它对于语言识别、人机交互的难度会大大增加。这是第二点在技术的角度。
  第三,机器人的交互需要深度的理解他的对话,以及深度理解以后给出一些反馈。
  第四,目前在机器人行业里面,大家会发现,每一类的机器人都会有自己定位准确的应用领域。有的在银行,有的在商场,还有一些针对小孩,还有一些针对老人。其实语音识别的定制以及语意的定制还有对话的定制就非常重要的。同时在定制的过程当中,包括有一些唤醒功能的定制也很有必要。
  第五,本地识别。我们很多产品在使用的时候会受到网络的限制,甚至没有网络。我们希望我们的机器人不至于变成一个“傻”玩具。这里面需要在技术上提供云端跟本地相结合的混合引擎。
  第六,为什么很多人认为机器人就是一个加了壳的平板,里面缺灵魂。那么这个机器人到底能给我带来什么便利?这里面涉及到一些后端服务的整合。我们希望打造成一个比较完整的解决方案,这个是在做人工智能的时候需要去深度研究的事情。
  从人工智能技术的角度讲,这是一个技术性非常强的行业,我们思必驰在这个领域,对于技术研发的投入,包括未来的方向我们有自己的一些看法,核心的几个点,一个在对话交互方面,在对话的交互里面,上下文的理解非常重要。第二是情绪的合成,我们需要一些有情绪,有韵律的机器人,而不是非常干巴巴的机器人。

转载请注明出处。

免责声明

① 凡本网未注明其他出处的作品,版权均属于hth官方 ,未经本网授权不得转载、摘编或利用其它方式使用。获本网授权使用作品的,应在授权范围内使 用,并注明"来源:hth官方 ”。违反上述声明者,本网将追究其相关责任。
② 凡本网注明其他来源的作品及图片,均转载自其它媒体,转载目的在于传递更多信息,并不代表本媒赞同其观点和对其真实性负责,版权归原作者所有,如有侵权请联系我们删除。
③ 任何单位或个人认为本网内容可能涉嫌侵犯其合法权益,请及时向本网提出书面权利通知,并提供身份证明、权属证明、具体链接(URL)及详细侵权情况证明。本网在收到上述法律文件后,将会依法尽快移除相关涉嫌侵权的内容。

网友点评
0 相关评论
精彩导读
Baidu
map