ROOBO钟升达:如何从0到1打造爆款儿童智能机器人

来源: | 发布时间:2018-12-21 13:34:37

导语:陪伴一直以来都是机器人被创造的重要原因之一,儿时的我们肯定都幻想过如果有一个机器人能陪我们玩耍,教我们知识,该有多么美好。如今,儿童智能机器人的诞生解决了很多儿童陪伴的问题。作为一个在百科中还没有收录的词条,「儿童智能机器人」已经发展到什么阶段了呢?什么样的机器人算是一个合格的「儿童智能机器人」呢?

 

本期《机器人大家说》邀请到了北京智能管家(ROOBO) 儿童机器人产品总监 钟升达,他将结合ROOBO目前在「儿童机器人」领域的探索,为大家带来「如何从0到1打造爆款儿童智能机器人」

 

 

嘉宾介绍

 

 

ROOBO儿童机器人产总监

钟升达

 

曾就职于IBM全球咨询服务部,作为高级咨询顾问参与了银行、航空、教育行业的多个客户信息化咨询项目;后加入百度深度学习研究院负责识图产品,为百度IDL研究院首位AI产品经理。 

 

加入ROOBO以后,负责将ROS.AI平台快速落地于智能家居、儿童机器人方向;截止18年上半年助力ROOBO完成了儿童机器人软硬件方案500万台的出货量,行业内稳居第一;同时打造童秘儿童智能平台,连接更多的儿童设备,使交互变得便捷和智能。

 

 

 

 

文字实录

 

 

 儿童机器人与AI的行业发展回顾 

 

 

如往期一样,在了解儿童机器人目前的整体现状和如何打造一款合格的儿童机器人前,我们需要先了解一下这个行业的历史进程与发展。

 

“儿童机器人”这个概念目前其实还算比较小众,甚至在百科上都没有一个具体的词条能够完整描述它。也就是说,儿童机器人仍然没有一个合适的定义。

 

因此,想要了解这个行业,我们需要从产品入手,以产品共性看待行业。我们发现,所有的儿童机器人产品现在都有一个重要的功能特点,那就是需要倾听儿童的声音,并和他们交流、互动。所以,这类产品最核心和关键的技术就是智能语音技术。而这,恰恰离不开人工智能的第三次浪潮。

 

 

从06年诞生深度学习理论技术后,短短5年时间语音识别和图像技术便迎来了商业化时代。以2011年为节点,微软率先使用深度学习,将语音识别正确率从75%提升到95%以上。随后,讯飞输入法、SIRI这样的智能助理诞生。

 

最早的儿童智能机器人雏形则来源于语音识别鼻祖讯飞的一款应用APP《开心熊宝》。这是基于手机的一款软件,而对于硬件来说,2014年一家国外的公司打造了“JIBO”的硬件产品,很遗憾地,它并没有得到量产的机会。

 

如今我们有着很多公司在共同耕耘儿童机器人市场,不论是最初的乐橙公司、小鱼在家还是如今的北京智能管家ROOBO,多多少少在设计及理念上都借鉴了他们的“老大哥”JIBO。

 

 

在各家公司纷纷进入儿童机器人市场的2015年,整个行业也开始腾飞,从不足10万的年销量,发展到3年以后的2018年预估2000万销量。钟升达分析,这样的井喷效果不仅来自于硬件成本的降低,其次也有故事机、早教机产品转型带来的影响。

 

 儿童机器人1.0时代:同质化产品当道 

 

作为一个拥有潜在销量2000万的市场,大家普遍都会认为儿童机器人产品销售一定拥有“快速增长性”和“蓝海”的特点。

 

然而并不是这样。

 

据钟升达的描述,外行会认为儿童机器人市场像是广阔蓝海,而从业者都深知他们所处的环境只是一个小小的鱼塘,并且竞争非常激烈。

 

这是因为,第一,父母对儿童机器人产品的认知度依然不高。父母及孩子,乃至我们广大消费者,在被各种影视作品及通俗文化的影响下,都会认为:

 

“儿童陪伴机器人” = 哆啦A梦或大白

 

 

第二,尽管两种产品在品类上毫不相关智能音箱的“千机大战”以及各种巨头补贴在不断冲击着儿童机器人市场这主要是因为生产者在产品编辑上处理较为模糊

 

你能分得清谁是儿童机器人吗?

 

作为主打儿童智能语音交互的产品,儿童机器人的核心应当是“技能和场景”。目前各种平台也在不断拓展着它们,我们总结来看,其实不外乎两类。

 

第一类是工具型,比如咨询天气、其它生活信息或常识信息。第二类是资源点播型,比如听儿歌,听故事或者看动画片。

 

对此这些技能和场景,ROOBO专门梳理了用户在使用它们时所占据的比例。

 

 

根据这个分析,我们可以得出在目前的儿童智能机器人时代,钟升达称之为“儿童智能机器人1.0时代”,无论从产品外观、内沿竞争或者功能体验上来讲,各家产品都处于一个非常同质化的阶段。

 

那么在同质化的竞争状态下,北京智能管家ROOBO以及行业内所有的儿童机器人企业该如何去打造差异化、有特点的机器人呢?

 

 如何打造2.0时代的差异化儿童智能机器人? 

 

深耕行业多年,北京智能管家ROOBO在积累了大量经验的情况下,于今年7月推出了从软件到硬件统一的开放平台——“童秘平台”

 

“童秘平台”的开放性来自于它可以适配各种系统,如业界常用的安卓系统、Linux系统,以及RTOS系统。同时,在对接硬件方案伙伴上,ROOBO也将内容云这一层面开放出来,以实现更多有价值的、富有教育意义的内容覆盖。

 

除了平台与内容外,最基本的语音对话方面,ROOBO在2.0时代总结了百度先前提出的标准,即“听清”、“听懂”、“满足”。

 

 

这三个方面对于成年人来说,似乎很好实现。然而对于儿童来讲,他们正处在学习语言的阶段,小到发音、大到语言逻辑的各种形式都是非常复杂的。

 

通过大量的语音标注,以及结合最新的声学模型TDNN神经网络,ROOBO重新训练生成了专门针对垂直于儿童领域的ASR语音识别技术。至此,ROOBO实现了差异化的第一个点:听清。

 

 

对于“听懂”,钟升达讲述,在大部分常见的用户对话中,用户的意图遵循着“二八定律”,就是说80%的用户,其对于产品功能的表达方式会集中在20%的话术上。比如说暂停歌曲,普通成年人用户会说“暂停”、“不要播了”、“停下来”等,而儿童却不这样,也是和儿童的语言逻辑相关的,他们会认为机器人并非工具,而说出“你这个歌可不可以自己停呀?”这样的话语。

 

这种拟人化的语言如果用传统的智能语言模板匹配很难会命中儿童的真实意图。在这方面ROOBO又结合另外的LSTM模型进行大量标注,实现了儿童自然语言处理的神经网络。此外,他们也围绕产品端进行了定制化的迭代,保证时刻更新儿童语料。

 

最后一个阶段是“满足”,这一方面ROOBO和众多内容合作伙伴一起打造了知识库,将目前市面上的内容知识形成体系输出给广大儿童。

 

其实,仅仅包含“听清”、“听懂”和满足,儿童智能机器人仍然和智能音箱无法形成有效差异化。

 

对此,钟升达表示,ROOBO给出了一个绝佳的方式。因为儿童正在处于语言学习的关键时刻,只是“磨耳朵”对于他们来说帮助不大,这是一种输入。更有效的互动应当是输入与输出相结合。

 

 

因此ROOBO给孩子们提供了“磨嘴巴”的功能,即是由机器人在和孩子交流的过程中根据内容主动发问,例如当孩子提问:“你有家人吗?”机器人回答:“没有,我是机器人,你有家人吗?家里有几口人呢?”

 

通过一些具有条例和逻辑的回复,锻炼儿童的语言意识。这就是2.0时代的关键——围绕语言的主动交互

 

 关于儿童机器人的未来 

 

除了分享ROOBO关于儿童机器人2.0时代所做的事情,钟升达还对未来的儿童机器人发展提供了更多想法。

 

 

这里,具体在三个趋势上面会有所表现:

 

一是IP化,比如一些家喻户晓的动漫形象,如小猪佩奇、小黄人等,以此增强产品的认知度。

 

二是内容互动多元,就如上面讲到的,机器人会主动引导孩子表达,之后孩子也会发表他关于上下文的想法,以此实现教学性的互动。

 

三是未来的儿童智能机器人一定是既能听又能看同时具有更强感知能力的产品,它可以有效监督,或者督促孩子学习。

 

 

现场答疑环节

 

 

Q1: 儿童机器人如此同质化,我该如何选择合适孩子的产品?

 

答:对于目前阶段,家长应当选择更具有优质内容的平台,语言交互方面应当考虑关注百科问答的质量效果。

 

Q2: 儿童语音分析的过程中,最困难的是什么?

 

答:最困难的地方是有些小孩子的说话连大人也听不懂,所以在语音标注的时候所需要花费的成本也会比较高。另外就是儿童本身的表达也会很不标准,需要大量的语料积累才能达到较好的意图识别。

 

Q3: 作为家长,我为什么要购买儿童机器人?

 

答:这个我觉得从儿童机器人的几个方面来看,一个是愿景出发,儿童机器人本身的出发点是希望陪伴小孩子学习成长,而手机上内容虽然多,但是毕竟不是适合小孩子的专属产品。二是儿童机器人从硬件的配置上来看,未来一定会有更多的可运动类的机器人出现,其主动交互的能力也会远远超过手机,比如陪伴小孩子学习,假如小孩子不愿意学,跑开了,手机能感并追随小孩子吗?不太可能,因为硬件局限了其能力,但是未来儿童机器人有可能。

 

Q4:目前的早教智能产品市场还是故事机卖得比较好,儿童智能机器人冲击这个市场的优势有哪些?

 

答:刚才提到一个很重要的点,故事机是一个被动交互的产品,儿童机器人未来要拉开差距,需要从主动交互上下功夫。把和孩子的交流变为双向的,而不是被动响应主人的请求。这个很重要。另外一点就是需要把硬件成本控制好,降低成本。

 

Q5:外形或者內容上,未来会考虑引入一些IP元素吗?业界的趋势是怎样的?

 

答:IP化这件事儿一直都有企业尝试,但是面临的问题是一是授权成本比较高,二是IP化除了外观外,也需要从机器人本身的内涵下功夫,比如IP的声音是否能有效合成,IP的机器人画像是否能做的和原型足够的匹配。当然,最重要的是企业自身的内容和渠道是否能够让消费者买单。

 

更多互动问题答疑请移步回放直播间

扫描即可进入