海知智能Founder&CEO谢殿侠:儿童智能机器人如何避免同质化?
在今年的百度联盟峰会上,李彦宏就直言:互联网即将迎来发展的下一幕,而推动其发展的核心动力,不是大数据,也不是云计算,而是人工智能。
或许大家早已从这一词在今年不断蹿升的热度中瞅出了一些苗头。而从国内在人工智能领域的创业环境来看,儿童智能机器人一定是其中占比颇高的一部分。其发展前景固然是好,但脱离不了同质化的瓶颈也是事实。
所以,此次机器人大家说第一期邀请了一位拥有丰富创业经验并在聊天机器人领域有多年研究和观察经历的嘉宾——谢殿侠,为大家带来他对儿童陪伴型机器人如何避免同质化的理解和解读。
谢殿侠
海知智能(ruyi.ai)Founder&CEO 语义开放API倡导者和实践者
如何看待儿童陪伴型机器人同质化现状?如何避免这种同质化倾向?
谢殿侠:机器人有本体和大脑两部分。
本体,不管是尺寸、动作、形体都有各自的诉求与特点。
大脑或者灵魂,如何体现人的特征?我想更多的是从人的意义、沟通和表现人的属性上来避免同质化。其实也就是两个问题:
1.怎么能够满足儿童机器人这一类产品的用户的诉求和痛点,即怎么超出用户的预期?
2.不管A公司、b公司,假如能达到预期,那么如何做到差异化?
首先谈第一个问题,它分为两个部分,怎么来满足用户的需求,并且在此过程中怎么能够体现差异化?
儿童机器人确实在今年市场上见的不少。从合作伙伴来看,一种情况是,我们在做产品的时候,会定义一个产品,其定位为3-6岁的儿童,当然这中间也还会有分级。最终用户当然不止这些儿童,还有他们的父母、玩伴等。这是一个真实的场景,所以它应该是多个角色一起在使用的。
反过来讲,用户究竟需要什么?用户的痛点是什么?对这个事情的理解就能很好的去理解产品本身该从哪个点出发,产品应该达到哪些功能。过去可能会遇到这些问题:一些开发者一开始从某一个出发点做出了产品的定义,但是最后这些定义与用户的需要并没有做到一致,这些将是直接影响出发点走势的差异点。
悖论:应该具备什么功能 or 围绕真实用户需求
所以,一种是从该具备什么功能和想法去设计产品,另一种就是围绕真实的用户、场景、还有场景中的人物、角色和环境来定义产品。
这也是两种定义产品的做法。同时也是整个产业发展的悖论和困境。我们的确应该按照用户的痛点来设计产品但是问题就在于,对于用户来讲也是一个很普通的需求,但是,在技术上能不能达得到。
那么一种情况是说,我们只要定义清楚了用户场景的所有需求,我们来组织所有可能性的技术来满足所有的需求。还有一种在现有可实现的技术范围或可能性范围之内有哪些具备成熟条件的需求,从而将可实现性技术组织起来来满足需求。
这是一个平衡点。怎么来选?决定着处于所谓发展红利期的产品所能达到的范围。往往可能有时候前边这块想的多了,后边跟不上。有时候可能后边根据每家公司所能达到的范围实现或大或小。
所以从平衡点来讲,分为两面。拿我儿子举例,拿几款不同的产品,可以唱歌、闲聊、讲故事。观察下来,实际上玩下来,能玩多久?然后玩得很好的又是一个挑战。
反过来说,他从最开始接触到放弃这个玩具这段时间,他可能感兴趣的点在于,这些机器人类似于布娃娃、人型玩偶的,还能可触摸,最后发现,最好玩的是小孩子能通过触摸,手的互动的方式能够给他反馈,有时网络联网也是一个问题。最后发现他玩这个玩具乐此不疲。通过触摸、触盘的动作,机器人能够以发出人声的方式给以互动。小孩子能够持续摁动,获得很大的乐趣。
对于讲故事这个环节,我们发现有一个很大的问题。小孩子在机器人讲故事的时间里,容易失去耐心。当大人介入做一个桥梁,小孩这个时候就能接受。还有一个问题是,小孩子会打断故事,提出问题。现有的机器人能够在这一过程中发挥作用。最终我们把产品结合起来,还会发现需要其他的陪伴的人一起来完成,那么,这个场景满足了。
如果把这款产品设计为小朋友玩的情况下,可能会把场景设想的更完美,3-6岁的机器人就会设计一些更成熟的功能,方便大人和更大龄的小孩来陪着玩。在这种语境下,从产品实现的角度,怎么来实现它?
一种情况是说,各自来组织语言,各自实现功能。从语言设计到语言,一起来打通,这些只有一些土豪公司才能完成。像我们会从硬件来着手,完成整个机器人的产品。这样我们所面临的挑战和困难在于:
究竟我们在创造这个机器人能定义多少属性?
设计这款产品时,在针对特定产品里边能解决多少用户的需求或痛点?
怎么才能实现不同厂家之间的差异化。即便是我们自己的产品,也同样会有a系列或b系列,在不同的系列里再做出差异化?
这张图是一个机器人大脑的逻辑图,这是我们自己产品都要做的。为什么这么列呢?我们在做产品时,希望能够通过微信公众号、手机app、甚至可以通过打电话来实现多人对话、语音搜索、自然语言生成。知识图谱即指所谓有知识的结构构成图谱。语音知识管理,是说我们具备哪些技能。
后面我们会针对功能性罗列几点。
我们机器人设计的像人一样,它会是几岁?我们设想一下,当创造机器人时,会设定它的年龄、性别、眉毛怎么长、外形如何等等,怎么能够把心目中的机器人描画出来,尽可能真实地设计出来。还有一点是,性格会是如何?活泼or温顺or沉稳?年龄则可以不限。你可以把它设定为陪小孩玩的同龄人,也可以设定为大一点的陪伴者,甚至是大人也可以。
当对儿童机器人的性格能设计得更加丰满和丰富的时候,我们首先会提比他年长的人物。另外一点是,参与设计的人员可能多达几十人,怎么才能让这些人的设计风格趋于一致?让小朋友在体验时,让他们能感受到家里来了一个亲戚家的小朋友等,它有特定的性格特点,或者矛盾,体现一个真实的人格。
这又说到先前的悖论——满足用户的需求让用户大爽从而产品大卖。而另一方面,现有的技术边界和范围在哪,或者说每家公司掌握的资源有限,如何满足小朋友的可接受边界和范围。
也许有的朋友会说,这不有点扯嘛。但是反过来讲,如果不能达到这样,怎么才能让小孩愿意玩呢?
举例说明:我们怎么来定义一些儿童机器人的性格属性,最后转换成对答度,来满足用户的需求。
首先,怎么来设计机器人的性格、角色甚至外观的属性,不管API有没有完全提供这些功能。所以我们每家机器人公司产品经理都要有这样一个画像。
这个画像,实际上就像硬件产品一样,我们要花大量的时间、精力去投入,要把这个工作给做了。虽然这个工作相对无形,但最终我们就能看到形体一样。我们能感受得到它的形体面貌,最后都体现在问答度里边。用户提问,从而机器人回答。
所以,花大力气去虚拟构造机器人的精神灵魂都应该不亚于去做对内的,如机器人的形体、外观上的功能。有了这个之后,再看技能。一款机器人拿在手上,家长最开始就是联网。在家长联网之前,在离线模式,这里设置了200句或2000句,这对产品的第一期合力非常有用。而这些都依赖于机器人的性格。
联网之后,机器人激活下来了。小朋友家长或朋友进行寒暄:你几岁了,你喜欢什么等问题。在这种情况下就又回到了我们刚开始的定义。你如何定义他的这种外观尺寸,这些一完善,对刚才那种环境还是比较容易的。
另外,同样的一句话,比如说“你是谁?”,不同的产品会有不同的定义。也就是说怎么来设计不同的可能性来介绍“我是谁”。不管是小朋友还是家长,有没有可能不看说明书,就能和机器人互动并且玩下去。不管是互问“你是谁”“你干嘛”,在对话场景里边,都可能有意无意设计怎么能够把功能介绍出来。在对话的过程中,将说明书植入里边。或者将说明书设计成“问答”的形式。
这一块,伏笔设好,就都好说。伏笔没有设好,就挖坑把自己陷进去了。闲聊的形式,把最大核心的功能,比如说讲儿童故事,有一个完善的故事内容库,点击讲故事,就能将功能以不同的形式讲述出来。
另外一类是一些知识类的互动游戏。比如:诗词、成语接龙。但是把这些定义进去,不同的说法就能做到不一样。怎样的形式,可以让游戏变得好玩?
在之后过程中用户会问到知识类的问题,如李白是谁,清朝是哪个年代等知识。整合了各式各样的知识库,怎么能够体现出我们设计的机器人的人物性格并利用语言把他体现出来?比如,可以在机器人的回答环节中能够定义出不同的需求或游戏;在长版的环节做长,让它变得好玩。这些点的设置会让用户玩的比较爽,并且能够记住它,并在之后的时间里也能挑出来继续玩。
怎么看待这几天在网上比较火的高考机器人?它有没有可能在明年高考中考上一本?
谢殿侠:实际上日本的高考机器人已经做了很多,目标是考上东京大学,每年都在做。数学方面不错,语文还要努力。
为什么数学好做呢?
这个只是一个时间问题。对于中国来说,提出来也挺好。之前参加龙泉寺项目,尝试着参加中国儒学院的入学考试。但是高考这一块,比如说阅读理解,在人工智能前沿这也是一个比较热的话题。因为阅读理解对于这方面的挑战会比较大。核心是如何能懂?通过阅读文字内容,来理解用户。
第二,要知道答案,怎么从相关知识里拿到这个答案,从而行动——Action。我把它总结为:懂知行。最后,形成一个结果。相对来讲,数学在特定领域、特定场景、特定服务中,像物理化学在语言理解上比较容易,在知识体系上容易去做推理。
儿童机器人的差异化,除了有年龄的不同,还可以有哪些不一样?如何看待这一问题?
谢殿侠:儿童机器人的差异化,年龄也只是表现的一个维度和属性。但更重要的是,这个机器人有什么性格、知识体系、掌握了哪些技能,虽然他有相同的知识体系、技能,但由于性格不同,回答问题时就会展现不同的风貌。比如说,在给机器人设计“讲故事”的功能性格特性时,像性格温顺的机器人就会说“你想听什么故事啊”,而性格顽皮的可能则会回答“主人你先讲一个”。
出现这种情况时,我们观察到,小朋友会觉得很好玩。甚至有的小朋友还真讲了一个故事,这个时候事情就会显得很不一样。所以,年龄只是一个晴雨表,但核心的是问题是我们怎么去设计机器人的性格和角色。更为核心的是,我们要把机器人当做一个人,这个人尽可能的去完善机器人的个人画像或知识图谱,从而将它的生理属性描述出来。
有时候小朋友会问,机器人吃什么?这就说明真有小朋友会把机器人当做人来看。这一事实说明,创作一部电影、一部小说,不同的知识图谱或性格的机器人就显然会有不同的回答。
像设计外观形象等物理本体一样投入资源(人员、时间、精力)定义用户使用场景,设计机器人角色性格特点等有关属性,并在此基础上通过整合语义 API(语义理解能力+资源整合规模)实现个性化对话设计,做出有鲜明特点的机器人产品。至少我们提供了一个语义管理的工具箱,可以让大家实现较高程度的个性化。换句话说,你设计了机器人的角色性格特点,整理出问题和答案,我们提供工具让你实现。
海知智能本身是一个提供个性化聊天机器人的开放技术平台,也就是语义理解和资源整合这些基础性的工作,帮助大家做自己的个性化机器人大脑。从词典到多轮对话逻辑,从领域服务到功能个性化等等。儿童陪伴类机器人也是今年的侧重点之一,很希望和大家一起合作打造若干爆款,让更多的小朋友玩具房里多些真正的智能机器人。
人工智能在工业机器人领域有哪些应用范围,未来前景如何?
谢殿侠:我可能了解比较少,就从我看的一个东西获得的启发来说。,它可以完成很多灵活的工作。有一个视频比较火,随便给它一件衣服,他都会折。
当然它现在的动作比较慢,效率很低。但有一个特别的地方——给它一件衬衫,通过判断,就能把它折好。现在就是,传统的工业机器人跟服务型机器人的界限越来越低,甚至有点模糊。或许在未来,一些工业型机器人能够代替家里的阿姨,甚至塞衣服到洗衣机里,端咖啡这些就更加没有问题。
所以,当工业机器人与人工智能对接,除了一些基础性的工作,我能想到的是,工业机器人也能像人一样对话,能够具备一些语言性的能力,不管它在生产线上,还是其他的场合,都能完成一些人不能完成的工作,还有一些人能完成的它们也能完成。
最近听说一些事,维修部有一个工人,操作一些机器或者线上的工业机器人。在这个过程中,怎么发现异常,定位问题过程的解决,这个与语言、与知识图谱有关。实际上就会把人与机器的融合变成人和机器的融合。