思岚科技CEO陈士凯:机器人采用的激光雷达在功能和分级上有哪些分类?
8月31日,英特尔&硬蛋机器人创新生态的“机器人大家说”正好做了一期以激光雷达和SLAM技术为主题的线上分享活动,嘉宾陈士凯给大家带来了一场满满干货、见解独到的主题分享。考虑到干货篇幅过长,所以按照内容将其分成了3节。今天先放出第1节内容,后续2节将于后两日持续输出,祝大家“用餐”愉快=。 =
嘉宾介绍:
陈士凯 上海思岚科技有限公司(SLAMTEC)CEO,08年毕业于上海交大,毕业后在微软亚洲研究院(MSRA)实习。后在英特尔亚太研发有限公司软件与服务事业部(SSG)担任软件工程师,11年进入盛大创新院。之后在RoboPeak一支机器人研发团队的基础上创办了SLAMTEC。
1、能否通俗地解释一下激光雷达和SLAM技术的工作原理。二者有什么关系,又是如何运用在一起的?
陈士凯:激光雷达相信最近媒体上宣传的非常火热。比如像谷歌的无人驾驶汽车,车顶上圆形的物体就是一个激光雷达。(激光雷达本质上来说,就是一种使用激光来测量物体轮廓的物体。)
为了大家更好地理解,我先们先来看一下二维的激光雷达在室内机器人行走的时候测量的环境轮廓信息。激光雷达本质上是一个高速的激光测距系统,一般会把它安装在一个机械的装置上。这个激光测距的系统在 1秒钟可以进行上千次甚至上万次对这个环境的扫描,然后配合旋转能在一瞬间将环境的轮廓信息绘制出来,并且精度也会很高。这个就是激光雷达的工作原理。
激光雷达本身用途非常多。今天除了我们介绍的要用它做SLAM以外,行业一般用的最多的就是以下几个。
1.空间测绘。因为激光是一个非常高精度的传感器。
2.用于安全领域。比如说我们在一些科幻片或动作片里会看到的场景,比如说特工去偷东西然后会发现这个环境存在很多激光束,一触碰就会触动自动报警机制。实际上,工业也会使用激光雷达产生激光束,以防止有人进入车间。把当检测到有人进入车间,机器就会自动停机。
以上这个视频(请将手机竖起来观看o(╯□╰)o)演示的就是使用思岚的激光雷达来进行空间三维测量的这样一种应用。当然的这个事对我们来说是属于激光雷达除自主导航定位以外的延伸应用。
现在来聊聊SLAM和激光雷达的关系。首先SLAM,它的英文全称为((simultaneous localization and mapping),中文翻译为同步定位与建图。乍听上去是一个比较高大上的技术。
通俗来说,如果大家玩过像星际和红警这种即时战略游戏的话。SLAM就相当于你去一个单位勘探地图的这样一个过程。里面它会包括两个部分:一个就是一开始并不清楚机器人的位置,并且也不了解这个环境。借助SLAM就能同时把位置信息和环境地图够给到机器人。
在激光雷达来进行SLAM的过程中,里面采用的是思岚科技的RPLIDAR和SLAMWARE导航定位系统产生的。过程是这样的,一方面半透明的红色多边形部分是由激光雷达给出的当前这个时刻机器人所在环境的轮廓信息。SLAM做的事情就是把这个环境的轮廓信息与之前已经建立的地图进行匹配,这个匹配的过程还涉及对机器人以前产生的误差的纠正。比如说,如果机器人突然之间中途打了个滑,这个匹配的过程就能将误差修正过来。一旦修正完成,机器人就能将当前的激光雷达产生的信息加入其中,久而久之就能产生一个完整的地图。
以上其实是对SLAM技术比较通俗而又不太精确的描述。实际上在学术界,SLAM它并不需要我们人类能够理解的地图。比如说现在我们做的一些基于摄像头的vSLAM,还有很早基于性标而建立的EKF-SLAM。严谨来说,SLAM解决的本质问题是机器人在定位过程中不会累计误差。实际上这也是机器人学里经常讨论的问题。传统上来说如果没有SLAM的话,机器人会随着时间的漂移产生累计误差。SLAM本质上是一个数学模型,可以保证无论在多长的时间里,误差不会累计。
2、不同的机器人采用的激光雷达在功能和分级上有哪些不同?
陈士凯:那么,我们先从大家能够感觉到的一种功能点或者性能上来进行分级。
一、从探测半径来看,可以分为以下几个档次:
1.可适用于100-200m甚至更远距离的远距离激光雷达。如谷歌无人驾驶汽车里就用的此种类型的激光雷达;
2适用于商用条件下的10-100m以内的中等距离激光雷达;
3.适用于家庭环境下的近距离激光雷达,如家庭机器人中的扫地机器人采用的就是6m半径以内的激光雷达。
二、从采样频率或者扫描速度来对激光雷达进行分级。
实际上扫描速度和采样频率,两者之间还是有区别的。我们都知道激光雷达里面就是一个高速的激光测距仪,这个激光测距仪在一秒钟内能够进行的测量次数,就是激光雷达的采样频率。
比如说,像RPLIDAR在一秒钟内可以扫描4000次点的测量,而我们的RPLIDAR扫描时还是需要进行旋转。 也就是说,如果我希望这个激光雷达一秒钟要转10圈的话,那么,对于一个一秒钟测量4000点的激光雷达来说,它每圈就可以分到400个点。除此以外,它还能够识别出0.9度这样一个角度分辨率的区分。如果将激光雷达的采样频率做得更快,它旋转一圈就能采集到更多的点,所以能够更加精确地去刻画环境的数据。相反,如果激光的采样频率降低,它分到一圈的点数也会下降。在这种情况下,会带来一些问题,比如说它扫描的点足够稀疏,就有可能漏掉环境的轮廓信息。
上面两个截图分别展示的是4000sps/s和2000sps/s采样频率的激光雷达,即在相同转数(10圈)下,1秒钟测量4000个点和1秒钟可扫描2000个点的激光雷达的对比。
我们可以很明显地发现,后者2000sps/s激光雷达扫描的点会更加稀疏。当然这里还不是比较极端的情况,如果说扫描的频率还未达到2000点,那么其点的个数会更加少。如果这时候机器人正前方有一根杆子,这时候激光雷达很有可能不会扫描到杆子,最终就会导致机器人撞上去。这就是采样频率过慢会带来的一个问题。
那当然也有人会说,如果采样频率慢,我们把转速降低,其实分到每圈的点数会变得更多。这样也会带来一个问题,如果单纯转速变慢,它对环境的测量就会变得不是很实时。采样频率过慢会使得机器人在一圈看到的点很少,很容易撞到一些障碍物。这个我们有一个图片可以对二者做对比,让大家有个直观的了。
这个视频里描述的都是采用4000sps/s的激光雷达,左边部分采用10Hz,也就是一秒钟转十圈,右边这张图则降低了采样频率:一秒钟转5圈,即为5Hz的两种转速下的对比。我们会明显地发现,左边就这张图的激光雷达或者说机器人在移动、扭动的时候,其激光雷达的数据可以非常实时地反映出环境的变化。不过这样一对比就可以看出二者在实际应用中的一个局限性,对于像那种家用的或者运行的比较慢的机器,5Hz的速度已经足够。但是对于用在商用领域或者要求更高的高速转动的物体传输领域,这样的雷达就不够用。
这样就涉及到一个话题,到底怎样的采样频率才是够用的?实际上,我们知道激光本质上是一个高速旋转的激光测距仪。为什么说激光雷达现在的自身研发有难度?其实淘宝上有很多非常便宜的激光测距的测距齿,但是它们为什么不能用来做激光雷达呢?实际上这就跟其采样频率有关。我们行业内有一个通用的要求,激光雷达它的转数不能低于5Hz/s,且每一圈采集到的点数应该要达到30-60个点,也就是说每一圈都能采集到一个角度。那么在满足这种指标的情况下,激光雷达的采样频率至少需要达到1800个点数。
那么如果说要把1800次的测量频率降到更低,我们除了降低转数还有一种办法,就是必须得容忍更低的点数,这样就会导致机器人在SLAM的过程中出现很多的问题。比如说地图绘制不够全面,机器人在导航壁障的时候出现问题。以上就是对于激光雷达来说比较重要的2个指标。当然除了这两个指标以外,实际上它们在本质的工作原理上还有很大的区别。
三、按照距离测量的原理划分,有两种方式:
1.一种是TOF技术,即Time of Flight。它是一种进行光飞行的时间测量的方式。这种方式,顾名思义就是发射出一道激光,然后会有一种二极管来进行激光的回波检测,我们再使用一个很高精度的计时器去测量光波发射到目标物引起反馈再回来的时间差,然而我们都知道光速具有不变性,再将时间差乘以光速就可以得到目标物体的距离。而这个就是被现在主流的各大工业级别的激光雷达所采用的距离测量的方式。
实际上这种测量方式有一个比较大的问题:它的成本非常贵。因为进行光速的测量需要非常高精度的计时器。这个计时器并不是说只要能区分出毫秒和微秒就够了,他还需要达到皮秒级别的测量精度。此外,对于激光器和检测的传感器来说,都需要非常高端的器件,并且在光学上也有很高的要求。
另外对于TOF的测量方式,再细分下去还有两种类型。
1)一种叫做脉冲式;
2)另一种是相位式。
脉冲式比较简单直接,就是发出一道激光的脉冲,然后再检测激光的相关信息。这个是目前TOF的激光雷达采用的主流方式。
相位式则是连续的发射激光。但是接收到的回波信号会由于光速传播的特性,相位上会有差距。当检查相位时就可以转过来去处理这个距离。这种方式他的优势在于成本相对来说会更加便宜,但其主要问题是测量的速度没法提高。现在淘宝上卖的激光测距笔就是采用的相位法的激光测距。
2.还有另一种全新的测量方法——三角测距法。像我们能听到的connect的体感摄像头,还有Intel研发的RealSense都会使用到三角测距法。这种方式本质上来说是一种基于图像处理的方法。打个比方,我们给人拍照,而人距离相机的远近就会决定TA在成像里的大小,这就是三角测距的一种原理应用。三角测距法采用了一种特制的摄像头,能拍摄出激光的光斑的特性,从而能反推出距离。
这种方式的最大优点于它的成本相比TOF(Time of Flight)来说,会有很大的降低。三角测距法本质上来说是一个摄像头加一个处理芯片。
当然这种方式也会有一些缺点。就像拍照一样,它会有分辨率的限制。如果分辨率不高,物体比较远,它就可能会看不清。同理,三角测距法对于远距离的物体来说,就会看的不是非常清楚,所以这里对算法有很高的挑战。如果算法不够优秀,即使测量四五米开外的物体就会出现问题。
详细对比如上表,那实际上来说,TOF(Time of Flight)方法在性能上比较占优,但成本过高。而三角测距法则相反,在成本上,它是一种非常占优的方案。但是其缺点在于如果软件的复杂度不够高,在进行远距离的测量的时候,性能就会下降得特别快。
具体可由下图以作理解:
可以看到这个画面中,右边这张图显示的就是,算法写的不好或者是说比较传统的激光雷达,它在测量远距离的物体时,明明应该是一个笔直的墙体,但是它扫描出来的效果就会有很多类似锯齿状的马赛克的感觉,给后期的算法处理上带来了很多障碍。
左图的就是我们思岚科技使用的全新RPLIDAR 2.0的算法。这个算法可以使得激光在远距离的情况下做的非常远。实际上三角测距的激光雷达存在的一个主要的制约技术门槛,就在于算法的优秀性。目前主流的激光雷达一般能做到6m的测量半径,而像我们思岚科技的RPLIDAR A2,它有一个工业的版本,可以在半径16m范围内实现像在4、5m半径的高精度测量。现在我们的一些行业客户也开始使用这种远距离的版本。
四、从固态的激光雷达来说,是区别于机械式的激光雷达来说的。为什么大家会提到这个东西呢?因为机械式的激光雷达大多存在生命的限制问题。
实际上这就是关于激光雷达是否存在寿命问题的问题了。首先任何设备都会具有寿命的上限。但是对于机械式的激光雷达,一般会有一些影响其寿命的要素。如,内部的机电系统,它使用的电机是无刷的还是有刷的。还有因为我们知道雷达是一个要进行旋转物体间的信号和电能传输的设备。那么怎样来进行相互的电能和信号的传输呢?行业内一般会用到一种叫做“打电话”的东西,它是目前激光雷达成本降不下来的主要职业瓶颈。“打电话”连续工作半年,它的寿命就会产生影响。激光雷达现在一般会采用一些新技术。像我们的RPLIDAR会采用无刷电机和光电融合的技术,这样就能延长激光的寿命。
这张图展示的就是像我们目前最新的RPLIDAR A2内部采用的就是自主设计的无刷的电子系统以及光子融合技术在里边进行电能核信号的传输。这一块相对于前面提到的几个核心性能指标里并不是最重要的东西,但是在雷达上的选型上来说占据了举足轻重的位置。