澎思科技资深算法研究员罗伯特:AI与乒乓球的双
2019-11-01 18:09
分享:

  中国AI发展大背景下,丰富的场景,充足的资金,雨后春笋般的初创企业,吸引了各式各样的人才加入这个大潮,这些人才中有外国人,也有中文特别好的外国人。罗伯特算是其中一个。

  第一次见罗伯特(RobertLorenz),他正在一间会议室备课。不要误解,他不是老师,而是澎思科技的资深算法研究员。罗伯特的备课,是因为他在第二天要用中文做一场关于《有限算力资源下的深度学习与人脸识别技术》的在线直播课程,这是对他几年来在人工智能领域实践的一次总结和分享。

  关于罗伯特的经历,我早有耳闻。他是德国洪堡大学的数学博士,极为喜欢乒乓球,有一句话形容他“如果Robert没在公司,那他一定是在球场或者打球的路上。”当年因倾慕中国乒乓球技术的强悍毅然放弃了数学研究生涯,来到中国北京乒乓球队进行培训。不过来到北京后却被中国的发展所吸引,从此成为一个“准中国人”。

  罗伯特在北京已经生活了13年,他的中文讲的非常好。据他介绍,他是在2016年计算机视觉顶会CVPR上遇到的澎思科技CEO马原。当时马原已经离开中科院,投身到AI安防在国内多个城市的落地工作中;而罗伯特正担任红极一时的作业神器“学习宝”的联合创始人兼首席科学家。会上,马原意外听到一个外国人在说中文,甚是好奇,搭讪之下,相聊甚欢,互加了微信。2018年,马原创办了澎思科技,之后不久便力邀罗伯特加入这支年轻的团队。

  这可能是当下人工智能圈里最为普遍的故事中的一个。它一定程度下也代表了中国盎然生机的人工智能大环境下每个个体的写照——不过这是一位在中国的德国人。

  罗伯特1973年出生于东德美因河畔法兰克福的一个小镇上,这是一个风景优美的地方,离芬兰很近。

  在德国,足球是他们的国球,基本上每个男孩在小的时候都会尝试去踢足球。足球明星莱因克尔曾经这样描述德国足球的强大:“足球就是22个人在球场上奔跑,最后德国人取得胜利的游戏。”然而,罗伯特孩提时代身体并不足够强壮,在足球上完全没有天赋,很快他便离开了足球俱乐部。

  偶然机会,他发现乒乓球是一项有意思的运动。他身高在德国同龄男孩中并不算高,但动作却比较灵敏,上手之后很快他就成为同龄人中的“高手”。成就感让他越加痴迷,除了上学时间外他把几乎所有时间都花在了乒乓球上。

  “打乒乓球之后觉得身体特别放松,这是一种满意感,别人通过瑜伽或者别的方式来忘掉自我,而乒乓球就是我的‘瑜伽’。”

  12岁那年,罗伯特加入了当地一家乒乓球俱乐部,他很快发现这里没有他的对手,常常会有独孤求败的感觉。

  1986年,他随家人搬到柏林。来到柏林,罗伯特的大部分时间仍然是在乒乓球上,伴随着遇到更多的高手,他的水平也迅速提升。不过那时候乒乓球还不是奥运项目,东德也没有相关的比赛,政府对乒乓球的投入也极低,所以柏林虽然贵为首都,整个乒乓球的水平则并不高。

  不过这并不影响罗伯特享受乒乓球给他带来的乐趣。每天除了上课之外的所有时间都交给了乒乓球。

  除了乒乓球外,罗伯特事实上在数学上具有强大的天赋。他的外公以及爸爸都是数学系博士毕业,可谓是数学世家。曾获得过“德国奥数”之称的德国州级数学比赛冠军的他,从小就展现出在数学方面的天赋,高中时就读于柏林唯一一所数学特校,毕业考试以99分的成绩荣获学校第一名。据了解,被扣的一分不是因为答错而是因为交卷时间早以致卷面不整洁。

  1997年,罗伯特考入了世界闻名的洪堡大学数学系,这是一所爱因斯坦、冯·诺依曼、普朗克、黑格尔、叔本华、谢林、海涅、魏格纳等一众大师曾执教的学校,被誉为“现代大学之母”。截至2018年,洪堡大学产生55位诺贝尔奖得主,位居德国第一、世界第十三。数学专业更是柏林洪堡大学实力最强劲的专业之一。

  在大学期间,罗伯特学习非常刻苦,每天学习时间高达20个小时,常常是4个小时上课,16个小时在家做题。这也充分说明了好学校的好学生,并不容易。

  刻苦的学习,让罗伯特在成绩上一直排在前几名,几乎所有的学科都保持满分的成绩。

  这让洪堡大学的Foellmer教授对其欣赏有加,极力邀请罗伯特在其名下继续读博。

  繁重的学业让罗伯特没有时间继续打乒乓球。他只能在假期期间抓紧时间继续他的爱好,常常每天花8~10个小时的时间打乒乓球。

  “在这几年里,我的身体素质常常是正弦波动,假期期间会攀升至顶峰,而一开学便逐渐地往波谷滑去。”

  2006年,罗伯特博士学位接近结束,他的博士论文《随机微分方程的近似》荣获优秀论文奖。

  是继续从事数学研究,还是找家公司挣钱糊口?对于33岁的罗伯特来讲是一个艰难的选择。

  罗伯特的博士同学,洪堡大学精英中的精英,有90%的都会留在大学做数学研究,继而成为一名教授;而另外10%的则会走进企业。在德国,人们的普遍观念是,进入了一个职位就会在那里工作几十年,甚至一辈子,例如他的妈妈在教师职位上工作了40年,他的叔叔在一家工厂里工作了50年。

  罗伯特认为,自己的一生不应当只呆在一个地方。最终罗伯特成了额外的1%,他买了一张飞往中国的机票。

  读书期间,他曾经遇到一位来自中国的乒乓球球员,和这名球员的切磋让他觉得突然来到了另外一个乒乓世界。据罗伯特回忆,这名球员只是中国一个省队的球员,在中国应该只算二流,但是在德国却够得上一流水平。他意识到,要想在乒乓球上取得更一步的发展,必须去中国。

  恰好,在2005年底,北京体育局副局长牛德成出访德国。罗伯特因机缘巧合认识了牛德成并表达了想来中国学习的愿望。在牛德成的安排下,罗伯特获得了在北京乒乓球队培训的机会。

  对罗伯特来讲,中国是一个完全陌生的世界。走在大街上,他一个字也看不懂;所有人的长相似乎都一样。

  就是在这样一个地方,他要进行两个多月的高强度的乒乓球训练。而此时,他已经33岁。对于中国人来说,这已经是一个不小的年龄,三十而立,而罗伯特还在新的探索。

  中国人训练时,他们会拿一个盆子,里面放许多球,不停地拿球、发球,高强度地训练同一个动作,非常地快。

  另一方面,为了能够交流,在休息之余他也会自己一个人在屋子里学习中文。他突然发现,中文非常的有意思,自己买了几本基础中文教学书学习;同时也会去观察打球时队员们的交流。

  两个月后,在一次打球的间隙,他偶尔和一位球员聊起了天,他很吃惊自己竟然能够用汉语交流十多分钟。

  “我们进行了一个非常简单的对话,他告诉我,他在德国打球,我说我学习数学,正在读博。就是一些非常简单的中文交流,但我却非常有成就感。没想到两个月就可以跟一个中国人进行交流了。”

  因为签证问题,他不得不回去。在回国短暂的时间里,他也完成了他的博士答辩。

  虽然只有两个月,他已经完全喜欢上了中国,并决心要在中国发展。因为他意识到德国的经济已经饱和,而中国每年GDP都是以极高的增长率发展,因此在中国发展将会有更大的空间,这里对他来说也将有更大的机遇。

  他再次踏上了飞往中国的路途。这次虽然仍然是去北京乒乓球队进行训练,但其首要目的却是学习汉语。因为在过去的两个月中,他已经明白无论他如何努力在乒乓球上都不可能打得过中国人。套用莱因克尔的线个人在台子两侧将球推来推去,最后中国队取得胜利的游戏。”

  重回北京后,他住在牛街。白天在北京体育局训练,夜晚一个人在屋子里学习汉语。

  当然,罗伯特也并非是完全地孤独,在这期间他收获了爱情和婚姻。经人介绍,他认识了他现在的妻子,他们都对乒乓球有特别的爱好,而罗伯特真诚的性格打动了女方。

  婚后的罗伯特不可能再像一个人那样,沉浸于乒乓球训练和汉语学习当中。他需要钱和稳定的工作来养活家人。

  这是一个关于模式识别的工作,具体来说是铁道部车厢故障检测。面试中,老板给他两张图,一张是没有故障的车厢,另一个是有故障的。他发现这种检测不过是一个简单的数学问题,其建模根本用不到太高深的数学,本科知识足矣。老板当即拍板,让他直接来上班。

  罗伯特之前基本没有写过代码,最多只是大学期间接触的一点数值分析,用的语言却是pascal。现在则需要从头开始学习C语言。不过对他来说,连复杂的汉语都学会了,C语言更不在话下。

  因为拥有扎实的数学功底,罗伯特上手之后游刃有余,两年时间里迅速独立完成了18种故障检测算法,这些算法目前仍然还被中国铁道部门使用。

  值得一提的是,幸运的人生往往也会有位幸运的妻子。罗伯特属于幸运的人,例如他的妻子帮他投了第一份简历,把他带入了人工智能的世界;同样在2009年,他的妻子督促他花了100多万在北京买了一套145平的房子,而随后房价一路飙升;他们也分别在2010年和2013年有了孩子,罗伯特从此在中国扎下了根。

  在2012年,铁道部的项目已经基本结束,老板觉得罗伯特应该转而去做文字识别(OCR),因为他想到一个很好的商业契机,即做一个网上答题系统。简单来说就是学生用手机拍一道题,上传到服务器中,根据文字识别技术,将拍出的图像转成文字,通过题库搜索找出最相似的题并将答案反馈给用户。

  老板邀请罗伯特担任公司的联合创始人兼首席科学家。罗伯特不负所望,在一年的时间里便完成了学习宝所有模式识别算法的搭建及商用。

  我们知道,即使现在在神经网络的协助下,文字识别准确率也并不如何高,更何况当时主要使用的是基于特征的传统统计方法。不过对于“学习宝”来讲这些都是可以克服的。首先,他们发现在国内学校的各种习题中主要只有四种字体:方体、宋体、楷体和黑体,针对特定的字体,即使使用传统基于特征的方法识别率也能达到97%以上。其次,即使即使100个字中有3个字识别错误也没有关系,因为题库搜索过程可以包容一定程度的不一致性。

  相对来讲,用户拍图的质量才是最重要的影响,不同角度、抖动都会造成识别困难。罗伯特通过搜集大量用户反馈的崩溃样本(大约一万多张)后,一步步改进了这个产品的质量。

  2015年,学习宝获得软银中国领投2500万美元投资。这其中,罗伯特发挥着巨大的技术作用。

  作为首席科学家,罗伯特一直也在研究如何能够利用前沿的技术改进产品性能。2015年初,注意到深度学习技术在学术界引起巨大的变革,他开始对神经网络进行深度地研究。

  最初罗伯特只是想把这个技术应用在文字上,不过后来他发现这是完全没必要的。原因在于对“学习宝”这样一件产品来说,传统方法基本已经满足需求,而另一方面传统方法相对比较快速,深度学习则需要耗费巨大的资源。

  基于兴趣,也基于工作需要,罗伯特报名并参加了CVPR2016(国际计算机视觉与模式识别会议)。正如前面提到的,他在这次会议上认识了马原。他们达成了一个共识,即在深度学习时代,人脸识别才是更前沿的领域。

  深度学习带来的人工智能的第三次热潮下,大量资本和人才涌入,对于初创企业,必须精耕产品才能发挥技术的价值。马原给澎思科技的定位正是这样,秉持以客户为重,让产品和服务真正解决客户的实际问题,陪伴客户共同成长。

  与此同时,罗伯特在学习宝,一方面商业模式难以持续;另一方面,罗伯特对人脸识别也越来越有深厚的兴趣。

  马原出身安防领域,团队拥有多年丰富的AI+安防行业落地服务经验,研发、技术团队也都具备较强的产品化和服务能力。在算法层面,自然希望有长期工业界经验的罗伯特加入。

  不过,最让罗伯特心动的则是,澎思科技的“野心”。按照马原的说法,澎思将致力成为一家具有国际视野的人工智能公司,为平安城市、智慧社区、智慧园区、智能交通、智能制造等领域提供技术和软硬件产品解决方案,来推动AI产业化落地进程。

  在马原的邀请之下,罗伯特加盟澎思科技,负责人脸跟踪、人脸质量判断、人脸检测、模型压缩等相关的研发工作。

  罗伯特站在一个新的层面上再次与图像打交道,每天搜集论文,阅读论文,复现论文。多年在工业界的经验培养了罗伯特强大的工业化能力与极强的交付能力,尽管一切从头开始,罗伯特很快便创造了一个适合在MOVIDIUS能实时处理最多9个人的抓拍方法,在8GPU、2CPU的平台上研发出可以实时处理256路的视频数据。

  一面是全力以赴做AI的资深算法研究员,一面仍然热衷于乒乓球。无论工作多忙,他都会定期去和专业队的朋友打球。

  “如果时间长不练,我的心态就会变得不那么好,可能只是一些小苗头,例如感觉生活不幸福,工作没有激情。但一进入球场,这些就全然忘了,那是一种忘我的状态。我非常开心。”

  罗伯特要想与他在专业队的朋友打乒乓球,就必须工作日去;而相应的则是周末调休。同样的,他可以在我们的春节期间工作,而另外一些时间(例如圣诞)飞回德国。

  罗伯特是一个典型德国人,严谨、守时、自律性极强。因此在灵活掌控自己工作时间的情况下,圣诞节放假、春节加班并不会影响他的工作进度,反而能提前完成工作内容。

  自律是罗伯特的生活方式。罗伯特告诉笔者:“一个值得信赖的人要做不确定生活中的确定部分,这种自律无论对人对己都是一种安全感。”

  像许多已经在中国生活十多年的外国人一样,罗伯特已经把中国当做第二故乡,在这里生根、发展。可以预期的将来,会有越来越多像他一样外国人来到中国,成为中国的一份子,不仅仅是因为我们的国球,还因为我们的科技,我们的文化。特别是在中国AI发展大背景下,丰富的场景,诸多亟待解决的问题,这对国内外人才都是极大的吸引;创业公司重视技术落地,也将为他们提供多彩的舞台和机会。

  澎思科技今年3月份在新加坡成立了研究院,计算机视觉与深度学习领域顶级科学家申省梅加入担任首席科学家。申省梅是目前计算机科学和人工智能领域少有的华人女性科学家,拥有计算机视觉的全栈技术能力,在深度学习下的人脸检测和识别、行人检测和跟踪、行人再识别、车辆识别、自动驾驶、驾驶员行为检测、移动操作机器人等领域均取得了世界顶级成果。

  罗伯特现在需要经常往返北京和新加坡。他开始接触更前沿的技术,更宽松自由的科研环境、以及更年轻富有活力的小伙伴们。于他而言,这是一种全新的生活节奏。

  7月,澎思新加坡研究院正式揭牌,澎思科技宣布成立澎思技术委员会,囊括了新加坡国立大学、南洋理工大学的多位AI大牛,并与国立大学、南洋理工学院签订战略合作,可以说澎思科技拿下了新加坡AI学术圈的半壁江山。在揭牌仪式上,澎思科技再次强调研究院的定位:一方面从全球视角探索前沿科技,做技术上的储备和研发;另一方面兼顾工业级研发和交付能力,针对垂直领域做技术研发和创新。

  作为兼顾学界和工业界的科学家,申省梅重视AI技术在各行业的落地应用,她领导的团队已获得十余项计算机视觉领域国际顶级竞赛冠军和300多项专利,并在各种产品中得到广泛应用,申老师的加入更是给澎思科技注入了新的活力。罗伯特说,“北京和新加坡研究院算法组的同事每周四上午都会开周会,申老师为大家分享前瞻性的AI技术,更是拓宽了我们的国际化视野,让我们在低头做事的基础上还可以抬头看路。申老师加入后,大家的工作好像更有了动力。”

  正是在这种浓厚的学术氛围下,澎思科技在算法上接连取得突破,先后拿下了行人再识别(ReID)技术Market1501,DukeMTMC-reID,CUHK03数据集和视频行人再识别(Video-basedReID)技术PRID-2011,iLIDS-VID,MARS数据集的冠军,算法关键指标首位命中率(Rank-1Accuracy)获得业内最好成绩,刷新了世界纪录。

  荣誉的背后其实是无限的挑战。但罗伯特无所畏惧,在充满机遇与挑战的世界里,他相信自己正在做正确的事情。