澎思科技资深算法研究员罗伯特:AI与乒乓的双面
2019-12-29 20:14
分享:

  中国AI发展大背景下,丰富的场景,充足的资金,雨后春笋般的初创企业,吸引了各式各样的人才加入这个大潮,这些人才中有外国人,也有中文特别好的外国人。

  第一次见罗伯特(Robert Lorenz),他正在一间会议室备课。不要误解,他不是老师,而是澎思科技的资深算法研究员。罗伯特的备课,是因为他在第二天要用中文做一场关于《有限算力资源下的深度学习与人脸识别技术》的在线直播课程,这是对他几年来在人工智能领域实践的一次总结和分享。

  关于罗伯特的经历,我早有耳闻。他是德国洪堡大学的数学博士,极为喜欢乒乓球,有一句话形容他“如果Robert没在公司,那他一定是在球场或者打球的路上。”当年因倾慕中国乒乓球技术的强悍毅然放弃了数学研究生涯,来到中国北京乒乓球队进行培训。不过来到北京后却被中国的发展所吸引,从此成为一个“准中国人”。

  罗伯特在北京已经生活了13年,他的中文讲的非常好。据他介绍,他是在 2016 年计算机视觉顶会 CVPR 上遇到的澎思科技CEO马原。当时马原已经离开中科院,投身到AI安防在国内多个城市的落地工作中;而罗伯特正担任红极一时的作业神器“学习宝”的联合创始人兼首席科学家。会上,马原意外听到一个外国人在说中文,甚是好奇,搭讪之下,相聊甚欢,互加了微信。2018年,马原创办了澎思科技,之后不久便力邀罗伯特加入这支年轻的团队。

  这可能是当下人工智能圈里最为普遍的故事中的一个。它一定程度下也代表了中国盎然生机的人工智能大环境下每个个体的写照——不过这是一位在中国的德国人。

  罗伯特1973年出生于东德美因河畔法兰克福的一个小镇上,这是一个风景优美的地方,离芬兰很近。

  在德国,足球是他们的国球,基本上每个男孩在小的时候都会尝试去踢足球。足球明星莱因克尔曾经这样描述德国足球的强大:“足球就是22个人在球场上奔跑,最后德国人取得胜利的游戏。”然而,罗伯特孩提时代身体并不足够强壮,在足球上完全没有天赋,很快他便离开了足球俱乐部。

  偶然机会,他发现乒乓球是一项有意思的运动。他身高在德国同龄男孩中并不算高,但动作却比较灵敏,上手之后很快他就成为同龄人中的“高手”。成就感让他越加痴迷,除了上学时间外他把几乎所有时间都花在了乒乓球上。

  “打乒乓球之后觉得身体特别放松,这是一种满意感,别人通过瑜伽或者别的方式来忘掉自我,而乒乓球就是我的‘瑜伽’。”

  12岁那年,罗伯特加入了当地一家乒乓球俱乐部,他很快发现这里没有他的对手,常常会有独孤求败的感觉。

  1986年,他随家人搬到柏林。来到柏林,罗伯特的大部分时间仍然是在乒乓球上,伴随着遇到更多的高手,他的水平也迅速提升。不过那时候乒乓球还不是奥运项目,东德也没有相关的比赛,政府对乒乓球的投入也极低,所以柏林虽然贵为首都,整个乒乓球的水平则并不高。

  不过这并不影响罗伯特享受乒乓球给他带来的乐趣。每天除了上课之外的所有时间都交给了乒乓球。

  除了乒乓球外,罗伯特事实上在数学上具有强大的天赋。他的外公以及爸爸都是数学系博士毕业,可谓是数学世家。曾获得过“德国奥数”之称的德国州级数学比赛冠军的他,从小就展现出在数学方面的天赋,高中时就读于柏林唯一一所数学特校,毕业考试以99分的成绩荣获学校第一名。据了解,被扣的一分不是因为答错而是因为交卷时间早以致卷面不整洁。

  1997年,罗伯特考入了世界闻名的洪堡大学数学系,这是一所爱因斯坦、冯·诺依曼、普朗克、黑格尔、叔本华、谢林、海涅、魏格纳等一众大师曾执教的学校,被誉为“现代大学之母”。截至2018年,洪堡大学产生55位诺贝尔奖得主,位居德国第一、世界第十三。数学专业更是柏林洪堡大学实力最强劲的专业之一。

  在大学期间,罗伯特学习非常刻苦,每天学习时间高达20个小时,常常是4个小时上课,16个小时在家做题。这也充分说明了好学校的好学生,并不容易。

  刻苦的学习,让罗伯特在成绩上一直排在前几名,几乎所有的学科都保持满分的成绩。这让洪堡大学的Foellmer教授对其欣赏有加,极力邀请罗伯特在其名下继续读博。

  繁重的学业让罗伯特没有时间继续打乒乓球。他只能在假期期间抓紧时间继续他的爱好,常常每天花8~10个小时的时间打乒乓球。

  “在这几年里,我的身体素质常常是正弦波动,假期期间会攀升至顶峰,而一开学便逐渐地往波谷滑去。”

  2006年,罗伯特博士学位接近结束,他的博士论文《随机微分方程的近似》荣获优秀论文奖。

  是继续从事数学研究,还是找家公司挣钱糊口?对于33岁的罗伯特来讲是一个艰难的选择。

  罗伯特的博士同学,洪堡大学精英中的精英,有90%的都会留在大学做数学研究,继而成为一名教授;而另外10%的则会走进企业。在德国,人们的普遍观念是,进入了一个职位就会在那里工作几十年,甚至一辈子,例如他的妈妈在教师职位上工作了40年,他的叔叔在一家工厂里工作了50年。

  罗伯特认为,自己的一生不应当只呆在一个地方。最终罗伯特成了额外的1%,他买了一张飞往中国的机票。

  读书期间,他曾经遇到一位来自中国的乒乓球球员,和这名球员的切磋让他觉得突然来到了另外一个乒乓世界。据罗伯特回忆,这名球员只是中国一个省队的球员,在中国应该只算二流,但是在德国却够得上一流水平。他意识到,要想在乒乓球上取得更一步的发展,必须去中国。

  恰好,在2005年底,北京体育局副局长牛德成出访德国。罗伯特因机缘巧合认识了牛德成并表达了想来中国学习的愿望。在牛德成的安排下,罗伯特获得了在北京乒乓球队培训的机会。

  对罗伯特来讲,中国是一个完全陌生的世界。走在大街上,他一个字也看不懂;所有人的长相似乎都一样。

  就是在这样一个地方,他要进行两个多月的高强度的乒乓球训练。而此时,他已经33岁。对于中国人来说,这已经是一个不小的年龄,三十而立,而罗伯特还在新的探索。

  “中国人训练时,他们会拿一个盆子,里面放许多球,不停地拿球、发球,高强度地训练同一个动作,非常地快。”

  另一方面,为了能够交流,在休息之余他也会自己一个人在屋子里学习中文。他突然发现,中文非常的有意思,自己买了几本基础中文教学书学习;同时也会去观察打球时队员们的交流。

  两个月后,在一次打球的间隙,他偶尔和一位球员聊起了天,他很吃惊自己竟然能够用汉语交流十多分钟。

  “我们进行了一个非常简单的对话,他告诉我,他在德国打球,我说我学习数学,正在读博。就是一些非常简单的中文交流,但我却非常有成就感。没想到两个月就可以跟一个中国人进行交流了。”

  因为签证问题,他不得不回去。在回国短暂的时间里,他也完成了他的博士答辩。

  虽然只有两个月,他已经完全喜欢上了中国,并决心要在中国发展。因为他意识到德国的经济已经饱和,而中国每年GDP都是以极高的增长率发展,因此在中国发展将会有更大的空间,这里对他来说也将有更大的机遇。

  他再次踏上了飞往中国的路途。这次虽然仍然是去北京乒乓球队进行训练,但其首要目的却是学习汉语。因为在过去的两个月中,他已经明白无论他如何努力在乒乓球上都不可能打得过中国人。套用莱因克尔的线个人在台子两侧将球推来推去,最后中国队取得胜利的游戏。”

  重回北京后,他住在牛街。白天在北京体育局训练,夜晚一个人在屋子里学习汉语。

  当然,罗伯特也并非是完全地孤独,在这期间他收获了爱情和婚姻。经人介绍,他认识了他现在的妻子,他们都对乒乓球有特别的爱好,而罗伯特真诚的性格打动了女方。很快他们便步入婚姻的殿堂。

  婚后的罗伯特不可能再像一个人那样,沉浸于乒乓球训练和汉语学习当中。他需要钱和稳定的工作来养活家人。

  值得一提的是,幸运的人生往往也会有位幸运的妻子。罗伯特属于幸运的人,例如他的妻子帮他投了第一份简历,把他带入了人工智能的世界;同样在2009年,他的妻子督促他花了100多万在北京买了一套145平的房子,而随后房价一路飙升;他们也分别在2010年和2013年有了孩子,罗伯特从此在中国扎下了根。

  我们知道,即使现在在神经网络的协助下,文字识别准确率也并不如何高,更何况当时主要使用的是基于特征的传统统计方法。不过对于“学习宝”来讲这些都是可以克服的。首先,他们发现在国内学校的各种习题中主要只有四种字体:方体、宋体、楷体和黑体,针对特定的字体,即使使用传统基于特征的方法识别率也能达到97%以上。其次,即使即使100个字中有3个字识别错误也没有关系,因为题库搜索过程可以包容一定程度的不一致性。

  罗伯特站在一个新的层面上再次与图像打交道,每天搜集论文,阅读论文,复现论文。多年在工业界的经验培养了罗伯特强大的工业化能力与极强的交付能力,尽管一切从头开始,罗伯特很快便创造了一个适合在MOVIDIUS能实时处理最多9个人的抓拍方法,在8GPU、2CPU的平台上研发出可以实时处理256路的视频数据。

  像许多已经在中国生活十多年的外国人一样,罗伯特已经把中国当做第二故乡,在这里生根、发展。可以预期的将来,会有越来越多像他一样外国人来到中国,成为中国的一份子,不仅仅是因为我们的国球,还因为我们的科技,我们的文化。特别是在中国 AI发展大背景下,丰富的场景,诸多亟待解决的问题,这对国内外人才都是极大的吸引;创业公司重视技术落地,也将为他们提供多彩的舞台和机会。

  澎思科技今年3月份在新加坡成立了研究院,计算机视觉与深度学习领域顶级科学家申省梅加入担任首席科学家。申省梅是目前计算机科学和人工智能领域少有的华人女性科学家,拥有计算机视觉的全栈技术能力,在深度学习下的人脸检测和识别、行人检测和跟踪、行人再识别、车辆识别、自动驾驶、驾驶员行为检测、移动操作机器人等领域均取得了世界顶级成果。

  7月,澎思新加坡研究院正式揭牌,澎思科技宣布成立澎思技术委员会,囊括了新加坡国立大学、南洋理工大学的多位AI大牛,并与国立大学、南洋理工学院签订战略合作,可以说澎思科技拿下了新加坡AI学术圈的半壁江山。在揭牌仪式上,澎思科技再次强调研究院的定位:一方面从全球视角探索前沿科技,做技术上的储备和研发;另一方面兼顾工业级研发和交付能力,针对垂直领域做技术研发和创新。

  作为兼顾学界和工业界的科学家,申省梅重视AI技术在各行业的落地应用,她领导的团队已获得十余项计算机视觉领域国际顶级竞赛冠军和300多项专利,并在各种产品中得到广泛应用,申老师的加入更是给澎思科技注入了新的活力。罗伯特说,“北京和新加坡研究院算法组的同事每周四上午都会开周会,申老师为大家分享前瞻性的AI技术,更是拓宽了我们的国际化视野,让我们在低头做事的基础上还可以抬头看路。申老师加入后,大家的工作好像更有了动力。”

  正是在这种浓厚的学术氛围下,澎思科技在算法上接连取得突破,先后拿下了行人再识别(ReID)技术Market1501,DukeMTMC-reID,CUHK03数据集和视频行人再识别(Video-based ReID)技术PRID-2011,iLIDS-VID,MARS数据集的冠军,算法关键指标首位命中率(Rank-1 Accuracy)获得业内最好成绩,刷新了世界纪录。

  荣誉的背后其实是无限的挑战。但罗伯特无所畏惧,在充满机遇与挑战的世界里,他相信自己正在做正确的事情。