推理大师 https://www.td010.com 下午五点,刘衍东坐在实验室的沙发上,一只手紧紧捏住运动水壶,另一只手的大拇指抠着壶盖上的带子,一下,两下,三下,抠得带子掉落,他再穿回到瓶盖上,然后继续抠。 时间好像静止了,水壶快要被捏扁。他试着抬起头打破沉默,眼神却忽然漂移到天花板上,“咦,这个灯的颜色原来还会变。”几秒钟后,光线从紫红变回深蓝,透过磨砂玻璃灯罩映射到地面。他收起好奇的表情,盯着光束,又愣住了。 这个高三男生陷入某种遥远的回忆,仿佛眼前面对的是一个无解的难题—— 你更喜欢音乐还是更喜欢科研? 英才学院外观 半小时前,北京一零一中学的本部校园开始热闹起来,刘衍东拎着水壶走出教学楼,顺着校内湖边的小径,来到一栋三层矮楼前。门口醒目挂着“英才学院”四个字,以及形形色色的牌匾。 他径直走上二楼,推开第一间屋子的门,跟老师打了个招呼便坐到电脑前。 湖畔不远处,孔雀晒着羽毛小憩,两只羊驼索性走出窝棚,在鹅卵石路上溜达……恰逢下课时间,湖面廊桥上都是穿着红绿蓝色校服的学生,如果不是他们,你会误以为自己置身皇家园林的腹地。 一零一中学校园内的小型动物园,内有羊驼、天鹅、孔雀、橘猫等 “来,咱看看谁能从这儿跳过去”,几个男生叫嚷着站上桥头,隔着湖水朝一米多远的岸边跃跃欲试,周围女生拍手起哄。 此刻,校长陆云泉正在湖边办公室里望向窗外,“这个湖也就一米深,掉下去也没事”,他笑到,“孩子都是喜欢玩的,就让他们折腾去。” 少年湖中的野鸭。学校位于圆明园遗址,被誉为亚洲最美中学校园 野趣丛生的环境给这所中学披上了一层神秘浪漫的面纱,也为陆云泉的办学理念做了天然的注脚:好玩。 让学生更高级地玩,是陆云泉创办英才学院的初衷。“把孩子往水里一扔,扑腾出来的那就是游泳健将,当然安全底线还是要保住,该考试考试,该上课上课。但拔尖创新人才的培养,不能空喊口号,总要有一个平台才能推进下去。” 在英才学院这片浩瀚的湖水里,刘衍东就是那个“扑腾出来”的孩子。 打开手机里的音乐播放器,连接耳机,音量调到一格,你能听到什么? 声音也太小了,这怎么听得清?——大多数人应该都是这个反应。 用2%的音量听歌,这是刘衍东的常规操作,他可以听得足够清楚,无论歌词还是曲调。这也是为什么他会从一场线上音乐会里,感受到音质的瑕疵,继而下决心搞一个课题。 那场音乐会是在B站直播,刘衍东听着听着就觉得不对劲儿了,一看编码是128kbps,相当于是有损压缩,就会对音质造成损失。他好像天生有一双敏锐的耳朵,听音乐都带有某种批判性。 整场听下来,他满脑子都是一个问题:既然现在连图片超分辨率都有,为啥不能整个音频还原? 那时的刘衍东还在一零一中学的国际部上高一,课余时间酷爱听音乐,尤其热衷交响乐和电子乐两个类型。恰恰这两种音乐对高频段音质有着严苛的要求。 刘衍东(右) 如果没有这个听歌的“怪癖”,恐怕也就没了后来的许多故事:进入英才学院、结缘北大导师、在国际会议上发表论文——第三届IEEE信息与计算机前沿技术国际会议召开前一个多月,刘衍东钻研了一年多的《基于超分辨率卷积网络和对抗生成网络的有损压缩音乐还原》收到了录用通知。 从4岁学钢琴,到18岁发表国际论文,“声音”一直是他的人生关键词。由这个词扩展出的两个维度,几乎占据了全部的课余时间——音乐,科研。正如刘衍东在B站的个人简介:一名17岁高中生,热爱科技、音乐。 刘衍东热衷于自己制作改编音乐 “各占50%吧,音乐是最开始的兴趣”,思忖半天,他终于憋出了这句话。 刘衍东甚至忘了自己最初接触音乐的年龄,在男孩子最淘气最坐不住的年纪,主动要求学钢琴,并且一学就到了七级。“好像是4岁开始学的,本来也没想着考级,就是喜欢,姥爷和舅舅都擅长音乐,对我也有些影响,后来上高中就没再弹过了,但如果再捡起来应该还会。” 从古典交响乐的童年浸淫,到对电子乐的痴迷,看似跨越了一道鸿沟,在刘衍东这儿却能轻松打通两种音乐类型。他眼中的交响乐是音乐之母,适配性超强,把任何谱子搬过去,重新编排一下就能焕然新生。 如果说对音乐的喜爱多半出自家族基因,那么对科技的热衷,可能源于当电子工程师的父亲。 家里天然有做实验的硬件环境,再加上从小耳濡目染,随着刘衍东升入中学,折腾“黑科技”成了一项水到渠成的趣味。 升入初一那年,国家刚开始推行室内公共场所禁止吸烟条例,他利用课余时间折腾出来一个智能装置,检测到有人抽烟就会发出提醒音,后来才知道那就是多种智能报警器的雏形。 第一次借助科技的手法“玩”音乐,也发生在初中:他设计了一个扣在手机上的壳子,用一根管子直接连到耳朵用来传输音乐,但实际上还是靠手机的扬声器来发音,跟耳机有本质区别。刘衍东自嘲说这个玩意儿基本上没啥用,但当时就是觉得有意思,想研究一下。 草蛇灰线,伏脉千里。初中男孩设计这个“废物”时,大概想不到会在高三这年兑现出怎样的成果。看起来没啥用的装置里,却藏着一篇国际会议论文的思想雏形。 从高一确定课题,到高三发论文,刘衍东几乎搭上了所有的课余时间。虽然家里有个小型实验室,跑程序的速度终究比不上学校里的服务器。就在他高二这年,一零一中学成立了英才学院,里面恰恰有北京大学前沿计算研究中心AI实验室。 某次宣讲会后,刘衍东果断报了英才学院北大前沿计算机研究中心AI实验室的选修课,他想做的事情,终于有了眉目。 “感兴趣、想钻研”是英才学院的准入门槛。每个课内学有余力的孩子,都可以找到自己心仪的实验室课程。没有教材、拒绝刷题,也不限年级和学科,任何科学创想都不再是“纸上谈兵”。 不同于有编制的授课教师,各个实验室的负责老师并不按传统的课表排课,除了每周一次的选修课,还利用学生的课余时间带着他们做项目,必要时帮忙与高校老师建立联系。这种“项目化学习”是英才学院的主要特色。 从一楼大厅拾阶而上,首先映入眼帘的就是北大前沿计算机研究中心AI,两间屋子开辟出一方天地。在简介里,这个实验室的宗旨是“探索贯通式人工智能人才培养途径,将前沿科技与学生长远发展规划结合在一起,提升无缝衔接大学科研机制的科研能力,帮助学生在大学和研究生阶段获得更高的起点”。 屋子的摆设远比这些介绍文字更接地气。 外屋的主体部分,是几排齐齐整整的计算机和支持深度神经网络开发的GPU服务器,靠墙一侧是堆满资料的书柜,这个“小型AI图书馆”里,从《人工智能数学基础》、《深度学习》到《人类沟通的起源》应有尽有。 学生下课后可以来这里“玩”到晚上六点,“玩着玩着”觉得自己水平进阶了,就可以申请跟着北大导师做课题。 实验室里间的屋子,是作为学生项目实验环境的“机器人的家”,音箱、吸顶灯、窗帘、冰箱、电视等设备陈列简单却暗藏机关,都带开发接口或传感器,可以通过编程远程控制。高清摄像头支持对于房间内静态和动态物体的计算机视觉识别和三维重建。真实房间与计算机里一摸一样的虚拟环境,构成了”智能数字孪生“。 实验室里的“机器人的家” 刘衍东就是在一次宣讲会后报了这个实验室的课程。几次选修课下来,负责实验室的周宇辰老师发现这个男生“有点东西”,下课经常跑来问一些问题。聊过几次后,周宇辰知道刘衍东自己正在做一些音乐方面的东西,就送给他两本声学分析和深度学习方面的书籍。 “音频文件经过MP3有损压缩后,会造成音质损失,无法满足高质量音乐播放的需求,这时就需要靠神经网络,用声学的特征来做恢复。”周宇辰一边描述着学生的课题,一边摘下耳机挂在脖子上。他戏称自己也是音乐迷,师生之间在这个课题上有些共鸣。 从去年6月选定方向起,刘衍东在北大博士生导师董豪和周宇辰老师的指导下,做了将近一年的实验,尝试了不同的模型来做音质恢复,分别筛选出最适合电子音乐、古典乐等各类型音乐的模型。 董豪老师是深度学习开源框架TensorLayer创始人,曾获国际计算机学会ACMMM2017年度最佳开源软件奖。他的专业指导让项目研究工作更加深入。直到今年9月论文终稿的最后一刻,刘衍东还在500人的校友群里做人耳区分实验。 “分别给他们听MP3音质和无损压缩音质的同一首曲子,第一轮问他们能不能听出来哪个是MP3音质的,如果有人能听出来,那这个MP3的就pass掉了。本质是看大家能不能分辨出哪些是我们这个算法处理过的,哪些是没有压缩过的。最后有53%的人能听出区别,这些人里面又有87%的人认为这个算法是有用的。” 有了深度学习算法和人耳的双重验证,实验结果的精确度也就得到了保障。 某种程度上说,英才学院每个实验室的项目课题,都是一种跨越式学习。在周老师看来,带着高中生做研究性课题的模式,已经接近带大学生,能使学生更早接触大学科研方法,理解学习基础课的重要意义。二者的区别在于基础知识体系的差异。 孩子们在英才学院的航天科学实验室里上选修课 “专业课层面这些孩子是有差距的,比如线性代数、信号处理这种大学基础课程,他们没有系统学过,这个阶段更多是凭借兴趣来做项目,导师给指出一个大的方向,然后在做的过程中慢慢了解一些相关基础理论,来支撑这个项目的进行。” 实验室的时光充实又简单。在学术理念一致的前提下,同为“技术宅”的师徒相处起来轻松融洽。周老师有时会在实验室看到刘衍东戴着耳机听歌,偶尔还会跟着哼几句,但“好像都不在调上”。 徒弟却不这么认为,“他(周老师)可能根本没听过那首歌,不知道我哼的是啥。”刘衍东笑着反驳。
|