后摩尔时代,让算力再接一棒 | 科创家鄢贵海

2019-12-30



从2012年至今,按照摩尔定律,芯片算力只增长了7倍。而在这7年间,从AlexNet到AlphaGo Zero,AI对算力的需求增长了30万倍。


站在一个前所未有的海量信息数据时代门口,承载着国产替代的历史使命,芯片成为过去几年最火的投资赛道,所有人都期待芯片行业孕育出全新的独角兽,无数芯片领域的科学家亲自入场,试图寻找到信息技术与市场应用间化学反应的密码。

中科驭数创始人兼CEO鄢贵海是其中一员。本科毕业于北京大学,在中科院计算所拿到博士后留所任博士生导师、研究员,鄢贵海在计算机体系结构领域深耕十余年,曾主持过多项国家自然科学基⾦项目,获得北京市科技奖等多项省部级科技奖励。作为科学家的鄢贵海重点关注专用计算架构、机器学习和金融计算,累计发表SCI、EI论文50余篇,论文获得2011年IEEE TTTC评选的年度最佳博士论文奖(亚洲唯一)。

2018年,鄢贵海带着技术创业寻求商业化落地,创立中科驭数。中科驭数的 “软件定义加速器技术方案” (software-defined accelerator)设计了基于核函数库的专用计算芯片KPU,依靠对计算模式的准确把握和提取,迅速研发出对应的专用计算架构。目前,基于KPU架构,中科驭数已推出三款芯片:65纳米的训练推理芯片KPU-FlexFlow和KPU-FlexFlow-Pro,55纳米的数据库和时间序列数据处理芯片KPU-Conflux,构建了面向数据库(Database)、网络(Network)和人工智能(AI)领域的DNA异构加速产品体系,提供针对金融计算、数据中心等应用加速的全栈式解决方案。中科驭数采用SDA方法来应对专⽤计算碎片化需求,已累计完成4个应⽤领域、50余类核函数的提取和定制。凭借够“硬核”的能力,中科驭数在这个最冷的资本寒冬依然顺利完成了数千万元的Pre-A轮融资。

燕缘雄芯第八期科创家特推荐鄢贵海,一位走在创业路上的科学家。他坚信专用计算领域将产生新一代的明星企业,他选择从最难的金融领域开始,自下而上,意图最终实现通用性和高性能的最优解。他说宁可有价值的失败,也不盲目的跟风。
 
专用计算的黄金时代

2017年,计算机图灵奖颁给了芯片界两位大师:“硅谷教父” John Hennessy和David Patterson,奖励他们在计算架构设计和评估上的贡献。2018年计算机体系结构ISCA大会上,John Hennessy和David Patterson放言后摩尔定律时代,计算架构创新的重点,将从以通用计算 CPU 为中心的创新转向领域专用的异构计算加速。

在2020信息产业趋势预测中,中国信息通信研究院、全球最大电子行业媒体集团ASPENCORE等多个机构均将专用芯片列为未来半导体行业十大技术趋势之一。芯片“专用化”开启了以应用为导向的定制化芯片设计思路。
 


“从计算的角度看,基本上分通用、专用两条技术路线。通用这条技术路线已经走了40年快50年,非常成功。从目前来看,可以夸张一点讲,整个人类社会的信息基础设施其实是建立在通用计算技术上的,遍布全球各地的数据中心,就是把算力集中到一起,在上面搭配不一样的应用不一样的算法,支持不一样的客户。底层其实是一样的,上层软件编程框架接口都是统一的,形成非常稳固的计算生态,在这个生态里每个人的贡献都有可积累性。任何一个新的业务出来后,大概需要做的只是一个增量式的东西。

但成也萧何败萧何,通用这条路走了50年的老路已经臃肿不堪。在5G、AI这些非常确定性的新技术趋势下,应用端的刚性需求正在爆发,计算价格面临前所未有的压力。以AI为例,无论是智慧安防、自动驾驶、AR/VR,都仰赖于硬件算力。

在通用化多核这条路线,手机已经做到了8核,现在不知道下一步是什么。量子计算还有点远,可行的做法还是基于Silicon,考虑专用计算,用不同的架构和价格适配算法,让整个算力还能再接一棒。再接多远我不敢保证,但我觉得接一到两个数量级是有可能的,至少中科驭数在做很多加速方案的时候,从单点看,通过专用方式提高加速比100倍以上还是比较容易做到的。

专用计算这条路从90年代就有人在研究,把一个算法用更高效的硬件去做。但那个时候,单纯的零零散散的去打做出一个东西来是可以work,但是没办法规模化,没办法成气候,因为你只解决一个算法的问题,并不解决应用问题。直到2012年2013年,我们看到一个是算力需求矛盾在逐渐激化,一个是一些新的应用,比如区块链挖矿在起来。到2017年图灵奖两个老前辈获奖,就基本确定了专用技术路线是未来的趋势。

创业前,技术框架在我脑子里搭了很长时间,paper也有,我不能保证在商业上一定成功,但起码我敢保证中科驭数的技术有先进性,在市场上至少能做到人无我有,人有我优。有了这两点后,其实我就不太担心没地方用,可能最后要看我们产品化做的好不好,成本是不是能控制好,商务能力强不强。”

吸星大法修炼底层能力

有通用芯片巨大的成功在前,高性能的专用计算芯片常被质疑市场规模究竟能做到多大?许多创业者绑定极具想象力的AI,主动打上AI芯片的标签对冲疑虑。中科驭数却坚持不打标签,选择从细分赛道向通用性逐层归纳综合,以专用计算架构为核心,采用软件定义加速器的技术路线,实现软硬件协同的高效解决方案。

中科驭数最新推出的RiskCop系统,就是基于其KPU架构,设计实现了金融交易中的风控规则处理、数据库加速,金融协议解析和网络协议解析的一体化加速解决方案。和传统方案对比,中科驭数方案实现了次毫秒级风控,单次交易链路延迟大幅减低到1.4us 左右、抖动在 20ns以内。
 


“我们下一步努力的方向是用更好的产品把技术的可行性变成商业上的成功案例。我一直不觉得我们是做AI芯片的,对我来讲AI跟其他普通算法没有差别。我更关心从一个算法来看,怎么能更高效地执行,用一个什么样的结构去支撑。我们希望从专用性出发,寻找通用性,打造一个泛算力的基础设施。

最后可能是一个bottom up的过程,先做行业,然后行业之间产生很多交叉,最后综合。我们发现很多行业都有各种需求,但这些需求在什么样的层面能综合到一起,在什么样的层面上能产生叠加,然后迸发出更大的生命力,这个是不清晰的。但是我们在这一点已经是走在比较前列了。

我们是走两步,回头看能不能将不同需求综合,持续的寻求技术上的归纳综合,寻找最大可能的通用性。指望一个技术覆盖所有行业,我觉得做不到,但是在很多行业划分出大类需求,在里面用一个相对统一的技术去统领,这是有可能做到的。最后在专用计算赛道上做得最成功的公司就是把综合做好的公司。

专用芯片能做到多大规模可能取决于最后能以多低的边际成本去覆盖足够多细分行业。这也有好处,就是不太会出现赢者通吃,至少不会像X86体系那么明显。专用芯片最后可能变成大家相互硬件、软件什么都做一点事,都会存在。

这是一个慢慢演化的过程,从差异性小的行业慢慢去做,没那么快,我觉得保守估计20年,专用赛道才能形成一定的格局,现在看起来还在各自细分领域里摸索。

我们差不多是第一家提专用计算架构作为技术商用路线的厂商,其他都是做安防、自动驾驶,我们其实没有提场景,更多提赛道,我们不想明确加上一个限定词,自缚手脚。我们希望用更开阔的视野,看在新的赛道上会发生什么事情,但凡有趋势或者新的技术研发出来,我们能第一个感知到并吸纳到我们的技术框架里来。我们其实是内建了吸星大法,更希望通过消化吸收不同应用领域的技术,改造成我们技术体系里的一个重要元素,最后变得很鲁棒。

你会在很多地方都看到驭数的影子,当你把某个行业的系统往下挖的时候,一定在一个关键路径上,是避不开驭数的,我们一定会在那等着你。我希望把根扎的更深一点,最后演化的可能性就会更大,有更大可能性赋能更多行业。如果做的特别前端,其实基本上丧失掉了更大可能性,这也是我不太愿意的。”

先做价值后打单

创业路径的选择往往由创始人的认知和价值取向所决定,作为科学家的鄢贵海喜欢系统化解决问题的方式,偏爱更有长久生命力的技术,希望先把专用计算机构的底层基础设施搭的更坚固。但创业又是个需要拼速度的竞技项目,如何在同赛道竞争者中即保持技术的底层进化又兼顾市场端落地应用,持续拿到资本的支持,在限定的时间里成功登陆,这也是鄢贵海面临的挑战。



“我们用了一个还蛮变通的做法来兼顾应用落地。我们没有所有行业都铺开推,最开始只挑了一个相对比较难啃的骨头——金融计算细分赛道落地技术。金融对技术的要求最高,如果我们连这个行业都能推下来,其他行业应该都会比这个简单很多,先干难的。

金融行业的人不太接触底层计算架构技术,听到计算架构这些词都觉得新鲜,一开始我们也不清楚他们的需求,不懂金融,属于完全不同的两个行业。现在我们逐渐的了解到他们非常核心的一些需求,甚至他们愿意开放很多底层需求给我们对接,这个过程是蛮有难度的。但金融行业难度在前,不像做安防难度是在后面,好上手难落地,竞争激烈。

整个金融很多环节都有大量的加速需求,交易环节的报单、合规检查等等。金融行业本质上是集中式的,遍布全球各地的券商、交易者,最后单子全部都要从交易所、结算中心出。首先要保证数据不出错,至于单子提上去交易撮合有没有完成无法保证。这种系统的延迟影响整个金融行业的流动性和公平性,有大量的套利空间。

直接往金融系统推加速卡是很难的,必须把金融的一些核心算法映射到计算结构里,才能用得起来。现在看起来当初选择金融的策略是对的,至少到目前为止我们的路好像越走越宽,客户愿意配合我们去解决,交互越来越深,跟金融行业的合作有更多的互补性,互相都很难替代。

从市场的角度,一开始我们都觉得市场规模很小,当然很多人反对我做这个行业。结果我们现在越做发现市场越大。整个中国金融体系越来越全球化,跟美国、日本等的交互越来越多,在技术底层上需要跟得上全球水平。我们现在是被客户推着走,他们有强烈的需求。

我们是先埋头干了一年,到现在人员配比市场也是最弱的,但是我不担心,因为我觉得没到时候。我信奉的是一步一个脚印,稳扎稳打,最后如果以这种方式没做成我认,那种先去铺前端乱七八糟搞了,最后一团乱麻,没做起来我还觉得挺亏的。我觉得失败可以有很多种,但最怕这种失败方式是毫无价值的。如果最后技术有问题导致产品化问题,这个就证明我们功夫不到。

我希望把KPU做成专用计算架构的一个典型代表,背后有丰富的技术内涵。大概前面四年,我们就是在干这件事情。我看到很多创业公司,基本是立马今天做了后天就要去打单的状态,但他们的成功率高吗?好像也不是,而且绝大多数都没有做到他们想要的样子就挂掉了。

从我的角度我觉得不用着急,开始轻基础重前端后面能腾挪的机会越少,还不如慢慢从下往上做,以我为中心,而不是被客户牵着鼻子走。我知道对于企业来说生存是第一要务,但很多时候有所为有所不为,很多东西摆在面前选择,要想得更深入一点,想想初心是什么,也许反而能让团队走的更远。”