“芯”生动力,驭数KPU释放架构红利

2019-11-05

中科驭数最新一代领域专用加速KPU™芯片Conflux®1800测试验证成功,完全符合设计预期。



中科驭数KPU™-Conflux®1800产品图

近日,中科驭数历经两个多月验证完成了自主研发最新一代领域专用加速KPU™芯片- KPU™-Conflux®1800的验证和性能测试,结果完全符合预期。Conflux®1800-这批以“功夫”为名义的芯片是在今年7月完成的流片,伴随着它的功能验证成功,意味着中科驭数完全具备了领域专用计算KPU™芯片的量产能力。“惟其雕磨,方使玉成”。中科驭数下场施展拳脚,为数据治理领域奉上了强劲的一颗“芯”。


随着IOT、5G、物联网、人工智能等技术带来的数据爆发和新兴应用领域的不断创新,日常生活中产生的数据量呈爆发式增长。从2015年开始,大概每两年日常产生的数据量就会翻一倍。而随着“摩尔定律”的放缓,CPU处理器性能的增长速度已经跟不上数据量增长的速度,产生了很多待处理或荒废的数据。为此,中科驭数研制了加速数据处理的专用芯片KPU™。做个比喻,在汽车领域,当发动机动力不足时,可以通过增加涡轮的方式来提升动力。同理,在计算机领域,当CPU在某一个应用领域计算性能不足时,也可以通过一个专用的芯片提升一下它的处理性能,这个专用的芯片就是中科驭数所研发的KPU™架构的芯片。


“因地制宜”在任何领域都适用。中科驭数的初衷就是在不同应用领域根据其特点去定制专用的计算架构来解决数据处理算力不足的难题,而金融科技领域是目前着手落地的第一个领域。第一代KPU™-Conflux®功夫系列是专门针对于金融领域时间序列处理设计的一款处理器。目前在数据库查询应用场景下使用其做了评估和测试,相比基于CPU的方案,Conflux®芯片性能可以达到近百倍的非常明显的提升效果。
 
定制架构-专注金融场景的手术尖刀



金融市场示意图

在金融科技中,存在着金融数据交易、高频交易、大数据分析等需要超低延时的应用场景。传统的CPU无法完成高效的数据吞吐和并行计算,因此在通用处理器CPU的算力到达瓶颈期之后,业界早就开始通过专用的协处理器来寻求算力的提升。在国内具有全栈式解决方案技术的底层架构研究团队非常稀缺的背景下,从中科院计算所体系结构国家重点实验室孵化的中科驭数,极为难得的具备了可“打造加速生态,破解算力瓶颈”的先天优势。其核心原创技术为KPU™,是专为加速特定领域核心功能计算而设计的一种协处理器。


相比于“瑞士军刀”型的CPU通用计算架构,Conflux®1800是中科驭数针对序列数据处理而设计的一款KPU™芯片,是主要应用在数据库查询以及金融实时风控等领域的一把“手术尖刀”。该芯片集成了整个芯片,包含功能区和非功能两大部分。功能区主要负责具体的计算和数据处理,集成了20类功能核。通过各功能核间的组合可以实现数据库中基本的查询操作,以及金融交易系统中的实时风控处理(主要是时间序列操作)。非功能区负责对功能区核间配置,为各功能核提供数据供给。

因此我们把KPU™叫做核处理器,K是指功能核,会将不同应用领域抽象出一个硬件层、专用的功能核,功能核专门为某个特定计算模式服务,所以计算性能非常高。每一个功能核都可以进行配置,功能核之间可以进行不同的组合,通过不同的互联,数据的传输,且能够满足算法的迭代和更新趋势。

在运行机制上,KPU™采用“数据驱动并行计算”的架构,运行过程中通过数据流来激活不同的功能核进行相应计算。通过软件定义的方式用户可以灵活的建立“功能核”与应用层运算之间的关系,在整体计算效率提升百倍的前提下,仍然具有非常高的可扩展性和灵活性。



KPU™-Conflux®1800并行数据处理架构,可充分发挥KPU™计算性能
 

低耗高效-加速数据吞吐的性能大师


KPU™-Conflux®1800是新一代高性价比领域专用架构计算芯片。Conflux®1800基于中芯国际SMIC 55nm工艺进程实现,裸片面积3000um x 4000um,采用wire bonding BGA方式封装,管脚数232,core电压1.2V,IO电压1.8V,设计频率550MHz。



KPU™-Conflux®的性能参数

KPU™-Conflux®1800于2019年秋季完成所有测试项。经测试20类功能核功能全部正确,与设计规范完全一致。全部功能核工作频率可以达到550MHz,符合设计预期,基本达到了SMIC 55nm工艺下的极限值。在效能方面,KPU™-Conflux®1800表现也异常出色,经测试在550MHz频率下KPU™板级功耗仅为2.04W。



同时,在数据库查询和时间序列等应用场景的测试下,Conflux®1800也不可谓不是“性能大师”。在超大的数据量吞吐下,Conflux®1800高效地完成了并行计算和反馈,反馈时间比常规方案所需时间快两个数量级。

承上启下-引领解决方案的时代行者


“志不求易者成,事不避难者进”。芯片架构及相关软件定义的系统的研发成功并不是一蹴而就,而是得益于中科驭数深厚的学术背景以及开发人员孜孜不倦的研究。KPU™-Conflux®1800的成功流片及功能性能方面验证,充分展示出了驭数在芯片架构设计上的积累,也标志着中科驭数具备了从软件到芯片全栈式解决方案的产品能力。同时,驭数已经开始第二代KPU™的研发工作,第二代KPU™架构上针对OLAP业务做了大量定制化设计,性能相对于KPU™-Conflux®1800可以提升一个数量级之多。第二代KPU将会采用更先进工艺,计划采用40nm或者28nm的更小制程。


“风雨多经志弥坚,关山初度路尤长”。当前,中科驭数是时代的行者,正在打造领域专用加速器为中心的计算范式,助力数据智能时代的业务创新。在未来,中科驭数将致力于以KPU™专用芯片架构为核心,以行业应用为对象,定制计算芯片,将通用服务器作为载体,将KPU™做成标准化组件,指数级提高数据处理性能,为用户提供透明、一站式的加速解决方案。