首页>>新闻内容

一年两款新品 寒武纪的研发效率为何如此高?

发布时间:2021-12-13 13:33:45   来源:本站    
字号:

本月,寒武纪在官网宣布推出第三代云端AI芯片思元370及搭载该芯片的MLU370-S4、MLU370-X4加速卡和全新升级的Cambricon Neuware软件栈等新品。

思元370是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,基于台积电 7nm 制程工艺,整体集成了 390 亿个晶体管,最大算力达到 256TOPS(INT8),这一数据是寒武纪第二代产品思元 270 算力的 2 倍。

凭借寒武纪最新智能芯片架构 MLUarch03,相较于峰值算力的提升,思元 370 实测性能表现非常亮眼:同功率性能超过NVIDIA T4两倍还多,完成同样的任务,功耗可以是A10的一半。

自思元100以来,寒武纪在三年之内已经连续推出三代云端AI芯片,最新一代产品在工艺制程、架构、指令集和软件等方面有了全面的提升,实现了同级芯片的顶尖水平。

值得指出的是,新品思元370,是在去年三季度流片、相关加速卡产品在今年二季度陆续送测客户后才进行的发布。目前,部分客户已完成测试、导入,产品进入早期销售阶段。

一年1~2款新品,寒武纪能强势领跑芯片行业的研发效率,与切实坚持“云边端”一体化的芯片研发策略不无关系。

目前,寒武纪的主要产品包括终端智能处理器 IP、云端智能芯片及加速卡、边缘智能芯片及加速卡以及与上述产品配套的基础系统软件平台。

招股书中也曾显示,2016年起寒武纪推出终端智能处理器产品,以处理器IP授权模式进行销售。2018年以来寒武纪推出思元100、思元270云端智能芯片及加速卡,以加速卡形式进行销售。2019 年11月,寒武纪推出思元220边缘智能芯片及加速卡,实现了终端、云端、边缘端产品的完整布局。

以思元2系列和3系列发布的产品为线索,可以看出,寒武纪都会分别立项每个系列中不同的产品,这样做的好处是各个芯片产品之间的组件可以大量复用。同时,云边端的产品虽各有侧重,但实则“通用”,简单来说,边缘端芯片只需将云端芯片进行相应的拆解,复用,重构,即可完成,从而大幅提升研发效率。

在架构的更迭上,这种高复用的效果更加明显。从2016年成立至今,寒武纪智能芯片的架构已经更迭了四代。第一代架构MLUarch00主打智能加速IP核,第二代MLUarch01主打多核架构,第三代MLUarch02主打多核共享片内存储,最新的第四代智能处理器架构MLUarch03,拥有新一代张量运算单元,内置Supercharger模块大幅提升各类卷积效率;采用全新的多算子硬件融合技术,在软件融合的基础上大幅减少算子执行时间;片上通讯带宽是上一代MLUarch02的2倍、片上共享缓存容量最高是MLUarch02的2.75倍。配合最新架构,寒武纪还推出全新MLUv03指令集,更完备,更高效且向前兼容。

以每一代的架构为基础,都可以开发出适合不同端的IP、芯片矩阵。而每一款芯片,又都会分成不同组件,比如按照十几个组件设立十几个研发小组,每个小组来做一个组件,最后把组件拼起来形成智能芯片。不同的小组可以根据项目需求,对组件进行多种组合、拼接,并实现不同芯片功能组件上重叠部分的高效复用。

一方面,这就使得云、边、端不同芯片拥有很多可以复用的组件与设计,让“云边端”协同优势成为可能;另一方面,这也使得过去的积累不会因为业务线变化而浪费,哪怕是现在总营收占比已经很小的IP授权业务,对于其他覆盖面更多的业务线,仍然有着生态拓展、技术复用的价值,比如在边缘侧智能芯片设计上复用。

寒武纪定位于独立、中立的芯片公司,采用的是类似安卓理念的中立生态策略,底层芯片与系统软件都充分服务客户和开发者,但不开展人工智能应用解决方案(基于芯片进一步提供应用软件或算法)的业务,避免与自身的芯片客户发生竞争,通过中立来吸引更多客户。

因为有了生态,未来云端芯片在切入客户之时,整体难度会下降,且也希望用户可以再回过来采用生态,一旦良性循环起来,生态可以增加更多用户的粘性,不断迭代,从而形成自己的客户群。

智能芯片是人工智能产业的核心硬件,中国人工智能市场庞大,智能芯片具有巨大发展潜力,根植于智能芯片赛道,寒武纪未来弯道超车机遇也得以显现。据悉,当下,寒武纪的客户群体也正在不断地壮大之中。近年来,寒武纪在智慧金融、智慧能源、智慧交通等行业与合作伙伴共同完成了诸多落地案例,招商银行、浪潮、阿里、百度等都是寒武纪的客户。


×
新闻
财经
科技
汽车