起底华为计算战略：十五年研发下苦功，三年连发10芯加速

　　乾明发自上海
　　量子位报道公众号 QbitAI

　　每一次华为新动作，点赞有之，质疑亦随之。

　　9 月 18 日刚在全联接大会上发布的“全球最快 AI 产品”就是这样。

　　但在现场、在华为内部来看，这只不过是“华为计算战略”艰苦奋斗的开花结果，只是这盘芯片和计算力大棋局里关键一子。

华为 Cloud & AI 产品与服务总裁侯金龙

　　而且相比 Atlas（古希腊神话里的“大力神”），实际不到三年时间里，华为已经发布了 10 款商用芯片：

鲲鹏 916、920；麒麟 970、980、810、990、990 5G；昇腾 310、910；鸿鹄 818。

　　按外泄的规划，接下来的两年内，至少有 6 款芯片发布落地。

　　无论是计算领域，还是半导体行业，如此阵仗，势头都异常猛烈。

　　所以背后原因究竟是什么？华为又究竟想做什么？

　　计算战略发布后，是时候对这盘大棋来次完整起底，揭秘华为在计算背后的种种规划与布局。

　　15 年苦功夫，目前投入 2 万名工程师

　　围绕计算这个产业投资，十几年前已经开始了。

　　其中最具标志性的事件是 2004 年 4 月，旗下芯片公司海思半导体成立。

　　‍‍华为 Cloud & AI 产品与服务总裁侯金龙透露了这背后的投入：

从 2004 年开始投资研发第一颗嵌入式处理芯片，目前投入超过 2 万名工程师，形成了以“鲲鹏+昇腾”为核心的基础芯片族。

　　基础芯片族带来的意义非常直接。华为成为了业界唯一同时拥有计算架构中“CPU，NPU，存储控制，网络互连，智能管理”5 大关键芯片的厂商。

　　但俱往矣。

　　从产品发布的节奏来看，华为对芯片投资的力度还在快速加强，迭代也越来越快。

　　华为投资芯片的策略，此前也有曝光，总结起来就是三个关键词：量产一代、研发一代、规划一代。

　　以鲲鹏系列处理器为例，从 2007 年走到现在已历时 12 年，现在是第三代芯片。

　　现在华为释放出的最新信号是：鲲鹏+昇腾会长期演进，按照每年推出一代的节奏来提升竞争力。

　　这也是华为在不到 3 年内推出 10 款芯片的直接推动力量之一。

　　当然，上述种种努力和产品，只是果，细究“因”，则是华为对于行业变迁趋势的核心判断。

　　华为芯的机会：趋势变迁下的 2 万亿市场

　　在华为看来，当前的计算产业正在发生深刻的变化，尤其是整个社会向智能时代的迈进，这带来了变革与挑战，也带来了机会。

　　全联接大会上，胡厚崑援引了 Gartner 的数据——全球计算产业总空间为两万亿美元。在他看来，这是一片大蓝海，华为将坚定在计算领域的投入，并推进落地。

　　侯金龙进一步阐释四大趋势，也可以说是华为投资芯片进入这一蓝海的主要切入点：

　　首先，数据中心不够用了

　　对于数据中心来说，以前其承担的职能更多的是存、但未来更重要的是算，数据中心正在逐步演变为计算中心。

　　最直接的体现就是，大规模数据中心中服务器越来越多。就以华为云的数据中心为例，有 60% 都是用于计算的服务器。

　　可以说，计算正在成为数据中心的主体，这就是华为推动鲲鹏系列芯片的重要原因之一，也是鲲鹏芯片的使用场景。

　　与此同时，整个行业对 AI 算力需求也越来越大，而且来得更加汹涌，从 2012 年到 2018 年，AI 算力消耗几乎增长了 30 万倍。

　　现在每年的增长超过 10 倍，到 2025 年，AI 算力将会占据数据中心算力的 80% 以上。

　　正是在如此算力需求下，华为推出了昇腾 910 以及 Altas 900 等 AI 计算产品。

　　其次，端边芯片与中心芯片还有大差距

　　在华为看来，Arm 在生态上的优势会逐渐向数据中心延伸。对于华为来说，这是挑战，也是机会。

　　现场，侯金龙也分享了一组数据：

2018 年，Arm 处理器出货量 230 亿片，主要用于端和边，数据中心侧只有 3000 万片，这是数百倍的差距。
每年十几亿部手机都是 Arm 结构的，2019 年华为智能手机总的算力，将是今年全球数据中心新增算力的 2 倍，而且手机上的几百万应用都是基于 Arm 生态。

　　以前基于 Arm 的技术，之所以不能在数据中心使用，核心的限制是性能。

　　但解决问题导向，华为现已找到对策。

　　其今年发布的鲲鹏 920 是兼容 Arm，多核、高并发，把四颗核心并入了一颗核心，其性能超过业内通用 CPU 20% 的性能。

　　而且现在的计算，可以让简单的计算在终端进行，复杂的计算可以在云上进。

　　如果继续用 X86 架构在云上计算终端的任务，效率就会降低 40%，反之如果运用 Arm 架构，则提升 40%。

　　第三，计算该绿

　　高性能的计算虽然更有效率，但背后也有大量的碳排放。

　　美国马萨诸塞大学阿姆赫斯特分校做过研究，训练一个单一 AI 模型，会产生 180 吨的碳排放。

　　这相当于普通汽车整个服役期排放量的 3 倍，平均地球人 30 年日常生活的碳排放。

　　算力与效率背后，也需要对能源与环境更友好。从芯片层面上来看，要在更小的功耗下实现更高的性能。

　　在这方面，华为的底气很足。

　　侯金龙说，华为的 Atlas 900 AI 训练集群，算力达到 256 PFLOPS 只需要 16 个机柜。

　　要实现这样的算力，如果用 CPU 需要 6195 个机柜，用 GPU 需要 208 个机柜，而 NPU 如昇腾只要 128 个机柜。

　　这背后，主要归功于昇腾架构对深度学习业务的优化。

　　此外，经过华为系统级优化，如板级液冷、柜级密闭绝热等，整个集群的功耗从 4 万 kW 降到 736kW，降低 50 多倍。

　　最后，摩尔定律放缓已成事实

　　经过数十年的快速迭代发展，高速的摩尔定律已经难以实现。

　　过去 5 年，通用 CPU 的发展遇到了许多技术瓶颈，单核性能平均每年提升不足 10%，摩尔定律放缓已经成为事实。

　　想要进一步实现提高技术能力，在晶体管上打主意太难了，需要寻找其他路径。

　　这也是华为将基础研究作为整体计算战略关键组成部分的原因，最具代表性的成果，就是华为自研的达芬奇架构。

　　未来，华为的目标是通过一系列的技术创新，打破能效墙、打破散热墙、打破优化墙、打破内存墙、打破高速 IO 墙，进一步释放计算潜能。

　　总之，在华为看来，计算产业已进入架构创新的黄金时代，充裕、高性能、多样性、绿色、触手可及‍的算力将是智能社会发展的动力。

　　这需要更高性能的芯片做支撑，但仅仅依靠芯片还不够。

　　在整个华为计算战略中，芯片只是一部分。

　　解读华为计算战略：硬件开放与软件开源

　　整体来看，华为计算图景可以归为“一云两翼双引擎+开放的生态”。

　　其中一云，是华为云。

　　这是华为计算的核心输出途径——芯片不直接对外销售，以云服务和部件的形式面向客户，优先支持合作伙伴发展整机。

　　双引擎是指“鲲鹏”与“昇腾”。基于此打造芯片簇，构筑异构的计算，是华为计算战略的基础也是主要动力来源。

　　两翼则是智能计算业务、智能数据与存储业务，是计算的商业模式和直接应用场景。

　　开放的生态，则是整个华为计算战略的“点睛之笔”，也是今年华为全联接大会的重头戏。

　　这一方面，主要分为硬件开放和软件开源两大部分，目标是使能广大的合作伙伴，形成一个开放的产业生态。

　　硬件开放

　　如何落地？具体到商业模式上，是基于芯片等对外提供主板/SSD/网卡/RAID 卡/Atlas 模组和板卡，优先支持合作伙伴发展服务器和 PC 等计算产品，以及自己的品牌。

　　华为也在全联接大会上表示，其 TaiShan 服务器以及华为终端的 PC 机，聚焦做高端和内部配套，条件成熟时，将停止 TaiShan 服务器的销售业务。

　　在全联接大会上，除了 Altas，华为也发布了以下硬件新品：

　　鲲鹏主板，用于快速开发服务器和台式机产品。采用 xPU 高速互联、多合一 SoC、100GE 高速I/O等关键技术，不仅搭载鲲鹏处理器，还内置 BMC 芯片、BIOS 软件。与此同时，华为也将开放主板接口规范和设备管理规范。

　　通用服务器 TaiShan 系列 ，号称“最强算力”的通用服务器。具备至少 64 核、8 个内存通道、PCIe 4.0、多合一 SoC、xPU 高速互联、100GE 高速I/O等六个特征。

　　而且，面向数据中心分布式演进需求以及边缘计算需求，华为还提供了存储密集型、计算密集型、边缘计算等多款服务器产品。

　　Atlas 全系列产品，覆盖云、边、端全场景，面向训练和推理提供强劲算力。主要基于昇腾 910 和 310 AI 处理器，华为推出 Atlas 900、AI 训练服务器 Atlas 800、和 AI 训练卡 Atlas 300。

　　其中，Atlas 800 在 4U 空间集成了 8 颗昇腾 910 AI 处理器，可提供 2 PFLOPS 的超强算力，算力密度是业界同类产品的 2.5 倍，内置 32 个硬件解码器，每秒可完成 16384 张 1080P 图片解码，可以与训练并行处理。

8 个 Atlas 800 组成的机柜，内置 64 颗昇腾 910 芯片，Atlas 900 训练集群最少由 16 个机柜组成。

　　Atlas 300 可提供 256 TFLOPS 的算力，是当前业界主流训练卡的 2 倍，每秒训练的图片数量从 965 张提升到 1802 张。可实现梯度参数和数据集并行传输，最高可降低 70% 的梯度同步时延。

　　此外，华为也发布了 112 款基于鲲鹏和昇腾的云服务，包括 69 款基于鲲鹏的云服务和 43 款基于昇腾的云服务，让客户和合作伙伴们能更容易的获取鲲鹏和昇腾的算力。

　　华为介绍称，基于昇腾的图像搜索服务、内容审核服务，价格下调 70%。

　　软件开源

　　软件开源，与硬件开放相伴而生，是开放硬件能力的放大器。

　　继 8 月 23 日华为宣布开源 AI 计算框架 MindSpore、8 月 31 日放出方舟编译器框架代码之后，全联接大会上华为又放出多个软件开源计划：

2019 年 12 月 31 日开源服务器操作系统，2020 年 6 月开源可覆盖企业 70% 以上的数据库业务场景的 GaussDB OLTP 单机版数据库。

　　之后，华为将支持基于 openEuler 的合作伙伴发行商业版操作系统，支持各行业主流应用和软件开发商把软件和应用迁移到基于 openEuler 的操作系统上。

　　而且，华为也将与深之度、中标麒麟、天津麒麟、中移苏研、普华等伙伴计划联合推出 openEuler 开源社区 (http://openEuler.org)。

　　怎么理解华为有所为，有所不为？

　　伴随着华为计算战略的披露，“华为有所为，有所不为”也屡次被摆到台面上。

　　到底怎么理解华为有所为，有所不为？

　　侯金龙也进一步给出了解释，华为的聚焦点是重点投资计算架构创新，处理器的研发，以及华为云。

　　在这之外，华为不做应用，但免费支持主流应用和软件的迁移。

　　更能体现这一态度的是华为对开发者的支持。

　　侯金龙表示，开发者是产业的灵魂，未来 5 年培养 500 万开发者，将投入 15 亿美金用于发展产业生态。

　　那么，华为到底想要做什么？

　　胡厚崑也在采访中给出了答案：面向智能时代，华为想要做的是成为数字世界的“底座”。

　　如此愿景，你怎么看？

来自:
量子位（ID:QbitAI）

作者：Johnson

原文：起底华为计算战略：十五年研发下苦功，三年连发10芯加速

出处：青梅酒博客 – Plum Wine Blog

赏

华为

推荐阅读：