作者:曾智强
如果用“百度地图”导航,目的地设为“百度阳泉云计算中心”,从北京出发,最短行程约 390 公里,驾车大约 5 个小时,就能到达百度位于(山西省)阳泉市的智能云数据中心,这是百度自建的第一个超大规模数据中心。
此前几年,微软芝加哥数据中心以可容纳 14 万台服务器(实际应该不到)而被认为是全球装机容量最大的数据中心,但百度阳泉智能云数据中心仅一期就可承载 16 万台服务器,如果加上正在建设的二期数据中心,整个百度阳泉云计算中心可承载 24 万台服务器。
11 月 21 日,百度阳泉云计算中心项目二期工程开工,百度副总裁崔珊珊与阳泉市领导共同铲土奠基
自百度几年前宣布其“ABC”(即 AI、BigData 和 Cloud)战略以来,AI(人工智能)几乎成为百度的代名词。为了进一步延伸其在 AI 领域的优势地位,百度正在全国范围内“大兴土木”,阳泉数据中心是百度“ABC”战略基础设施的重要布局点,加上北京、保定、苏州、南京、广州、西安等地的数据中心陆续建成,这意味着百度将实现中国华北、华东、华南、西北等区域用户全面覆盖。
与阳泉二期几乎同时开工的还有百度位于保定市徐水区大王店(10 月 27 日开工)和保定市定兴县(10 月 29 日开工)的两个云计算中心,分别占地 150 亩和 135 亩,直接基础建设投资共计约 40 亿人民币,再加上阳泉二期的 14 亿人民币,百度在基础设施方面就一次性投入了 50 多亿人民币,让三个云计算中心并行施工建设,魄力之大,颇有破釜沉舟的气概。
位于保定市徐水区大王店镇的百度徐水云计算中心(效果图),占地 150 亩,投资 20 亿人民币,总建筑面积 11 万平方米,承载 12 万台高性能 AI 服务器,将拥有超大型神经网络、超大规模高性能计算集群,支持万亿级搜索数据、百亿级定位数据、百亿级图像和视频数据
位于保定市定兴县的百度定兴云计算中心(效果图),11 万平方米的总建筑面积,承载 12 万台高性能 AI 服务器。但占地面积 135 亩,相比阳泉和徐水,建筑设计更加紧凑。建成后通过部署大带宽、低时延、无损网络,12 万台服务器将变身成为一个一键运行、智能控制、远程操控的超级计算机
尽管百度在北京有数据中心布局,但考虑到北京的条件,几乎很难新建超大规模数据中心。但北京的业务是所有互联网公司及云服务提供商都不能放弃的,在北京周边区域新建数据中心以支撑北京业务就成为必然选择,譬如同属河北的张家口市、保定市、廊坊市以及天津直辖市就成为可选之地。
而保定市位于京津冀三角地带,与三地距离都不超过 150 公里(距离北京 140 公里、河北石家庄 120 公里,天津 150 公里),网络上的延迟几乎可以忽略不计,又毗邻雄安新区,可谓地理条件优越。据了解,百度徐水云计算中心主要用于支撑自有业务,并对外提供 AI 服务。而定兴云计算中心则“承担百度在智能经济时代的算法、算力、大数据等很多方面重要的负载……通过大带宽、低时延、无损网络,12 万台服务器将变身成为一个一键运行、智能控制、远程操控的超级计算机。”
并且对于百度而言,选择保定新建数据中心还有另外一个好处。保定与阳泉距离较近,两地的气候条件相似,差距并不明显。百度阳泉云计算中心的建设与运营经验可以复制到保定的两个云计算中心。
一脉相承又突破创新的百度阳泉二期工程
百度位于阳泉的云计算中心总共占地 356 亩,其中一期总投资 47 亿元,总建筑面积 12 万平方米,8 个高标准模组,满载可提供约 6000 个 40A 机柜,可承载超 16 万台服务器。二期总投资 14 亿元(其中不少于 4 亿为 IT 设备投资),总建筑面积 8.6 万平方米,预计可部署 8 万台高性能 AI 服务器。
百度阳泉云计算中心效果图
相比一期工程,二期工程的投资仅为一期的三分之一,服务器数量却只减少了一半,阳泉二期在一期经验的基础之上进行了优化设计。
百度阳泉、保定四个云计算中心的建筑面积、投资与承载的服务器数量
除了投资大幅减少之外,数据中心的建设周期也大幅缩短。阳泉一期从 2011 年 9 月选址到 2018 年 9 月整体交付,用时 7 年,虽然从开工到第一批交付用了多少时间,百度并没有透露。但据百度官方资料显示,阳泉二期采用模组标准化设计,特别是首个供电、制冷全分布式预制化的数据中心,通过优化建筑布局,提升 IT 装机能力 40% 以上,大幅降低项目造价的同时,极大提升工程效率,预计将于明年(2020 年)11 月第一批交付使用,也就是说阳泉二期的建设周期差不多刚好一年,这符合互联网对速度的追求。
除了建设周期极大缩短之外,在数据中心节能方面也有很大提升。百度阳泉云计算中心一期的设计年均 PUE 为 1.2,但在去年的“数字中国万里行”活动中,我们参观百度阳泉云计算中心一期时,其年均 PUE 值就已经做到了 1.1,在同年底,百度就宣布其阳泉云计算中心的 PUE 突破了 1.1,年均 PUE 降到了 1.09。这一方面是因为阳泉一期中的服务器数量趋于饱和,IT 设备所占用的能耗比例提高,其他支撑系统的能耗不变或者有小幅度提升,使得 PUE 这个比值减小。另一方面,节能等新技术在百度阳泉数据中心的落地并持续运营优化,让百度开始收获成功的“果实”。
从设计年均 PUE 1.2,降到实际运营后的年均 PUE 1.09,百度阳泉云计算中心一期的运营经验促成了又一个百度产品的诞生——百度飞桨 AI 控制系统。正是因为这一套系统,以及一期的经验,使得百度有底气将二期的设计年均 PUE 为 1.15。基于这套系统,能够使基础设施能耗降低 70%,每个可用区每年节电超过 1 亿度,相当于 5 万户居民一年的用电量。并且,在阳泉二期中,百度首次采用新型冷板液冷技术,单机柜功率密度可提升 200%,可实现全年 100% 自然冷却,节能率 46%,提升数据中心热回收率至 100%,建设速度提升 20%。
得益于可传承的运营经验,以及更新锐的节能技术,尽管阳泉二期设计的年均 PUE 为 1.15,但我们相信随着二期交付并陆续上架服务器之后,其实际运营中的 PUE 将低于一期的 PUE。而百度飞桨 AI 控制系统也是一个典型的投资 AI、利用 AI 反哺数据中心的成功案例。
除了阳泉二期之外,百度在保定的云计算中心在新技术应用方面也有独到之处,除了采用百度第四代领先的数据中心基础设施架构,还将大规模使用百度自研的 DPC 相变冷却系统,使得单机柜冷却能力提升至 20KW,这次相变冷却系统首次在数据中心行业落地,同时其单机柜 20KW 的冷却能力在全球范围内,也保持领先水平。
自动驾驶 +5G 阳泉率先“上路”
AI 俨然已经成为百度的代名词,在上述三个新建云计算中心都不约而同提到了“高性能 AI 服务器”。比如阳泉二期可承载 8 万台高性能 AI 服务器,位于保定的徐水数据中心和定兴数据中心建成后都能各自承载 12 万台高性能 AI 服务器。鉴于保定的地理位置,这两大云计算中心主要用于承载百度自有业务,比如搜索、百度大脑、百度智能云、Apollo、地图、小程序等业务,同时对外提供 AI 服务,即百度智能云业务。那么阳泉呢?
除了宣布阳泉二期正式开工以外,百度还与阳泉政府、山西交控集团、中国移动通信集团山西有限公司多方签订车路协同示范区项目合作,进一步推进了新一代信息技术和城市现代化发展的深度融合。根据协议,通过山西阳泉自动驾驶与车路协同创新示范区建设项目,阳泉将协同百度等多方开展“自动驾驶+车路协同”示范应用,融合人工智能、V2X、5G、边缘计算等前沿技术,为自动驾驶技术验证、测试评价、运营服务提供有力支撑。
百度公司、阳泉市人民政府、山西交控集团、中国移动通信集团山西有限公司就山西(阳泉)自动驾驶车路协同示范区项目合作签约
自动驾驶汽车一直以来都是百度的标杆项目,也是外界重点关注的项目之一。但真正的自动驾驶如何落地,这又是众说纷纭的一大难题,尤其是中国城市交通普遍拥挤的情况下,自动驾驶有望改善交通,但这也意味着落地难度较大。这次百度与阳泉政府的合作,有望让自动驾驶汽车真正上路。
在此之前,百度与阳泉已建立了扎实的合作基础。2017 年 7 月,百度与阳泉煤业集团达成战略合作,百度领先的人工智能、大数据、云计算技术与阳煤集团的煤炭开采、煤化工生产、大宗物流管理能力全方位融合,共同推进煤炭行业的智能化生产、管理及技术、商业生态的完善;2018 年 12 月,百度与阳泉市签署战略合作协议,百度大脑、自动驾驶、智能交通等前瞻技术能力更深入地融入阳泉,提升城市精细化管理水平。此次山西(阳泉)车路协同示范区项目的开展,是双方对智能交通合作的进一步落地。
山西交控集团将提供多种路段供百度自动驾驶汽车试验,比如城市路段、高速路段等。同时中移动山西公司将在这些路段上与百度合作,部署 5G 基站、边缘计算等前沿技术。5G 与边缘计算的应用,加上百度在 AI 及自动驾驶方面的深厚技术积淀,将大幅推动自动驾驶汽车走向成熟,那商用也就不远矣。
变革与创新,从未停息。DT 时代(微信号:DTtimes)聚焦最新基础架构设施和技术的的进展,关注企业数字化转型优秀案例,专注企业级方案和技术的传播和创新企业的成长,触及企业的变革与转型,目前覆盖的渠道有:百度百家、搜狐新闻(DTValue)、今日头条、天天快报、凤凰新闻、网易新闻、大鱼、一点资讯等多家平台。