Fork me on GitHub

贾扬清正式担纲阿里开源领头人!AI架构大神是怎样炼成的?

  【新智元导读】昨天,贾扬清发布了阿里云飞天 AI 平台让人振奋,而就在刚刚,阿里巴巴正式宣布由贾扬清担任阿里巴巴开源技术委员会负责人。从世界级框架的核心作者到阿里开源负责人,这位自带光环的 AI 大神将为开源界带来怎样的改变?

  刚刚,贾扬清正式成为阿里巴巴开源技术委员会负责人,开源升级成为阿里技术战略之一。

  今天登台的贾扬清,有了一个新的身份:阿里巴巴开源技术委员会负责人。

  开源这件事,由贾扬清带领,更显得意义重大。因为他是当今最流行的三大开源深度学习框架 Caffe、TensorFlow 和 PyTorch 的核心作者之一。贾扬清介绍了阿里在开源方面做的事情,阿里正从“拥抱开源”走向下一个阶段——贡献开源

  • 一是现有项目的深度贡献。
  • 二是阿里当前的许多自主项目,将逐渐放到开源社区。

  阿里不仅积极拥抱开源,而且主动反哺开源,在 Linux、MySQL、JVM 等国际开源项目领域拥有多位核心贡献者。

  近年来,阿里更率先投入到自主开源中,持续性输出自研工具产品。目前开源项目数已有超过 1000 个,获得标星超过 66 万,阿里有超过 10000 名技术人员在为这些项目贡献代码。

  这些项目覆盖中间件、移动、数据库、容器、AI、大数据等多个领域,包括已从 Apache 基金会毕业的 Apache Dubbo ™ 、Apache RocketMQ ™,广泛应用的 UI 组件库 Ant Design,知名 JSON 解析库 FastJson 等。

  一、贾扬清领头阿里开源,重磅发布开发者云

  贾扬清用“3+1”概述了阿里开源技术委员会的方向:

  3 是“云原生、操作系统和前端”,1 是“工具”。云原生:当前,有非常多的技术是在云上设计的,阿里开源将为开发者提供更好、更方便获取的云原生环境。

  操作系统:操作系统是整个计算机技术的底座,阿里有飞天操作系统底座,同时也应用过很多类似 Linux 这样本身就开源的系统。前端:前端是和用户交互的重要媒介,做好前端能够迅速将技术交到用户手里。蚂蚁金服的 Ant Design 是其中做得非常好的一个代表项目。

  那么,为开源社区自身要做什么事情呢?贾扬清说,必须把工具做好,向大家提供更加详细、经过测试的方法论,帮助开发者更容易推进自己的开源项目。如何利用开源项目和解决方案提高开发效率,包括测试部署工具,源代码管理工具,项目交流平台等。

  谈到自己在伯克利开发 caffe、参与 TensorFlow、pytorch 等开源框架的核心开发,贾扬清说这一切都是“机缘巧合”。caffe 用得很开心,于是把它开源出去,让社区所有人都能用到。

  全球开源社区蓬勃发展,2018 年一年,它的发展超越了前面很多年的总和。“很幸运的是,在 AI 领域,开源的想法是大家共通的、默认就应该这样。”贾扬清说。

  开源是从 0 到1,但开源项目的一个障碍是落地:怎样实际找到一个落地场景,支持进一步的开发,让开源项目实现从 1 到 100。阿里提供了一个技术试验场。

  以深度学习框架为例,最早是 Caffe、Torch、Theano 这些实验室里出来的框架,后来由于越来越多工业界的应用,开发出 TensorFlow、Pytorch 这些更加成熟的框架,今天开源软件则跟业务有更加紧密的结合。

  回头去看,像 TensorFlow 和 Pytorch 这样的软件在实际建模中有点像汇编语言。但人工智能和大数据领域的高级语言是什么,是不是还要停留在汇编语言上呢。贾扬清认为不是,有很多建模框架、和大数据结合的框架是进一步往前推动的方向。

  贾扬清表示,随着行业数据智能化的加速到来,阿里云大规模计算能力、丰富的实践场景将有助于降低开源成本、推动项目的成熟完善。以 Apache Flink 为例,通过双 11、搜索推荐等多个核心场景的实战检验,在流计算和批处理上积累了大量新功能,实现性能快速提升。如今,Apache Flink 已成为 CCTV、新浪微博、千寻位置等知名公司建设流处理平台的首要选择。 

  今天,阿里还带来了一个重磅发布:开发者云。将为开发者提供零门槛的云上体验、最佳硬件、云上生态等。

  从拥抱开源到贡献开源、自主开源,再到如今的赋能开源,开源已升级为阿里技术战略之一,将为开发者带来更多切实可见的深远价值。

  二、从 Caffe、TensorFlow 到 PyTorch,贾扬清的 AI 架构大神之路

  提到贾扬清,就不能不提 Caffe 和 TensorFlow。

  贾扬清在硅谷奠定自己 AI 大神的地位,是因为两个世界级的框架 Caffe 和 TensorFlow。

  Caffe 是史上第一个通用深度学习框架,也是目前全球最普遍使用的深度学习框架之一,微软、雅虎、英伟达、Adobe 等世界级大公司都在用。

  而 TensorFlow,不得不提到因围棋一战成名的机器人 AlphaGo(阿尔法狗),TensorFlow 就是阿尔法狗背后的强大支撑,被称为“谷歌大脑”。

  贾扬清,就是这两个世界级框架的作者之一。


贾扬清 LinkedIn 主页

  清华本硕毕业后,贾扬清在加州大学伯克利分校取得计算机科学博士学位。贾扬清在伯克利读博期间开发了深度学习框架Caffe,全称“Convolutional Architecture for Fast Feature Embedding”,以优异的结构、性能和代码质量成为迄今最受欢迎、最成功的开源深度学习框架之一,对领域发展起到了极大的推动和影响。博士毕业后,贾扬清加入了之前就已实习了 2 年的 Google,在 Google 首席构架师 Jeff Dean 麾下任职,期间参与了 TensorFlow 平台的开发。Jeff Dean 被称为目前整个谷歌甚至整个硅谷、整个计算机科学界的顶尖人物。

  2014 年到 2016 年是贾扬清的学术爆发期。根据谷歌学术的统计,贾扬清的论文引用高达48560 次,其中“Going deeper with convolutions”(深入卷积架构)这篇引用次数达 15668 次,排名第一。论文地址:https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf

  第二篇高引论文是关于 Caffe 的一篇:Caffe: Convolutional architecture for fast feature embedding,引用次数达 11598 次。论文地址:https://arxiv.org/pdf/1408.5093.pdf

  第三篇高引论文是 Tensorflow 相关的:Tensorflow: A system for large-scale machine learning,引用次数达 9266 次。论文地址:http://download.tensorflow.org/paper/whitepaper2015.pdf

  贾扬清谷歌学术页面 2016 年 2 月,贾扬清加入 Facebook,当时这一消息也在圈内引发了广泛讨论。详见新智元报道 Caffe 作者贾扬清:我为什么离开 Google,加入 Facebook?

  此后,贾扬清在 AI 架构的大道上一路进击:

  • 2016 年 11 月Facebook 推出轻量级模块化的深度学习框架 Caffe2Go,能在手机上运行深度神经网络模型。贾扬清代表团队在 FB 官网发文,“我们在移动设备上开发了一个新的深度学习平台,首次实现了实时的捕获、分析和像素处理——这一最先进的技术仅在手上就能实现。……Caffe2Go 与 Torch 等研究工具链一起,构成了 Facebook 机器学习产品的核心。”
  • 2017 年 4 月Facebook 宣布开源产品级深度学习框架 Caffe2,带来跨平台机器学习工具。Caffe2 是 Caffe 实验性的再造,制作时重点考虑了表现力、速度和模块化等特性。在 2017 年 9 月的一次测评中,Caffe2 以 79% 的精度和 149 秒的运算时间,在 TensorFlow、PyTorch、MXNet、CNTK 等框架中排名第一。
  • 2018 年 5 月Facebook 正式公布 PyTorch 1.0,这是基于 PyTorch 0.4 与 Caffe2 合并而成的框架,还整合了 ONNX 格式,旨在一个框架中统一研究和生产的能力。

  从深度学习开源框架群雄割据,到现如今 TensorFlow 和 PyTorch 分庭抗礼,贾扬清也从 Caffe 作者走到了 Facebook AI 架构总监。

  他担任了 PyTorch 1.0 项目的共同负责人,2017 年创建了首个开放模型格式的原型,后来成了 FB、微软、亚马逊和许多硬件供应商一起发布的ONNX

  今年 3 月,贾扬清被曝从 Facebook 离职加入阿里巴巴,现任阿里巴巴副总裁、阿里云智能计算平台事业部总经理、阿里巴巴开源技术委员会负责人。

  三、成绩一骑绝尘,语速超过 Rapper 的科学家是如何成长起来的?

  在阿里内部,大家称贾扬清是“语速超过 Rapper 的科学家”,那么这位科学家是如何成长起来的呢?

  贾扬清出生在绍兴上虞,他的母亲和父亲都是上虞春晖中学的语文老师。

  前几年,《绍兴日报》曾这样报道家乡天才少年的成长经历:

  1 岁多的时候,贾扬清喜欢听故事,母亲就拿着图画书给他讲故事。在三四岁时,贾扬清已经识字两三百,最喜欢捧着书一个人安静地读。

  有一次,一家三口去逛新华书店,5 岁的贾扬清挑了一本文字版的《安徒生童话》。母亲问:“你看得懂?”贾扬清点了点头。后来母亲总结出一个识字的方法:教孩子识字,摊开一本小人书,给孩子讲故事。

  上小学的时候,由于交通不便,夫妻二人思忖再三,决定把儿子送进学校附近的一所村小。这所村小实行复式教育,即一二年级的孩子一起上课。

  上小学前,贾扬清母亲通过家书的方式,认真向儿子交待几件事:

“一是,每个人都要做好自己的事情,父母亲要教好书,你读好书,求得真知识;二是,所有教你的老师都是优秀的,教育学生绰绰有余;三是,每次考试不必第一,加入第一方阵就可以了。”

  中考时,贾扬清以上虞区中考第三名的成绩进入春晖中学。到了高中,成绩一骑绝尘,获得过全国物理、化学竞赛一等奖,数学联赛二等奖,英语综合能力二等奖等等。

  作为学霸,贾扬清有一套自己的学习套路。比如对于老师布置的题目,会了就不做,但不会的题目,会买一整本练习题练习,直到熟悉运用为止。

  高考时,因为大意,贾扬清做错了一道 27 分的理综考试试题,一度非常沮丧,不过最后以高考 686 分的成绩顺利进入清华大学自动化系自动化专业

  对于儿子的成功,母亲总是这样提醒他:“你有今天的名望,有技术不是唯一原因,而是缘于共享。”

  作为图像识别开源软件 Caffe 的研发者,贾扬清向全球免费共享了这一成果,所以,他的大名在业内人人皆知。

  最后,看懂阿里开源,请看这张信息量很大的图:


一图看懂阿里巴巴开源

来自:
新智元(ID:AI_era)

作者:Johnson
原创文章,版权所有,转载请保留原文链接。