乾明 雷刚 发自 凹非寺
量子位 报道 公众号 QbitAI
刚刚,百度一年 AI 成绩单官宣。
作为中国 AI 头雁,百度的成绩单不止代表巨头公司业绩,也代表了技术前沿现状和产业基本情况。
而且诸多进展,也是全新起跑线上全球 AI 发展的侧影,比如最明显的 4 大趋势特点:
- 语音语言领衔基础技术突破,AI 突破从感知智能进入认知智能时代。
- 巨头玩家忙于打造“底座”优势,搭建生态平台。
- AI 落地进入工业化大生产时代,价值在基础业务中展现,也通过新场景中验证潜力。
- 自主可控性进一步加强,自研芯片服务器量产,并与国产 AI 框架、算法产生整合优势。
所以百度这份 2019 年度成绩单,究竟说了啥?又体现了哪些行业共同趋势?
我们提纲挈领、抓取归纳其中要点,从点到面一文看懂。
百度 AI 的 2019:技术→平台→生产力
整份成绩单中,技术突破与生态建设是重中之重,占据了一半篇幅。
剩下的一半中,应用落地与产业升级占据了很大篇幅。
这也体现出了 AI 当前发展阶段——技术仍旧占据核心,但落地以及产业应用正在被放到更加重要的位置。
整体上来看,百度的成绩单可以分为三大部分:
- 一是基础研究。
- 二是技术生产力转换。
- 三是生态平台的建设。
首先看基础研究,一年包揽了 23 项国内外竞赛冠军。
集中于百度大脑,语音、视觉、自然语言处理、知识图谱等方面都有成果出现。
特别是语音语言,在 2019 年迎来阶段性丰收时刻。
语音识别方面,百度提出了流式多级的截断注意力模型 SMLTA,这是全球范围内首次实现流式注意力建模,超越整句注意力模型的性能,大幅提升了语音识别准确率和速度(15%-20%),也是国际上首次实现在线语音识别大规模使用注意力模型。
语音合成方面,针对风格迁移、音色模拟和情感拟人的三大领域内挑战,百度推出语音合成技术 Meitron ,仅需 20 句话就可以制作一个人的专属声音。
此外,作为认知智能的“奥林匹克”,自然语言处理技术(NLP)的进展在今年最为夺目,全球亮点频出。
代表中国“参赛”的百度,交出了可持续学习的知识增强语义理解框架ERNIE(艾尼),在 16 个中英文任务上超越 BERT、XLNET,取得 SOTA 。
2019 年 12 月,ERNIE 在 GLUE 上登顶第一,并以 9 个任务平均得分首次突破 90 大关,刷新榜单历史,超越微软、谷歌提出的一众国际顶级预训练模型。
基于语音和语言方面的突破,百度还提出了基于深度注意网络的多轮响应选择匹配模型——DAM,口语理解能力被大幅提升。
值得一提的是,虽然全球范围内视觉为核心的感知智能已经迈步广泛落地应用期,但在 2019 年,百度还是秀出了“百尺竿头更进一步”的基础研发实力。
除了形成包括图像、视频、AR/VR、重要垂类、软硬一体化五大方向的特色视觉技术矩阵。
百度还在 CVPR 2019 豪夺 10 项冠军,包括 OCR、物体检测、视频理解、目标跟踪等图像与视频技术领域。
此次 AI 复兴,除了算法,另一项重要基础变革在于计算力。
百度也在成绩单中详细分享了突破:
2019 年 12 月,基于百度自主研发的中国首款云端全功能 AI 芯片“昆仑”的云服务器正式上线,在 150 瓦功耗下能带来 260 万亿次定数的 AI 运算,提供 512GB/s的内存带宽。
量产了专为远场语音交互打造的百度鸿鹄芯片,100mW 左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力等等。
而且,百度的算力发展并不仅仅只是单点发展,也已经与算法、飞桨框架连点成线,并交织成了坚实的基础层,形成了协同效应。
通过芯片、连接、系统和调度的协同设计和技术创新,对 AI 计算架构进行升级,可以提供百万 TOPS 的强大算力。
正在建造的计算集群,基于百度飞桨研发的 AI 控制系统,设计年均 PUE1.15,基础设施能耗降低 70%,每个可用区每年节电超过 2 亿度,相当于 10 万户居民一年的用电量。
下一代计算——量子计算方面也有新突破。
研发出国际领先、国内第一的云上量子脉冲系统“量脉”,可将量子计算软件指令(逻辑门)转换成控制量子硬件的脉冲序列,算法性能较同类工具实现成倍的提升,是实现量子软硬件连接的关键桥梁。
当然,区别于科研机构,百度作为企业组织,基础技术突破自然不会止步于理论本身。
在技术转化成生产力方面,百度展示了一幅 AI 落地全景图。
百度旗下的多款应用与业务中已经转换成了 AI 引擎,而且其也正在开放能力,共享产业升级红利。
在小度助手 5.0 上,成熟应用了全双工免唤醒能力,实现了“一次唤醒,多轮交互”免唤醒词连续对话,这也是全球领先的技术落地。
援引第三方机构数据,第二季度小度系列智能音箱出货量位居全球第二、国内第一,同比增长率高达 3700%。
而且技术突破和落地,也进一步打破产品旧边界。作为“音箱”被归类的 AI 交互硬件,在小度系狂飙突进下,开始真正展现 AI 时代交互终端的样子——AI 音箱不再是音箱。
百度输入法方面,刚才提到的重要基础突破,流式截断的多级注意力模型(SMLTA)已经上线,效果立竿见影,在线语音识别相对准确率,比同领域最优玩家还有高 15%。
好消息是,离线语音识别准确率已经达到在线识别水平,且可以实现高精准中英文混合语音输入、方言免切换语音输入,这也是业内首次。
在机器翻译方面,继提出了多任务学习、多智能体联合训练等前沿方法,在 2019 年 WMT 评测中取得中英翻译第一,提出了首个具有预测和可控时延的同传模型,也是首个语义单元驱动的上下文同传模型,并研发了语音到语音的同传系统,无需经过语音识别转录,同样是业内首次。
而视觉为代表的感知智能落地,最具业内反响的是自动驾驶。
在业内“华山论剑”顶会 CVPR 2019,百度 Apollo 公开了国内唯一的纯视觉 L4 级自动驾驶解决方案——Apollo Lite,能够支持对 10 路摄像头、200 帧/秒数据量的并行处理,单视觉链路最高丢帧率能够控制在5‰以下,实现全方位 360°实时环境感知,前向障碍物的稳定检测视距达到 240 米。
相比旋转式激光雷达感知方案,视觉感知方案价格低廉且便于获得。并以计算机视觉和 AR 技术研发了一种增强现实的自动驾驶仿真系统(AADS),使用激光雷达(LiDAR)和相机扫描街景。
合成虚拟形象也是今年最“性感”的落地应用之一,并且达到了量产的水平。
百度与央视合作打造 AI 虚拟主持人小灵,亮相央视 2019 五四晚会;与澎湃新闻合作打造了第一个真人形象的虚拟主播早晚新闻栏目;与浦发银行合作打造了业内首个“金融数字人”。
基于知识图谱的视频语义理解,则已经在百度视频搜索、推荐、内容生成等多个产品上线。
通过对视频的视觉、语音、文本的多模态知识解析,在多元异构知识图谱上建立关联,并通过计算推理,建立对视频的深度语义理解,大幅度提升视频理解效果。
而且 AI 落地在今年也不再阳春白雪,更多接地气、可以被寻常百姓家感知的科普式方案也引起反响。
比如百度 AI 开发者大会上,打造了能说会道的机器臂“茶博士”。
利用 3D 视觉技术,可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,可以对工作空间进行碰撞检测,避开障碍物。完成实时规划运动后,可自动生成倒茶轨迹。语音语义联动技术解析,更是让机器人像“人”一般,听得懂,说得好,做得准。
最后,有技术、有落地应用之外,百度更宏大的雄心也徐徐展露——基于技术与应用优势,百度希望更进一步:打造平台,打造生态,成为 AI 世界的底座。
今年成绩单中,开发生态方面的数据同样非常醒目。
从百度当前的业务布局来看,其已形成了 4 大底座平台:
- 百度大脑 AI 开放平台
- 飞桨产业级深度学习开源开放平台
- Apollo 自动驾驶开放平台
- 小度开放平台
并且在 2019 年都实现了爆发。
百度大脑开放平台已经在语音、视觉、语言等方面实现全面升级,具备深度学习框架、场景化 AI 能力、定制化训练平台到软硬一体模组和解决方案等。
自 2016 年以来,百度已开放 228 项 AI 能力,开发者数量超过 150 万,日均调用量突破 1 万亿次,语音、人脸、NLP、OCR 调用量中国第一,是业内最全面、最领先、服务规模最大的 AI 开放平台。
援引 IDC 最新报告,百度飞桨与谷歌、Facebook 名列前三,领衔中国深度学习平台市场,也是市场份额前五中唯一的国货。
Apollo 自动驾驶开放平台已经汇聚了全球 156 家生态合作伙伴;在全球,有 97 个国家超过 3.6 万名开发者使用 Apollo 开源代码,开源代码数量超过 65 万,已成为全球最强大、最开放、最活跃的自动驾驶平台。
而且开放能力进一步打破边界,在刚召开的首届 Apollo 生态大会上,百度 Apollo 拓展裂变成三大平台:自动驾驶开放平台、车路协同开放平台,智能车联开放平台,成为中国自动驾驶基建国家队代表。
小度技能开放平台上,技能开发者数量已经超过 3.7 万人,可提供包括游戏、效率工具、网络电台、直播、儿童教育、智能家居等 3500 多种技能支持。合作伙伴数量已经超过 500 家,可以控制的 IoT 智能家居设备已经超过了 7000 万。
此外,百度还开源了中国首个边缘计算框架 BAETYL、自研底层区块链技术,并发布了多个工业级的领域数据集,如大规模自动驾驶数据集、街景图像数据和文字场景数据集、视频精彩片段、场景解析、机器阅读理解、中文句子及相应的开放域信息提取事实数据集等等,来促进算法研究,推动 AI 发展。
比如下图,就是 ApolloScape 数据集示例:上半截为彩色图像,下半截是其二位语义标签:
正如百度董事长兼 CEO 李彦宏所说:“作为一家平台级企业,成就他人、造福社会,这是百度创始初心与能力之所在,更是百度在行业发展关键时刻责无旁贷之所在!”
正是基于如此,百度才能够通过百度智能云的“云 +AI”能力,为各行各业大规模输送百度的 AI 技术成果与平台能力,成效也非常显著。
根据 IDC 在 11 月底发布的中国 AI 云服务市场报告,百度智能云在 AI 技术、市场和商业上处于中国领先地位,超过了阿里云、AWS 等一众厂商。
百度 CTO 王海峰感慨,百度在 2019 年提出“人工智能进入工业大生产阶段”,如今他们已经探索了 AI 进入“工业大生产”的真实路径,推动 AI 迈入自动化、标准化和模块化的新阶段,并与百度业务以及各行各业的生产实践深入结合,加速产业智能化进程。
在互联网、金融、智能城市、工业制造等行业已经拥有标杆性落地案例。
比如,与中国联通打造的智能客服已经在中国联通三省一基地上线;与央视网共建人工智能研发中心,打造媒体行业的 AI 软硬件产品;与精研科技打造智能质检车间,提升制造业质检效率,降低用工成本等等。
但百度的技术,并不仅仅希望体现在商业价值上,还希望通过社会价值,展现 AI 福祉。
成绩单中披露,2019 年“百度 AI 寻人”平台,用户发起照片比对超过了 36 万次,9000 多个走失者与家庭重新团聚。
百度还发布了听障儿童无障碍阅读计划,推出了全球首款听障儿童 AI 手语翻译小程序,能将绘本文字翻译为手语,帮助听障儿童实现无障碍阅读。
此外还将 AI 应用在了台风路径查询、濒危土家语保护、改造盲人按摩院等方面,进一步发掘 AI 价值。
所以百度 AI 如何回答 2019?上述种种业绩就是关键要素。
而且巨头玩家年度交卷,自然也是整个 AI 产业的共性、趋势反映。
正所谓窥一斑见全豹,百度的成绩单又反映出怎样的AI 2019?
百度成绩单背后的全球 AI 六大趋势
或许你会疑惑,百度上述新突破、新进展,为何发生在 2019?
背后有百度的技术积累开花结果,但也是 AI 发展进程使然。
这也是为什么百度的 2019 更值得被复盘解读,其中展示全球 AI 领域发展的六大趋势。
趋势一:CV 之后,NLP 领域成为下一个突破频出的领域
在百度交出的 AI 成绩单中,更多的 AI 突破与生产力转换都集中在语音语言理解方面。
比如语音识别、语音合成、虚拟主播、机器翻译、人机对话、知识图谱等等,并落地到了小度助手、百度地图、百度视频等等产品与应用之中。
这也体现出了整个人工智能当前的技术突破集中点:自然语言处理方向。
计算机视觉是人工智能产业中最为成熟的方向,人脸识别已经进入了寻常百姓家,整个方向彻底进入落地期。
早年围绕这一技术发展起来的第一波 AI 独角兽,也已经在想办法向更多的方向拓展。旷视发力 IoT 供应链,依图做起了芯片,而商汤在教育、AR、自动驾驶方向频频发力等等。
与此形成对应的是,NLP 方向突破频频。谷歌的 BERT 直接催生出了更多的变体,机器在自然语言处理与语义理解上更为突出,GPT-2 的问世也进一步彰显出了整个方向的创造力与活力。
众所周知,AI 可以被划分为“感知智能”和“认知智能”两大版块。
但 2012 年 ImageNet 石破天惊开始,感知智能的进展要遥遥领先于认知领域,直观类比来说,感知就像一个人类能考到 95 分的试卷,而认知领域,够到及格还挑战连连。
于是 2019 年,全新气象和里程碑进展频频,以语言语音为代表的认知,进入突破期。
趋势二:落地为王,价值重估,AI 发展回归理性
2019 年,整个人工智能产业变得更加务实。
绚丽的 Demo 少了,关于将 AI 应用到产品、落地到场景中呼声更多了。
这是对前些年人工智能领域“大跃进”的最直接回应,AI 发展理性回归,从资本方到企业,整个行业的参与者都在要求 AI 展示“降本增效”,来转化成真实的生产力。
2019 年的百度,在落地与 AI 生产力转换方面再明显不过。
最典型如自动驾驶领域有 L4 级视觉感知解决方案 Apollo Lite 和增强现实的自动驾驶仿真系统,对于自动驾驶落地,全球都在要求进入“平民”时代,依靠堆高精尖传感器的“贵族”玩法,市场空间越来越小。
这也是全球自动驾驶经受重估的一年。
国际上,Waymo 模式遭遇质疑和重估,摩根大通将其估值调低 40%,而在货运领域自动驾驶落地则热火朝天,两种不同形态一对比,才知道“看不见的手”想要的不再是遥远的迷人图景,它想要的是——少废话,证明价值吧。
趋势三:人工智能进入工业大生产阶段,需要标准化、自动化和模块化
在谈到人工智能的时候,很多人都会将其提为“新一轮的科技革命”,并将其比作蒸汽、电力等等。
但现实给出的种种反馈都颇为直接地展现出,在给出这一结论的时候,要用将来时态。从现在到将来缺了什么?
王海峰在 2019 年提出观点称,前三次工业革命的核心技术都具有很强的通用性,呈现出标准化、自动化和模块化的工业大生产特征。
而人工智能想要如此,自然也需要具备这些特征。这也是人工智能产业向前发展的根本所在。
前些年的人工智能落地,都体现在一个 case 接一个 case 的模式,现在进入工业大生产阶段,则要求人工智能体现出更加通用特征,一个产品能够处理多个 case,人工智能的能力要标准化、自动化和模块化。
百度的成绩单中,百度大脑、飞桨、小度助手、Apollo 等平台,都是百度对这一趋势给出的回应。
飞桨、Apollo 等开放平台被国际知名第三方机构波士顿咨询,作为中国 AI 发展的代表,并在全球范围内与谷歌相提并论,认为开放平台正是巨头优势和推动智能化变革的关键。
由此第四大趋势也愈加风劲。
趋势四:大公司大平台争夺“底座”愈加激烈
毫无疑问,将人工智能转化为生产力需要生产工具。谁提供的生产工具使用的越多,谁就能在生产力转化中占据上风,毕竟这是人工智能驱动的世界底座。
伴随着 2019 年人工智能落地提速,大公司大平台争夺“底座”愈加激烈。TensorFlow 和 PyTorch 展开“厮杀”。前者推出 2.0 版本,后者将目光也进一步强化端侧部署,各不相让。
毕竟以深度学习框架为核心的深度学习平台,下接芯片,上承各种应用,是“智能时代的操作系统”。
百度飞桨也在 2019 年迎来多次进化,推出多端多平台部署的高性能推理引擎 Paddle Lite、发布超大规模深度学习模型训练技术等等动作,也为其更好地展开竞争提供了支撑。
国内竞争中,华为加入战局、阿里从底层芯片和架构出发,腾讯也加大开源力度……
所以争夺的 AI 时代“底座”,也是新时代的“铁王座”。
趋势五:AI 向善、伦理问题更受关注
在人工智能技术产生商业价值的同时,如何更好地利用人工智能技术也成为世界范围内被广泛讨论的话题。
在学界,有今年 3 月斯坦福大学正式成立以人为本 AI 研究院,李飞飞担任联合主任,推动人工智能研究、教育、政策和实践,以改善人类状况。在业界,Facebook、谷歌等科技巨头在 AI 应用方面的做法也屡遭抗议与审查。
国内也不例外,关于 AI 伦理的探讨、探索也在展开。在百度的成绩单中,AI 伦理、安全以及社会责任都被着重强调,并给出了探索成果。
一方面是打造了完整的 AI 安全体系,另一方面在 AI 向善方面落地:“百度 AI 寻人”平台帮助超过 9000 个走失者与家庭重新团聚。
AI 在台风路径查询、濒危土家语保护、A改造盲人按摩院等方面也都发挥着重要作用。
此外,另一巨头腾讯,也在 AI 时代变革思考后,把“科技向善”正式写入公司使命和愿景,体现了对新时代伦理的重视。
全球范围内,谷歌的 AI 军用代表事件则内外广受争议,Facebook 年初开始的数据泄露事件则被批判至今……AI 时代面临的新伦理、隐私边界,并非说说而已。
趋势六:自主可控正在成为中国 AI 热词
最后,全球局势带来作用力,中国呈现反作用力。
2019 年的断供危机以及“实体清单”威胁,让自主可控成为新的关键词。
在百度成绩单中,完全自主研发的“百度昆仑云服务器”,让中国 AI 跑在自主可控的 AI 芯片上,与飞桨、ERNIE 等国产算法形成了软硬件一体的核心竞争力。
而且,百度的努力也不仅仅体现在自身体系之中,飞桨还与华为麒麟、寒武纪等国产芯片深度合作,打通深度学习框架与芯片 AI 算力,提升中国的 AI 竞争力。
而且更进一步,所有中国 AI 公司、科技公司,经此一役,已经明白“原创”、“自主”和“脱钩方案”的必要性和重要性。
AI 造芯浪潮复兴,依图等算法公司深入 AI 芯片腹地,联想等公司也推出自主可控防断供方案,国家层面则在底层技术和基础科研方面,前所未有重视。
虽然短期内对所有技术公司形成了挑战,但长远来看,或许也是历史性机遇:
自强则万强。
中国 AI 人才培养基地,专利申请重镇
对基础和底层重视,最直接体现就是对人才、专利方面的重视。
这一次百度成绩单中,也有重点展示。
今年是百度创立 20 年,过去 20 年中,从人才角度而言,国内以技术著称的百度,直接和间接培养了大批人才,成为名副其实的技术领域的“黄埔军校”。
而更令人欣喜的是,百度在 AI 发展中主动展现出的人才培养心态。
根据百度成绩单,百度 AI 已经形成了囊括师资培训、学生赛事、课程共建以及教材出版等多个维度产学融合生态。
推出了“全国高校深度学习师资培训班”、“飞桨博士会”、“AI 快车道”、“黄埔学院”、“在线深度学习集训营”等项目,一共培养 1000 名专业教师,助力 200+ 高校开设深度学习课程,为近 1000 家企业提供技术和应用培训。
而硬件方面,百度上线 AI Studio 教育版,这背后是价值超过千万人民币的上千张 GPU 卡,作为师资培训配套“教具”,免费提供给高校使用等等。
虽然百度人才培养模式,更多出于“底座”雄心,但客观而言,一定会加快中国 AI 技术进一步普及,以及更多人才带来星火效应。
从整个产业发展而言,乐见其成,也希望巨头投入更大资源。
人才之外,还有专利。
重视基础科研,自然会体现在知识产权能力上。国家工业信息安全发展研究中心 12 月发布的《人工智能技术专利深度分析报告》中给出例证,百度专利申请数量在国内排名第一,达到 5712 件,超过第二名近 1600 件。
在中国专利申请数量超越美国方面,可以说是当为头功。也算是作为国产 AI 第一大厂的实力和担当。
One more thing…
回顾 2019 年,正如王海峰所总结的那样,百度 AI 打造了扎实的底座;推动了真实的改变;创造了值得信赖的未来。
当然,AI 突破还在继续、AI 落地也还在继续,从这份百度成绩单中我们也能窥见到中国 AI 领域的一个缩影,让更多人了解 AI,也能给大小公司的 AI 之路提供参考,知晓智能时代变革如今身处何处、未来又走向何方。
不过,每个人都有每个人的 AI 见证时刻。
所以也想小小互动一下:
2019 年里,你印象最深刻的 AI 事件是哪一个?
来自:
量子位(ID:QbitAI)