Fork me on GitHub

李彦宏喊你来坐无人驾驶出租车;联手华为,百度继续搞芯片

  边策 李根 乾明 发自 凹非寺 
  量子位 报道 公众号 QbitAI

  无人驾驶出租车推出、联手华为麒麟打造芯片、无需唤醒语音交互能力,AI 识别搜索,高颜值数字人……

  这就是百度 AI 开发者大会上的一系列黑科技进展。

  而且也能窥见百度正在展开的变革。

  以前世界大会只秀“我怎么样”,开发者大会开始展现“我们一起能怎么样”,如今则声势浩大亮出风向:百度 +AI 开发者,产业会怎么样?

  答案是三个字:智能化

  李彦宏振臂挥手,希望带领 AI 开发者,成为产业智能化的变革者。

  那么百度这次,究竟准备了哪些最新的 AI 开发者装备?

  详情传送如下。

  一、李彦宏:AI 发展有险阻,前进道路不改变

  今年大会全程由百度 AI“小度”主持,首先登台的是一身白衬衫的李彦宏。

  百度创始人说,今年是第三次举办 AI 开发者大会,所谓一生二,二生三,三生万物。

  AI 也是一样,正在唤醒万物。

  首先分享在 AI 语音交互——智能音箱方面的进展。

  时隔半年,小度又长新本事。

  李彦宏现场亲自演示,选择“极客模式”,然后无需唤醒词——双全工状态——能实现免唤醒词连续对话。

  不过,赢得满堂彩的是“拒绝反应”。即小度知道什么时候该应答和执行任务,什么时候只需要听着,不搭话、不反应。

  李彦宏说, 小度的进化只是 AI 变革的小小缩影。

  AI 更大的作用力,正在展现在各行各业,且只要变革某个小小环节,就能带来大大不同。

  这就是 AI 助力下的产业智能化。

  依然举个例子,从百度最领先的自动驾驶说起。李彦宏展示出全 L4 自主泊车方案。

  目前百度科技园,已经实现了该套方案。

  然而就在此时,意外状况发生。

  李彦宏只是说了一句“what’s your problem?”并淡定继续演讲:

在 AI 前进的道路上还是会有各种艰难坎坷,我们前行的路不会改变,我们坚信 AI 会改变每个人的生活。

  这一表态也赢得现场掌声和鼓励。

  接着一切继续。李彦宏通过小度音箱现场连线吉利控股集团董事长李书福,双方秀了一把“车+互联”的场景。

  李书福也来到现场,说吉利车+百度 AI,能够极大提升车的智商和情商。

  百度和吉利也就此正式达成智能出行合作。从吉利博越 PRO 开始,吉利汽车将开始搭载全面融合小度车载 OS 能力的 GKUI19 吉客智能生态系统。

  交通产业的智能化变革,不止于车。

  李彦宏还介绍了智能红绿灯等基础设施方面的进展。

  百度创始人曾在去年百度世界大会上提到,通过智能红绿灯全局控制,可以减少 20%~30% 左右的拥堵等待时间。

  比如在保定,智能红绿灯的运营对提升交通效率有明显的效果。

  实测显示,在早晚高峰期间,市民的行程延误时间减少了 20%~30%,在缓解突发交通拥堵方面,效果尤为显著。

  如果说上述新进展更多是让产业和生活更智能,那接下来的几项新进展,则能展现出 AI 美好的那一面。

  首先是 AI 寻人。李彦宏说,百度 AI 寻人已帮助超过 6700 个家庭重新团聚,将覆盖民政部全国 1600 家救助站。

  百度董事长还专门强调,在走失人员中,寻找儿童的难度最大:很多孩子在走失的时候只有几岁,失踪多年后,容貌发生了变化,这给寻人带来了很大的困难。

  百度 AI 寻人接入民政部救助管理体系后,家属只要在全国救助寻亲网上传一张照片,就能完成与民政部救助系统内滞留人员的比对。就算拿来比对的是一张多年前的照片,AI 人脸识别也能快速、准确辨认出他现在的样子。

  另一项是 AI 助盲。

  这是两位百度工程师发现的语音技术应用的新场景。

  他们有一次到盲人按摩店,发现因为视力障碍,盲人按摩师的工作有许多不便。他们想到百度的 AI 语音技术可以帮助他们,于是自掏腰包,给店里装上了小度音箱,改造了空调、隔断帘和灯带,盲人师傅们只要喊一声“小度小度”,就能开关空调、调节温度、定闹钟。盲人师傅的工作和生活因为 AI 很大的改变。

  目前,百度 AI 助盲行动已经开始向更多城市推进。

  李彦宏也以Do better结束演讲:

技术是百度的信仰,“用科技让复杂的世界更简单”是百度的使命。百度人在技术创新的同时,也在积极用技术去解决多种社会问题,用科技让世界变得更美好。

Do Better,科技为更好!这是科技存在的意义,也是每一个百度人不分昼夜、努力创新所追寻的意义。相信和大家一起,汇聚起科技的力量,就一定可以让这个世界变得更好。

  二、交通产业智能化:无人驾驶出租发布

  自动驾驶方面的大进展:Apollo Go。

  百度副总裁、智能驾驶事业群组总经理李震宇感慨,今年是 Apollo 开放的整整 2 周年。

  这两年来已经证明:无人车时代不可能一蹴而就,弯道超车。

  但开发者的创新,还是极大超出了想象。

  他首先介绍了 Apollo 的新物种。Apollo 已经与众多开发者在 9 大场景,完成多样化的“新物种”创新并相继落地,包括无人零售车、景区智能漫步车、智能清扫车、无人挖掘车以及本次大会首次亮相的酷黑自动驾驶教学小车。

  其中,阿波龙已搭载 4 万名乘客,在 25 个城市落地运营;新石器无人零售车已提供零售服务 16 万次;金瑞麒智能漫游车已签约 43 个景区。

  同时,Apollo 的 Minibus 量产解决方案也与多家车企达成合作。与江铃合作的江铃特顺-园区接驳车已进入南昌园区试运营。

  值得一提的是,全球顶级汽车制造商丰田也加入了 Apollo 计划 。

  李震宇给出小预告:

  未来由丰田提供车辆,搭载 Apollo minibus(企业版)解决方案的 e Palette 将面世。

  技术推进方面,除了李彦宏介绍的自主泊车方案,以及国产自主车企吉利汽车的小度车载 OS 能力,RoboTaxi——Apollo Go 也被正式推出。

  首先,前提是中国首条 L4 乘用车生产线也打造完成。

  百度与一汽红旗联手,在吉林长春落地。该乘用车生产线即 Robotaxi 前装产线,可实现流水线生产,装配差异<1mm,3.6 分钟就下线一台 L4 无人驾驶乘用车。

  直接受益的是长沙。百度和一汽红旗的 L4 乘用车,将以 RoboTaxi 车队的形式在长沙展开试运营,年内就能体验,这也是中国首批规模化的 RoboTaxi。

  毫无疑问,Apollo Go 直接对标就是 Waymo One,而且无论是百度 Apollo,还是车厂一汽红旗,都是中国自主厂商方面的合作。

  李震宇现场放出Apollo Go的打车小程序界面——自动驾驶的终极形态,终于在现实中揭开面纱。

  下一步,百度自动驾驶还会利用自身技术,率先帮助长沙完成“城市级”智能化升级,实现百公里城市道路车路协同升级改造和 5G 的铺设。

  此外,Apollo 5.0 也正式发布。

  包括 Apollo 开放平台以及 Apollo 企业版两大升级。

  其中阿波罗开放平台全新开放数据流水线,使开发者可以通过云端 30 分钟完成一辆车的动力学标定,一周可完成百辆标定。

  Apollo 企业版则全新发布无人驾驶出租车、智能信控两大量产解决方案,重点升级无人驾驶小巴、自主泊车、小度车载 OS 三大能力。

  除了车端智能,百度 Apollo 也从交通产业全局看问题。

  李震宇指出,提升城市智能化交通控制效果,关乎感知、研判和控制三大因素。

  在控制方面,Apollo 实现了全场景实时控制。有了智能信控系统实时调控红绿灯,就相当于每时每刻都有一个智能交警帮助疏导城市交通了。

  目前,百度智能信控系统在保定的实践中,已帮助交通延误时间减少 20-30%。

  最后,再次被强调的是“道路千万条,安全第一条。”

  大会现场,百度联合安波福、奥迪、宝马、大陆、戴姆勒、FCA、HERE、英飞凌、英特尔、大众 11 家公司 42 名专家发布了《自动驾驶安全第一》白皮书,系统应对安全挑战。

  这也是全球第一份全产业链自动驾驶安全文件。

  三、家居产业智能化:小度助手首秀黑科技

  百度副总裁\智能生活群组的负责人景鲲感慨,三年前在 AI 开发者大会上,许下打造语音交互平台的梦想,志在家居产业的智能化升级。

  而现在,最新进展能说明一切。

  首先,小度助手(DuerOS)已经无处不在,智能音箱不再只是音箱了。

  截止到 2019 年 6 月,小度助手激活设备量已经超过 4 亿台,月交互次数已经超过 36 亿。

  另外据 Canalys 等三家机构报告显示,2019 年第一季度小度智能音箱出货量已经位列全球第三,中国第一,成长非常迅猛。

  其次就是DuerOS 5.0

  核心能力就是李彦宏开场演讲的全双工免唤醒和“拒绝回应”的技术集成。

  最后,最让景鲲自豪的是,小度助手拥有了中国最大的语音交互开发者生态,目前有 3 万 3 千名开发者。

  景鲲还透露,面向开发者,小度助手还会进一步推出免编程等语音交互技能开发能力。

  值得一提的是,小度新品也随之发布:

  家庭 AI 中控:小度智能音箱大金刚。

  一方面,可以替代家里的所有遥控器。

  还是一款可以看电视的智能音箱,拥有投屏能力。

  该能力由百度和爱奇艺联合开发,全称智能电视 DLNA 投屏。

  不需要特别硬件和协议,就能匹配市面上的大多数电视,可以观看爱奇艺内容资源。

  售价,199 元。

  第二款产品,小度智能音箱 Play.

  这是一款面向年轻用户群体的专门音箱。

  而且还由李彦宏的 00 后女儿 Brenda 代言。

  最后,还有一款带屏智能音箱小度在家的迭代:4G 版,可移动,支持 Nano sim 卡。

  这次百度开发者大会上,百度副总裁景鲲提出了商业化的尝试:从联合会员到付费技能。

  这也是智能音箱行业首个商业化的方案。

  四、AI 生产大平台更新,联手华为麒麟芯片

  当然,无论是 Apollo,还是小度助手,都只是垂直产业和领域中,百度大脑的落地体现。

  百度 CTO 王海峰,履新后首次公开演讲,推出最新的百度大脑 5.0 版本。

  有意思的是,在演讲前,百度的机器人表演了一段传统项目:茶艺。这个机械臂不仅会倒茶,还能和王海峰熟练地对话,并且精准识别茶杯位置。

  小小的机械臂背后,融合了计算机视觉、语音交互、自然语言处理等多种 AI 技术。

  其后王海峰正式发布百度大脑 5.0

  百度 CTO 说,这是一个软硬一体的 AI 大生产平台。在百度的定义中,要将 AI 技术用于工业大生产,需要满足标准化、模块化、自动化。

  百度大脑在语音、视觉、语言和知识等核心算法法再度重磅升级,发布 6 大技术突破。

  在语音识别上,百度首个流式多级的截断注意力模型(SMLTA)的语音识别服务上线,让识别过程中的延时更短,准确率提高了 15%~20%。

  更重要的是,它在中英文混合识别上的效率更高了,无疑是解决了很多海归高端人才交流的痛点,交流过程中也不用担心中 English 混说了。

  比如百度语音技术部高级总监高亮,在开发者大会现场秀了一段“Rap”:Hello Everyone,中英混合说是我们的 everyday work,Explore 技术的 depth 和 scope 是我们的 responsibility……

  技术人员在交流过程中英文混杂是很常见的,但是这段话还是被百度输入法流畅、精准、及时地识别出来。

  至于语音识别,百度这次展示出了人文关怀一面。

  百度根据一位老军人战友生前的讲话内容,实现了阴阳两隔的人之间的交流,这项技术在央视播出后感动了很多观众。

  此外,王海峰还发布了知识增强的语义理解框架ERNIE和基于知识图谱的视频语义理解技术,以及业界首创的高准确度、低时延的机器同声传译技术。

  去年百度发布了 AI 芯片昆仑,经过一年的时间,这款芯片已经流片成功。今年,百度又推出另一款 AI 芯片百度鸿鹄

  这是一款面向远场语音交互的芯片,双核 DSP 核心,平均功耗仅 100mW,可以用于车载语音交互、智能家居等环境。

  深度学习正在推动 AI 进入大生产阶段,对于百度而言,不得不提的就是飞桨(PaddlePaddle)平台。

  在本次大会上,飞桨也迎来重要合作方:华为。

  王海峰与华为消费者 BG 软件总裁王成录联合宣布:百度飞桨和与华为麒麟芯片合作,共同开拓 AI 的无限可能。

  双方将国产深度学习平台用在国产自研芯片,二者将充分发挥各自在软、硬件方面的优势。

  最后,王海峰博士展示飞桨平台在工业上的应用:百度自己用它来更智能得采集地图数据,杭州气象部门用它来快速训练天气推理模型。

  但他也强调,这只是 AI 推动产业智能化的小小举例。

  更大的红利,更深刻的变革,要由 AI 开发者带到各行各业,真正推动产业迈向智能化。

  五、AI 变革基础业务新进展

  “夯实移动基础,决胜 AI 时代”是百度的战略。

  而百度 App 就是“移动基础”的几种体现,其负责人沈抖,也带来新进展。

  这位百度 SVP 上台之后并没有直接开始谈产品,而是以技术开场。

  他率先展示的是超级分辨率,一种通过深度学习来提高图片和视频分辨率的计算机视觉技术。

  左侧是原始视频,右侧是使用超级分辨率技术处理过的视频,只有原视频不到一半的流量。

  依靠这项技术,百度在 NTIRE(计算机视觉 low-level vision 领域中影响力最大的竞赛)中夺得了冠军。

  沈抖介绍称,在图像和视频场景下,依靠超级分辨率技术,他们可以将实时分辨率可以提升2-4 倍,并且为开发者节约 50-75% 的带宽成本。

  但只是依靠强大的云端算法,其实没有办法完全做到在移动端实时地提升分辨率。

  百度何以可能?离不开飞桨移动端部署库——百度深度学习平台飞桨的子集。

  沈抖说,针对移动端的特定场景,他们做了非常多的优化,框架体积缩小至 300K;通过汇编指令级速度的优化,在保持低功耗的情况下实现了超高的性能;这个框架还能支持 8 种软硬件平台,做到了移动端的跨平台覆盖。

  飞桨移动端部署库已经在百度 APP 、百度地图、百度网盘和自动驾驶等产品大规模使用。也就是说,它的可靠性已经过数亿用户验证。

  之后,围绕着飞桨移动端部署库的能力,沈抖才开始介绍起了自己的核心产品,百度 APP。

  沈抖首先介绍的是视觉能力,旨在帮助用户更便捷、准确地看懂身边的世界。比如,用百度 APP 识别植物。

  沈抖介绍称,百度 APP 已经可以智能识别两万多种植物,每一种植物都会展示相关的百科词条。

  不仅仅只是识别单个物体,百度 APP 还可以同时识别多个物品。然后,沈抖把手机对准了一个化妆柜。

  基本上,每次都能够同时识别出2-3 种化妆品名字,并且在手机移动的过程中连续稳定地追踪,点击后还能出现商品详情。

  沈抖说,百度 APP 可以识别上百万种美妆类产品,并且可以找同款,比价格,看评价,然后直接在小程序中下单。

  而且在识别玩具手办上,效果也非同寻常。

  沈抖介绍称,这种不需要任何的手指操作,就能像人眼一样看清、看懂的黑科技,是百度 APP 上最新的“动态多目标识别”能力。

  基于飞桨移动端部署库,他们把原来云端 200 多层的视觉算法模型优化到 10 几层,实现了 100ms 以内识别物体,8ms 内做出物体位置追踪更新。

  相比之下,人类肉眼识别物体,一般需要 170ms 到 400ms,追踪物体刷新需要 40ms 左右,这意味着百度 APP 的识别速度已经超过了人眼。

  沈抖透露,通过 400 亿的训练数据,百度 APP 已经能识别超过 1000 万种物品,不管是识别速度还是识别范围,都保持了业界领先。

  然后,百度 APP 超级探索代言人邓伦上场,集中演示了一波百度的智能搜索能力。并直接展示了百度 APP 应对垃圾分类的能力,比如 5 号电池是什么垃圾?

  此外,也有其他的一些提问:科比和樱木花道谁高?库里的场均得分和詹姆斯的谁多?等等。

  沈抖也介绍了这背后的实现逻辑:

通过自然语言处理技术、知识图谱等技术,百度 APP 能把口语化描述的问题解析成机器可理解的逻辑表达式,并找出问题中的关键点,在互联网上找到基础信息并执行计算,最终把结果呈现给用户。

  能看,能听,会看。也少不了能说。沈抖也展示了百度 APP 基于语音合成的播报文章功能,他说,只需要少量语料数据,就可以实现的不同风格声音合成,复刻真人主播的朗读效果。

  最后,沈抖也给出百度 APP 最新业绩:

  百度 APP 的日活用户规模达到 1.9 亿,已经成为国内最大的综合性内容消费和服务平台;

  百度移动生态也在不断壮大,百度移动应用的月活跃设备已达 11 亿台。

  在 2018 年开发者大会上首次亮相的智能小程序,也迎来年度总结。沈抖表示,借助智能小程序,百度致力于打造服务闭环,在平台内部完成用户的所有需求,与用户之间有了新的连接。

  然后,也介绍了上海车展、广东卫视、有赞以及中关村在线等案例。现在,百度智能小程序已经聚集了超过 15 万开发者;月活用户已经超过 2.5 亿。

  六、高颜值高智商数字人

  最后压轴登场的是百度副总裁、智能云总经理尹世明。

  Last but not least.

  AI 进产业有多热闹,看百度智能云的发展速度就知道。

  百度智能云是百度 AI 落地的载体。以场景 AI 平台,让开发者更便捷地开发 AI 应用。

  以建筑工地监控为例,上传生产视频、标注数据,再到完成模型训练,只需不到 10 分钟的时间。

  在营收方面,百度智能云单季度收入突破 10 亿,是用时最快的云厂商。云计算专利方面,与 AI 相关的专利方面,全国第一。

  不过别以为 AI 驱动产业智能化,就与你的日常无关。

  在发布会最开始,李彦宏还发布了百度、浦发银行联合培养“数字人”

  颜值高,拥有超级大脑,非常聪明,而且完全不怕 996,可以不吃饭不睡觉 7×24 小时上班,随时随地提供服务,还善解人意、始终情绪稳定。

  目前,数字人在金融领域牛刀小试。

  接下来,会在旅游咨询、医疗健康、移动通讯等领域,数字人都将大显身手。

  对每个用户来说,数字人都是私人订制、终身服务的。她不会忘记任何事情,只会越来越聪明。

  从产业智能化,再到每个人受惠,前景迷人……

  剩下的,就是更多 AI 开发者投身其中、参与进来,实现一个时代的变革了。

  你觉得呢?

  量子位 QbitAI · 头条号签约作者  

来自:
量子位(ID:QbitAI)

作者:Johnson
原创文章,版权所有,转载请保留原文链接。