文/土妖
西汉·司马迁在《史记·淮阴侯列传》中说道,“秦失其鹿,天下共逐之。”毫无疑问AI就是当下TMT行业最大的那只“鹿”。
在群雄逐鹿的过程中,有全*压上、放手一搏的;也有韬光养晦、蓄势待发的;当然也有盲目追风、滥竽充数的……
在笔者看来,放眼全球AI领域,呈现出来的是“2+1”的三国鼎立的态势,“2”指的是美团的微软、谷歌,而“1”则是来自中国的百度。这三家是目前全球AI领域综合实力最强的第一梯队玩家。当然,口说无凭,我们不妨用数据和事实说话,从核心技术、研发实力、AI产品和服务这三个维度,对比一下这三家的发展状况和态势,解读一下为什么说这三家才是AI领域的最强“王者”。
核心技术:世界级顶尖AI高手,就需要有全栈AI能力
对于进*AI的广大企业来说,毫无疑问,核心技术水平是最为重要的,把其看作是企业的AI“压舱石”并不为过。说到技术,最近一两年来,FullStack这一词非常火爆,其翻译成中文的话是“全栈”的意思。
如果说架构师、全栈工程师是工程师中最高阶的话,那么全栈AI能力,则是AI厂商进*最顶级阵营的一大门槛。毫无疑问,放眼全球,对世界级顶尖AI高手的要求是,要他们真正的拥有全栈AI能力的,做到这点的,土妖认为有微软、谷歌、百度这么几家。
所谓的“全栈AI能力”如今并没有公认的定义,但是在土妖看来,从底层的芯片能力,到中间层的算法和机器学习能力,再到上层的应用开发能力;在此基础上加之以开放框架和平台、大数据和云端能力;同时还要拥有AI商业化、AI全局洞察和思维能力……如此这般,方能称之为,拥有了全栈AI能力。
一、微软,厚积薄发,用AI融合一切产品和业务
先说微软。微软在年的时候,战略的方向是移动和云;后来以云为核心,推进智能化、边缘化发展;再之后微软CEO萨提亚·纳德拉进一步提升AI的权重,甚至在公司愿景中都加入了有关AI的描述。
微软在AI方面拥有语音、图像、视频、语言、翻译、机器学习、计算机视觉等方方面面的技术,并拥有OpenPAI、ToolsforAI、ProjectBrainwave、ML.NET、ONNX等各种开发技术和工具。如果要在技术侧给微软全栈AI能力给出一个关键词的话,土妖会选择——融合。
比如,AI与云的融合,让微软在公有云Azure、混合云AzureStack、物联网AzureIoTEdge和AzureSphere等多个细分领域不断取得进展,最近更是打败亚马逊,成功获得了美国国防部亿美元的超级大单。
比如,AI与网络资源、开发资源融合,让成千上万的开发者能够有效提升对端的掌控能力,并极大降低应用和边缘应用的开发、测试和部署成本。
再比如,AI与产业合作伙伴如高通的合作,让工业设备可以降低对云端的依赖,并迅速做出业务响应。
而AI与Office、Dynamics、Linkedin等产品的融合,则让微团在软件、应用领域,快速的具备了AI能力。
二、谷歌,保持对世界的好奇,AI探索永无止境
如果说微软是稳扎稳打型的话;那么谷歌就属于天马行空、率性而为。土妖对谷歌在全栈AI能力方面,给出的关键词是——探索。
对谷歌而言,语音、图像、视频、语言、翻译等等都是最基本的,除此之外更有GoogleBrain、TensorFlow、AutoML、DeepLab、量子计算、机器人技术、FederatedLearning、SpecAugment等等名目繁多的核心技术。
以SpecAugment为例,其通过数据增强的办法,解决模型拟合问题,从而能够使得单词错误率大幅降低至2.6%。
而在量子计算领域,谷歌更是走在了探索的最前列,当然谷歌也丝毫不低调,此前其就高调地宣称自己实现了“量子霸权”。谷歌的信心和证据来自于,在世界第一超算Summit需要计算1万年的实验中,谷歌的量子计算机只用了3分20秒就完成了计算。
当然,这一实验对比并没有在真实的应用场景之中,因此土妖才会强调其“探索”的意义。只不过,探索往往就是成功实践最重要的一步,就像谷歌CEO桑达尔·皮查伊所言,“人类的首架飞机飞行时间只有12秒。”
三、百度,20项AI全能冠*,以落地行动促进AI普惠
相较于微软的“融合”;谷歌的“探索”;百度在全栈AI能力方面,则更体现出了“落地”的特点。无论是语音技术、图像技术、文字识别、人脸与人体识别,还是视频技术、AR与VR、自然语言处理、知识图谱,又或者是芯片、AI计算平台、5G边缘计算、量子计算、飞桨……百度几乎在每一个技术侧面,都实现了落地,而落地的背后,则是百度“EveryoneCanAI”这一AI普惠价值观的体现。
实际上,要实现AI普惠的一大前提是AI技术最大化的覆盖普及。不妨以百度的语音技术为例进行说明。
比如风格迁移语音合成技术,使得仅仅需要20句话,就可以为用户生成属于自己的专属声音,并用于在线地图导航等领域。
而在医疗领域,原本60%的医护人员每天要花费45分钟到90分钟的时间填写表单数据,如今只要用语音就可以实现表单的高效录入。
不仅如此,语音技术和图像识别技术的结合,还能以小Q智能导盲眼镜的方式,通过精确播报障碍物、物品、纸币等,让盲人群体更加独立的“看到”这个世界。
所有这些,让如今百度语音能力引擎的日均调用量,超过了亿次的规模,达到了全行业第一。换句话说,每个网民每天调用百度语音能力的次数高达12次之多,这一数字赶上了普通人每天和家庭成员的聊天次数了,由此也真正意义上实现了在语音技术方面的“AI普惠”。
实际上,除了语音调用量之外,百度全栈AI能力,在AI日均调用量、AI专利申请量、核心AI论文篇数、科研人员占比、AI开放平台能力、开发者规模、语音日均调用量、人脸识别日均调用量、百度智能云计算机视觉能力、小度产品智能度、自动驾驶拍照数量、自动驾驶测试里程等总共20个方面,都在中国实现了难能可贵的“第一”。
研发实力:三巨头都是四轮驱动,实力在伯仲之间
如果把“核心技术”看作是各大厂商在技术侧的“过去式”的话,那么“研发实力”,就是各大厂商在技术侧的“将来式”,因为有着怎样的研发实力,就意味着在不远的将来有着怎样的技术成果输出。在研发实力方面,三巨头走的都是“四轮驱动”的路线,换句话说,他们的研发实力可以继续细分为领*人物及尖端人才矩阵、研发实验室、专利数、研发投入等大致四个维度,从这四个维度的对比中,可以发现这三巨头的研发实力都在伯仲之间。
一、先说领*人物及尖端人才矩阵
1、都是国际级AI大师领衔
在AI领*人物方面,微软如今负责其AI业务的是CTO凯文·斯科特(KevinScott);谷歌方面,当下扛起AI大旗的则是美国工程院院士JeffDean;而百度方面则是王海峰博士领衔。稍微了解这三位领*人物,会发现他们基本是一个旗鼓相当的水平。而除了领*人物,无论是微软、谷歌,还是百度,在最顶尖的AI人才方面,也都是人才济济。
2、各家都是人才济济,每个细分领域都有顶级大牛坐镇
微软方面有,微软云计算与人工智能事业部全球技术院士*学东、微软亚洲研究院副院长周明、首席数据科学家谢梁、微软亚洲互联网工程院院长王永东、微软小冰之父李笛、微软亚洲研究院网络图形组首席研究员童欣、剑桥微软研究院技术研究员兼实验室主任ChristopherBishop等各位大牛。
谷歌方面则有,谷歌副总裁、高级工程研究员GefforyHinton,要知道这哥们可是年的图灵奖得主;此外谷歌还有DeepMind联合创始人及谷歌工程副总裁DemisHassabis、DeepMind联合创始人及应用AI主管MustafaSuleyman、谷歌首席决策科学家CassieKozyrko、TensorFlow的创始人之一GefforyHinton等等。
而百度方面,也同样星光熠熠,囊括了计算机和大数据理论领域专家、前密西西比大学校长、计算机教育界知名人士JeffreyVitter,ATT和贝尔实验室前副总裁及首席科学家DavidBelanger,伊利诺伊大学厄巴纳-香槟分校终身教授、计算机视觉领域顶级科学家DavidForsyth,明尼苏达大学终身教授、知识发现与数据挖掘(KDD)领域的最高技术荣誉ACMSIGKDD创新奖得主VipinKumar,量子密码学的共同发明者之一、牛津大学终身教授、新加坡国立大学量子技术中心主任ArturKonradEkert……可以说,这些人里面,任何一个人在其所研究的领域,都是有着世界级影响力的。
二、再说研发实验室
1、微软以地域为主去划分,实验室遍布各地
在人工智能领域,研发实验室之所以重要,是因为其代表了人工智能在全世界最高的发展水平和最新的发展动态。
在研发实验室方面,微软的划分更多的是体现地域的特点,在主要的大洲、国家、地区,都有着自己的实验室,比如亚洲实验室、印度实验室、剑桥实验室、纽约市实验室、雷德蒙德实验室、开罗高级技术实验室等。当然,也有按照业务划分的实验室,比如混合现实AI苏黎世实验室、Azure安全实验室、微软人工智能和物联网实验室(上海)等等。
2、谷歌以研发方向去划分,GoogleX和GooleAI是核心
和微软不同,谷歌的研发实验室,更多的是以AI研发的细分领域和布局去划分的。比如GoogleX实验室、GooleAI、DeepMind、大数据实验室(BDL)、硅谷人工智能实验室(SVAIL)、商业智能实验室(BIL)、量子计算研究所(IDL)、认知计算实验室(CCL)、深度学习实验室(IDL)、机器人与自动驾驶实验室(RAL)等。
以GoogleX实验室为例,谷歌眼镜、ProjectWing无人机、Waymo自动驾驶汽车、谷歌热气球无线网络等鼎鼎大名的项目,都出自这一实验室。
3、百度以AI业务去划分,实验和研发能力不断输向海外
百度和谷歌类似,也是以AI业务细分领域的划分为主的,如今百度的人工智能实验室主要有:认知计算实验室(CCL)、深度学习实验室(IDL)、机器人与自动驾驶实验室(RAL)、硅谷人工智能实验室(SVAIL)、大数据实验室(BDL)、商业智能实验室(BIL)、量子计算研究所(IQC)等、百度Apollo汽车信息安全实验室、5GAI边缘实验室、百度地图智能交通联合实验室等。
土妖相信,微软、谷歌、百度的这些研发实验室,有朝一日也会诞生出类似贝尔实验室、劳伦斯伯克利国家实验室、林肯实验室、喷气推进实验室、橡树岭国家实验室等,这种全世界最顶尖的实验室。
三、接着说专利数量
在人工智能的专利数方面,由于地域的不同,所以要分两个维度去看。微软和谷歌方面,来自德国公司IPlytics的数据显示,他们分别处于IPlytics榜单的第一位和第五位,累积专利数分别为18,件和9,件。
1、中国专利保护协会数据:百度领先微软和谷歌
此前,来自中国专利保护协会的《人工智能技术专利深度分析报告》显示,在中国市场,百度以2,件的AI专利申请量遥遥领跑。其数量是腾讯的2倍、阿里巴巴的3倍以上。在同一榜单中,微软和谷歌的专利数量分别是1,件和件。
2、国家工业信息安全发展研究中心数据:百度第一,微软第三
而在近日,国家工业信息安全发展研究中心发布的《人工智能中国专利技术分析报告》则显示,百度以5,件专利位列中国人工智能领域专利数第一,数量是去年的2.4倍,这也是百度连续两年蝉联了第一的宝座。值得一提的是,在诸多核心细分领域,比如深度学习技术、语音识别、自然语言处理、智能驾驶等,百度也夺得了细分领域的第一。此外,在这一榜单中,微软排名第三,专利数为3,个。
四、最后说研发投入
1、投入和涨幅,均是谷歌母公司Alphabet第一
以最新一季的财报数字为例,微软的研发投入为43.16亿美元,同比增长16.2%;谷歌母公司Alphabet的研发投入为65.54亿美元,同比大涨了25.3%;而百度的研发投入则为47亿,同比涨幅为20.5%。
2、研发的营收占比,百度第一
研发在营收的占比方面,微软、谷歌、百度的数字分别是,13.1%、16.2%和16.7%,百度的研发占比最高。
产品和服务:微软走“三化”道路,谷歌点状布局,百度双管齐下
一、微软AI产品和服务:赋能化、场景化、硬件化
云计算业务让微软迎来了二次复兴,如今微软的市值在科技股中仅仅低于苹果,位居第二位。
在微软内部,对AI的重视,已经达到了前所未有的高度。包括纳德拉在内,大部分微软高管都会参加于每周四举办的AI会议,这一会议主要讨论微软的各大AI项目。
对于微软的AI产品和服务,如果你还停留在小冰、小娜身上的话,那就OUT了。实际上除了小冰、小娜,微软还有Microsoft、MicrosoftDynamics、BingPredicts、MileIQ、SwiftKeyPowerBI、MicrosoftPix、CortanaSkillsKitforEnterprise、CaptionBot、以及微软智能音箱Invoke、蓝牙降噪耳机SurfaceHeadphone等等。
仔细分析,可以发现微软在AI产品和服务方面,有着三个比较明显的特点:
1、其一,是赋能化
比如通过HomeHub功能,连接AI与传统PC,让类似Windows10这样的产品实现智能化,从而可以控制飞利浦、Nest、三星等厂商的智能家居产品。
2、其二,是场景化
以小冰、小娜背后的智能语音技术为例,其不仅为小冰、小娜提供服务,同时也逐步开始走向智能客服、实时翻译、语音记录等场景中。
3、其三,是硬件化
可以说亚马逊在硬件领域的巨大成功,给了微软以极大的触动,最近微软更是任命了一位首席产品官,主攻硬件,不难看出“软件结合”仍旧是微软进*AI的一个主要着力点。
值得一提的是,无论是赋能化,还是场景化,又或者是硬件化,微软如今在行业里领先的云计算业务都贯穿始终。微软的目标很清楚,是要在云计算优势的基础上,积极“加载”AI,让微软成为全球AI和物联网的基础设施,就像PC时代的Windows操作系统一样。
二、谷歌AI产品和服务:点状布局不成整体,成功者多失败者众
至于谷歌,虽然也有谷歌搜索、谷歌地图、安卓系统、GoogleAssistant、AlphaGo、GoogleDuplex、Googletranslate、GoogleLens、GooglePixel、Waymo、GoogleNestHub、GoogleHome、AndroidWear等不俗的产品矩阵,但是在土妖看来,相比于其在人工智能领域的巨大投入,产出仍旧不算太优秀。
1、失败者众
一直以来,谷歌在产品方面被诟病的“炫酷有余,实用不足”的情况,仍旧没有得到大的改观。
随便回顾一下。比如,此前谷歌最受