万字记录谷歌I/O全球专访:劈柴说“我有一个十年的路线图”
发布日期:2024-07-25 10:51 点击次数:92
作者 | 周雅
配图 | 周雅
来源 | 科技行者
在今年I/O的第二天,谷歌在美国总部(Googleplex 2000)组织了一场小范围专访,包括谷歌母公司Alphabet兼谷歌CEO桑达尔·劈柴(Sundar Pichai)在内的四位核心管理层,接受了包括科技行者Techwalker、CNBC、《朝鲜日报》、意大利纸媒《La Repubblica》、巴西纸媒《Folha de S. Paulo》、英国电视台等全球媒体的提问。
采访中,劈柴回应“OpenAI的截胡式发布”时说道:“当我们正处于AI的拐点上时,我看到的是机会,所以如果把这个时间线拉长,那么某一天发生的某一件事就都无关紧要了。这意味着,有一个正确的远见很重要,因为大家讨论的是这项人类有史以来最深奥的技术之一。”
他继续说道,“我喜欢看到创新,创新对世界各地的人都有好处。看到其他公司也在创新是件好事,谷歌也和你们一样为创新感到高兴,这促使我们所有人做得更好,也对整个世界更好。”“所以对我来说,这是科技领域最棒的一周。”(下文将附上劈柴的完整回答)
在整场约45分钟的采访中,四位谷歌发言人回答了包括如何看待竞争与合作、谷歌业务发展、AI伦理与监管、AI教育与就业等一共19个问题。
从左到右依次为:谷歌全球传播副总裁Lily Lin(本场主持人)、Alphabet兼谷歌CEO桑达尔·皮查伊(Sundar Pichai)、谷歌搜索副总裁伊丽莎白·里德(Elizabeth Reid)、谷歌研究、技术和社会事务高级副总裁詹姆斯·马尼卡(James Manyika)、Deepmind首席技术官科拉伊·卡夫丘格鲁(Koray Kavukcuoglu)。其中,伊丽莎白·里德是最早构建谷歌核心产品Google Local(谷歌地图的前身)的工程师之一;詹姆斯·马尼卡曾在NASA喷气推进实验室的人机系统组工作,研究AI在火星探测器任务的应;科拉伊·卡夫丘格鲁主要掌管Gemini项目,他曾经是一名航空工程师,因为对数学的热爱,才转行到AI领域。
以下是采访全录(内容由科技行者听译编辑):
谈竞争与发展:创新是件好事
问:在I/O的前一天,OpenAI 推出了GPT-4o,很多媒体都把它描述为:OpenAI 与谷歌分庭抗礼。相信大家都好奇,你对此有何感想?另外你如何反击?
劈柴:从我的角度来看,当我想到正处于AI的拐点上时,我看到的是机会,所以如果把这个时间线拉长,那么某一天发生的某一件事就都无关紧要了。
因此,有一个正确的远见很重要,因为大家讨论的是这项人类有史以来最深奥的技术之一。
谷歌对AI的投资由来已久。我们正在开发最先进的模型,并努力将其应用到数十亿人的生活中,从而改变他们的生活。这就是谷歌的使命,过去十年、两年、去年,我们一直专注于此。
在某些微小的时刻,总会有这样或那样的事情发生。但就我个人而言,我喜欢看到创新,创新对世界各地的每个人都有好处。看到其他公司也在创新是件好事,谷歌也和你们一样为创新感到高兴,这促使我们所有人做得更好,也对整个世界更好。
所以对我来说,这是科技领域最棒的一周。
问:在忙完I/O之后,最让你期待的下一件事是什么?
劈柴:在回答之前,我想先回顾现状。从很久之前,谷歌就踏上了AI之旅,相信大家从今年的谷歌I/O也能看出来,谷歌正在把所有产品注入AI,让AI对每个人都有帮助。鉴于谷歌的产品规模效应,我们认为也能真正帮助大规模用户。
技术的进步是相当惊人的。我要谈的是三个趋势(昨天在I/O也已讲过)。
第一,Gemini天生就是多模态的。当你看到我们推出Project Astra项目时,这一点才真正开始浮出水面。这是谷歌的愿景,从头开始训练一个多模态模型,谷歌也是第一批这么做的公司之一。
第二,长上下文。100 万token是现阶段最长的上下文,但我们昨天宣布 200 万token预览版,我们正在挑战极限。而且,这些模型可以根据上下文进行调整,我认为这将具有开创性的意义。
第三,我们正在推动它们向AI Agent(AI智能体)发展。相信大家已经看到一些演示片段,无论是做复杂的查询,还是Gemini为你计划一次旅行,或是Chrome在后台帮你做一些事情,都是为了帮助你解决问题。
所以未来有无限可能。基于谷歌的技术积累,我们已经做好了充分准备,包括领先的基础设施、创新和搜索、以及我们的全球产品布局,我们所做的一切,都是为全世界的人们(提供价值)。
我对未来充满期待,谢谢。
问:我觉得在谷歌,大家经常谈论的是“搜索”,而不是“解决问题”。在这个AI时代,你怎么看待搜索?你觉得我们离“解决问题”更近了吗?
伊丽莎白·里德:我认为一点都不近,我们还有很长的路要走。大家常说,人类的好奇心是无限的,你可以从一个3岁小孩的“十万个为什么”中看到这点。真正受限的是获取信息的途径。
“你能用自然语言访问搜索吗?你能以你所理解的方式提问吗?”
我认为,Gemini时代和AI时代真正让人兴奋的是,它有能力解锁更多的问题,让我们更容易开展更多工作。当你试图获取信息和探索自己的好奇心时,让AI尽可能做更多的工作,你自己可以做更少的工作。
问詹姆斯·马尼卡:你职业生涯的大部分时间,都在思考科学、技术和经济的交叉学科问题,AI的一个领域现在可能还没有被每个人注意到,那就是科学发现。你认为AI会给科学带来什么样的变化?
詹姆斯·马尼卡:我们现在用航空科学做的事情,是令人惊叹的。谷歌在去年取得了很多进展,这里我讲讲过去三周发生的事。
三周前,谷歌发布了 MedGemini,这是一个基于Gemini模型,专为医疗保健行业量身定制,并根据健康数据进行微调的模型。这将对医疗领域产生巨大影响,它可以处理图像、DNA 序列和通用信息,为医生提供帮助。
一周前,AlphaFold 3发布,这个模型从最初只研究蛋白质结构,到现在能够预测蛋白质、DNA、RNA、小分子等的几乎所有生物分子结构和相互作用。想想这会对研究人员和科学家提供多大价值。
同期,谷歌开启了一项研究人类大脑如何思考的征程。谷歌与哈佛大学合作,展示了人类大脑目前最高清人脑局部图谱。尽管该图仅是人脑的一微小部分(整个大脑要大一百万倍),但其中已经包含了约57000个细胞、约230毫米长的血管和近1.5亿个神经突触,是目前有史以来分辨率最高的人脑图像。该图谱重点关注细胞之间的连接,这个领域被称为“连接组学(connectomics)”。
当然,上述也只是最近三周的动态。
如果再往前追溯,你就会发现,谷歌正在以一种真正让世界各地研究人员真正受益的方式,最大程度地推动科学发展。在,我们现在有全球 180 万生物学家,来自 119 个国家,在访问AlphaFold 系统。他们中的很多人所研究的,是被忽视的疾病,而这些疾病本来很难研究。
所以,AI+科学会创造出极大可能性。
问:就像劈柴昨天说的,我们现在正处于Gemini时代。当你终于能够将自己的劳动成果带给全世界的用户和开发者时,最让你兴奋的是什么?
科拉伊·卡夫丘格鲁:Gemini的整个组合都相当令人兴奋。作为谷歌的研究人员,我们在这方面已经研究了很长时间。
当你回顾AI的历史,看它是如何建立起来的,很多创新实际上是今天实现的根本创新。在谷歌和不同的团队中,Gemini的能力其实已经发挥作用了。
谷歌正处于这样一个阶段,所有谷歌的团队、产品和项目,其实都是在内化Gemini,我们正在重新思考如何做事,重新思考如何解决问题,我认为这真的很鼓舞人心,因为当我们为未来的道路做准备时,当我们在开发智能时,与用户合作是非常重要的。
对我们来说很重要的是,能够从用户那里得到反馈,然后找出需要解决的正确问题,并指导我们的研究。
谈AI伦理:持谨慎乐观立场
问:昨天在I/O之后,我在文章里写,AI将越来越成为有用的生活助手,但《纽约时报》最近也写道,AI的《她》时代已来,你相信未来会有人真的爱上AI吗?你在职业生涯中何时对AI产生了热爱?
劈柴:首先申明,我爱我的妻子。(说完台下笑声一片)
我在印度长大,互联网和谷歌吸引我的部分原因是,意识到那是技术民主化的过程。互联网可以触及每一个人,而这在很大程度上是通过人来实现的。要知道,我们已经从最初的5亿人使用计算机发展到现在的40多亿人,只要你有电脑和网络连接,你的指尖就能触及世界任何地方的知识。
我认为AI具有同样的潜力。
要知道,今天很少有人能请得起家教、保安、私人医生,在这些事情上确实存在不平等,而AI为大多数人提供这些能力的机会,影响是非常深远的。
至于我是什么时候爱上AI的?也许是当我看到神经网络识别猫图像的那一刻,那是我脑中第一次出现 “啊哈”的瞬间,我在想,AI发挥作用了。
再回答前面的问题,未来是否有人会真正爱上AI?每项技术都有两面性,积极的一面是,有人用AI来保存对亲人的记忆,有人用它来突破语言障碍。的确,随着技术的进步,人们会与这些智能助手、AI智能体等,建立深厚的关系。
但同时,我们也应该为所有可能性做好准备。这就是为什么谷歌希望以大胆而负责任的方式开发AI。我们希望取得技术成果,但在此过程中,要考虑清楚会有哪些保护措施来避免一些不利因素。
一个很好的例子是谷歌的水印工具Synt ID,我们把它引入到文本和视频中。所以这些工作都是相辅相成的。
问:有一个问题是关于AI深度伪造和合成内容,它可能会影响民众的投票决策。
劈柴:谷歌已将投票“信息真实”作为公司的最高优先事项之一,特别是在我们的搜索和YouTube等产品中,以及在我们部署AI时。我们之所以要开发 Synt ID 或AI辅助红队测试(名为AI-assisted red teaming,该技术利用DeepMind在AlphaGo等游戏方面的突破以改进谷歌的模型),部分原因就是要走在这些问题的前面。
我们还通过Jigsaw(谷歌母公司Alphabet旗下专注于网络安全的部门) 开展大量研究,了解世界上的模式,在必要时我们会与相关部门等共享信息。起码在目前,在我们所处的环境中,现在还很容易判断什么是真实的、什么是虚假的。
话虽如此,考虑到技术进步的速度,我们依然会担心AI深度伪造等问题。结合我们正在开展的工作,我持谨慎乐观的立场。我们将尽我们所能,处理好这一切。
我认为未来的赌注会越来越大(情况会更复杂),但就今年而言,我对现状持谨慎乐观立场。
问:许多国家正试图对生成式AI实施严格的监管。那么,你如何看待当前形势,以及如何应对安全和数据隐私方面的监管?
劈柴:对于管理部门来说,在它们考虑到AI对社会的影响时,监管对于安全和数据隐私发挥了重要作用。但同时,取得平衡也很重要。
AI将带来大量机遇,经济机遇将全面影响产业,所以让AI创新在各国实现也很重要,否则就有可能被甩在后面。
总结来说,如何在促进创新和拥抱创新的同时减少危害,是各国正在努力寻求的平衡点。随着时间推移,我们将需要更多的全球框架。我知道现在还为时尚早,但我们已经看到了令人鼓舞的进展。
选择拥抱AI创新,对世界会更好,互联网之所以能成为今天的重要力量,部分原因就在于它是一种全球性的技术,我们愿意践行共同的标准和合作,希望AI时代也能如此。
问:印度一直是个消费型经济体,尤其是在技术方面。但在过去的十年中,随着支付和其他行业在AI方面的发展,情况发生了变化。你是否希望印度也能扮演创新型经济体的角色?
劈柴:对于印度和其他新兴国家而言,技术变革始终是一次追赶或飞跃的机会。没错,印度是一个很好的例子,它永远不会在某些事情跨越发达国家,比如个人电脑的普及。
但与上一代人相比,印度有更多的人可以使用移动电话。人们或许没有固定电话,但大多数人都有手机。因此,我认为随着每一次技术的转变,都有更好的机会来推动这种普及。
AI也一样。谷歌有很多AI工具,就我们的用户群而言,印度是排名第一的国家。所以为了能够为他们服务,我们致力于提供同样的AI工具。在谷歌的AI平台上,我们已经看到了大量来自印度的开发者活动。
所以,我认为印度将在AI变革中占据有利位置。
谈就业:AI与人类是“有效合作”
问:看到谷歌的发展时,我想问下就业问题。鉴于AI已经是几乎所有公司的起点,谷歌或其他大型科技公司,现在需要什么样的专业人才?因为比如说在拉丁美洲,我还没有看到大学设立AI相关的课程。
詹姆斯·马尼卡:首先,包括公司的程序员在内,都发现AI系统为他们的工作,提供了难以置信的帮助。
举例来说,在谷歌,很多员工都会“结对儿编程”,也就是他们并肩坐在一起工作。越来越多人发现,AI实际上是一种“有效合作”,所以AI系统有能力帮助人们,尤其是拥有最少技能的员工。现在有一项让人难以置信的研究表明,如果技能较低的人使用这些AI工具,他们会做的更好。
所以我们花了很多时间思考,如何既让我们团队、又让更多人培养AI技能,最近我们搞了一个叫做“与谷歌一起成长(growth google)” 的项目,教大家学习AI技能。我们还推出了“AI Essentials(人工智能必需品)”的项目,正是为了帮助职场人、学生使用这些AI技能。我们已经与大学合作,也许我们需要找机会与哥伦比亚的大学和其他机构开展合作。
STEM技能仍然很重要。了解STEM与其他学科的交叉也很重要。所以我们的团队成员既有计算机科学家,也有社会科学家,但其实能把这些学科联系起来的人,才是最有趣的人才,我们需要更多这样的人才。
问:我来自哥伦比亚,是一名技术内容创作者,这是我第一次来I/O,很高兴见到大家。我想知道一个年轻的拉美男孩,他热爱技术,想做你所做的,走你所走的路。你对他的建议是什么?
劈柴:我很乐意分享,因为我就是那样的男孩,我会记下来的是詹姆斯·惠特尼给我的职业建议。
我对这个男孩的建议是,要有远大的梦想,要专注于你的好奇心。现在比较好的是,对于很多像那个孩子来说,学习的途径其实有很多。
我看到巴西萨尔瓦多的孩子们,经常会冒出一些不可思议的想法。还有其他很多地区的孩子们,他们有很好的想法,但没有人真正教他们编程,没有人教他们科学。但好在,当他们使用AI工具时,AI可以让他们起草这些想法,勾勒出这些文化的想法。
当我看到AI系统开始处理更多的语言,让信息更容易获取时,我认为AI实际正在帮助消除一些准入障碍。
所以,我会告诉那个孩子,访问这些系统,让我们帮助他用自己的语言进入这些系统,我们很乐意为此提供帮助,助力他实现自己的梦想。
问:你是否认为关于AI的问题,很多答案都是用哲学而不仅仅是技术和工程学来解决的?
劈柴:我始终认为,随着AI取得更大的进步,我们必须将更多的视角引入该领域。
所以,AI是需要社会科学家、哲学家等人参与进来的领域,谷歌一直都是这样做的,尤其是考虑到“负责任的AI”这件事情时。
而且,这是谷歌团队在开发AI早期时,就开始思考的问题。当你看谷歌做的第一篇大语言模型论文时,我们就分析了其中的AI伦理问题。事实上,我们是与哲学家和伦理学家合作,因为理解“AI如何影响社会”对我们来说相当重要。这样,我们就能了解哪些是要解决的正确问题,哪些是要在这些领域引入的正确解决方案。
谈谷歌:我脑中有一个10年路线图
问:有些人认为,我们所熟知的互联网正在消亡,正在因为AI的防御、流程自动化程度的提高、机器人的发展等。你认为生成式AI将如何影响今天的互联网?它会完全改变我们今天的认知吗?
伊丽莎白·里德:这是我们在搜索业务中经常思考的问题。我们将AI Overviews(AI概述)设计成一个起点,让用户可以从这个起点开始,深入挖掘。
我们确实专注于优先考虑发送有价值流量的方法。对我们来说,保持网络的健康发展非常重要,这不仅是生态系统的重要性,也是产品的重要性。这也是我们倾听用户需求得出的,用户希望听到他人的生活经验、观点、某领域的专业知识。
所以,我们希望帮人们更有效地连接到网络。AI有很多机会可以更深入地进入网络,在你有专业知识的地方连接到更多的好奇者。
以前,人们搜索简单的问题,所以搜索结果的靠前位置,都是泛泛而谈的网站。但现在,当人们开始问新的问题时,问更丰富的问题时,实际上能够将他们与真正让他们产生共鸣的人联系起来。
我们还看到,AI Overviews(AI概述)让人们搜索更多,它带来了新的问题类型,带来了更多的问题,这些都是人们在网络上的额外机会。
问:越来越多的年轻人用 TikTok 和社交媒体,这也是谷歌会关注的领域吗,谷歌打算如何应对当前和未来的挑战?
伊丽莎白·里德:谷歌的研究发现,年轻用户对于直接听取他人意见非常感兴趣,想要听听他人的经验、观点等,他们不想只是将这些问题交给几个权威机构或网上一个不知名的声音。
所以在过去几年里,我们一直在投资“如何让人们更容易找到这些体验”,让人们更容易找到讨论论坛,为那些正在搜索短视频的人整合短视频。我们做了很多事情,也会持续做下去。
这种不断询问用户需求很重要,我们寻找它、观察它、然后针对它们进行创新,我们会持续这样做下去。
问:很多人担心AI Overviews(AI概述)会对广告业产生影响,你们对此怎么看?
伊丽莎白·里德:这个问题,或许是未来两年内会出现的真实担忧。但从商业模式来看,谷歌一直以来处理搜索广告的方式是,考虑广告何时对用户有帮助。有鉴于此,我们在广告对用户有帮助时才会展示广告,我们发现,即使我们引入了AI Overviews(AI概述),用户仍会继续与广告互动。
我们还发现,当人们在使用AI概述时,会更多地使用搜索。因为人们带着新的应用案例来搜索,他们发现以前认为在谷歌上不可能解决的问题,现在却可以解决了。
每次谷歌在搜索领域启用新的应用案例时,广告团队都会发现新的盈利机会。当用户看到有帮助的广告时,这是广告触及用户的新方式。所以,期待广告团队与我们一起继续创新。
问:顺着这个问题,从商业角度看,谷歌认为“AI概述”将如何改变搜索产业?首先申明,我个人作为用户很喜欢这些功能,但如果用户不再点击网站,或者像这次谷歌演示的那样,只是让Gemini告诉他们,某支视频具体讲了什么,根本不用点开这些视频,那么未来网站或内容创作者又如何从工作中赚钱呢?
劈柴:这是我们非常关心的问题。谷歌比任何其他公司都更想说的是,我们经常思考,以及团队在过去一年中所做的是,投入了大量时间和精力来优先考虑创造价值、交换回报和创造流量的方法。YouTube也是一样。
人们短期内往往会低估某项技术,当智能手机出现时,人们也问过同样的问题,如果屏幕很小,就看不到那么多内容,我们早在2014年就给出了答案,我们从回答问题开始。
我记得有人说,如果你是在回答问题,为什么会创造流量,我想我们已经证明,随着时间的推移,你已经增加了流量。我认为这远不是一个零和游戏。
顺便说一句,我们一直在改善用户体验,因为这很重要。
伊丽莎白·里德:我补充一点。人们有时候会提出固定数量的问题,但通常情况是,人们带着一个问题来搜索,然后他们被答案所吸引,然后他们就会深入挖掘。
实际上我们发现,那些出现在“AI概述”中的网站,它们比传统的蓝色链接获得了更多的流量,所以AI概述突然提供了额外的价值,而且这个价值在不断增长。
问:谷歌的Android、Pixel 和 Gemini Nano,可以说,谷歌在移动智能领域完全处于领先地位。那么,你认为谷歌要保持这一地位,还需要做哪些努力或投资?
劈柴:在安卓系统上,我对操作系统的发展感到非常兴奋,这是一条不可思议的科技曲线,而且每年谷歌都会在移动设备上装载更多技术。今天的 Gemini Flash 是什么?是否会在未来的某个时刻出现在 Gemini Nano 中?所以,那条技术曲线总是成立的。
给设备带来这么多智能能力,确实会对很多能力产生影响。你会发现它有一些很棒的功能,比如可以检测这是否是欺诈。你可以要求它们帮你接电话,在任何时候都能帮你处理电话上的事情。
在我脑中,有一个10年路线图,上面有我希望团队建立的所有东西。
问:在Project Astra的第二段演示中,用户戴着智能眼镜,我想知道谷歌如今对这类设备的重视程度?因为随着生成式AI的发展,它可能是有意义的。
劈柴:Project Astra是手机中的一项强大技术,但在眼镜这样的外形设计中,它才真正栩栩如生。
谷歌一直致力于走在计算技术的最前沿,我们正在投资AR 眼镜生态系统,相信在未来,会有一些有趣的产品值得讨论。
问:谷歌在AI领域取得了显著进展,你认为谷歌在AI方面还有哪些不足?在未来12个月内,哪些方面需要改进?
科拉伊·卡夫丘格鲁:正如劈柴所说,我们的任务是开发智能,所以还有很多紧迫的问题要解决。
在AI漫长的历史中,问题和各种能力已经被考虑了很多,比如最重要的事情之一‘推理’。但就像我们讨论人类如何推理复杂问题一样,我们该如何生成推理。
生成式AI模型,来到了一个非常激动人心的阶段。在这个阶段,模型实际上可以创造新想法、新假设、并由此进行研究,尤其是能够通过这些进行推理。
在这方面,AI Agent(AI智能体)非常重要,因为我们希望人们能够与这些模型互动,让人们自主决定想让技术为他们做什么。
AI智能体为用户完成任务,需要对环境有所了解,需要了解用户的所见所闻,这方面相信你已经从谷歌的Project Astra中窥见一斑。就像你自己的“眼睛”看到和“耳朵”听到的一样,AI智能体可以帮助你了解环境,并与环境互动。我认为这是我们本周最令人兴奋的话题。
劈柴:也许我们已经推动了现代AI技术的大部分突破。从我们的出发点来看,我们的Gemini 1.0也是原生多模态的模型,它最终会成为大多数模型的终极形态。
我们正在推动的方向也是其他人正在做的,所以我由衷地感到,大家都走在技术的最前沿。
谷歌在 2016 年设计了张量处理单元,你会发现几乎所有其他大公司都在试图复制这种做法。所以当我审视我们所处的位置时,我所看到的一切都告诉我,我们正处于前沿,并在努力向前推进。
后记
约三周前,谷歌母公司Alphabet兼谷歌CEO桑达尔·劈柴(Sundar Pichai)在个人Instagram上庆祝自己的“Googleversary”,今年是他在谷歌工作的第20年。
他写道:“2004年4月26日是我在谷歌的第一天。从那以后发生了很多变化——科技、使用谷歌产品的人数……以及我的头发。但没有改变的是,在这家了不起的公司工作带给我的兴奋。20年过去了,我仍然觉得很幸运。”
海量资讯、精准解读,尽在新浪财经APP责任编辑:江钰涵