谷歌大战OpenAI，推付费Gemini AI模型和独立App

文章正文

发布时间：2024-02-11 21:17

▎Bard和Duet AI一夜之间消失，Gemini将成为未来谷歌推向世界的唯一AI技术品牌。

刚刚，谷歌的开年“王炸”正式登场！

钛媒体App获悉，北京时间2月8日21点，正值GoogleBard推出一周年之际，科技巨头谷歌（Google）正式宣布一系列在AI领域的最新进展：

1）谷歌把对标ChatGPT的AI聊天机器人平台Google Bard，更名为Gemini。

2）Gemini发布安卓版本的独立App（目前似乎仅支持Pixel），并将在Google iOS和安卓版本中内嵌Gemini对话功能。其中，在安卓独立App上，用户可以选择使用Gemini替代原来的Google Assistant，成为手机的默认语言助手。

3）历经60天等待，谷歌正式向公众发布史上性能和功能最强大的Gemini Ultra 1.0模型，并推出基于此模型的付费Gemini Advanced产品，用户需每月支付20美元，选择Google One AI Premium（高级）版本。

4）谷歌大模型能力将接入Google Workspace（包括 Gmail、Docs、Meet 等应用）和 Google Cloud中。此前两款产品内置的 Duet AI产品都纳入Gemini品牌，并重新命名，如Gemini for Workspace等。

很显然，在经历ChatGPT一年多的爆火之后，谷歌不仅要“奋起直追”，而且不断统一资源，让Gemini成为行业“头雁”。

如今，Bard和Duet一夜之间都“消失”了，Gemini或将成为未来谷歌推向世界的唯一AI模型和产品系列。

“我认为这是构建真正AI助手的非常重要的一步。”Google Bard（现为 Gemini）负责人 Sissie Hsiao表示。

谷歌和Alphabet 公司CEO桑达尔·皮查伊 (Sundar Pichai) 对《连线》杂志表示，全新、功能更强大的谷歌Gemini聊天机器人是一项创新“实验”，利用AI重塑其核心搜索产品并形成生成式AI搜索体验，旨在为用户提供一种无需搜索引擎即可查找信息并完成工作的方法。

《连线》直言：谷歌正在对不再成为“搜索引擎王者”的未来做好准备。

从追赶到比拼，谷歌大战OpenAI

时代变了。

过去14个月，伴随ChatGPT风靡全球，全球开启新一轮AI热潮。而深耕 AI多年的谷歌，却遭到OpenAI“偷家”了。

2023年2月8日，谷歌紧急推出基于LaMDA对话语言模型的AI聊天机器人产品Bard。

在此之前，谷歌内部发起“红色代码警报”（Code red），创始人拉里·佩奇和退隐多年的谢尔盖·布林重回公司，并斥资接近4亿美元投资 OpenAI的对手Anthropic，以对抗微软和OpenAI的“强强联合”。

然而，为应对ChatGPT，谷歌Bard研发时间很短，仅数月而已。所以，Bard发布之后，用户晒出多个错误性回答，被市场广受诟病，最终导致谷歌股价大跌。

2023年5月12日，经过不断技术迭代和优化之后，谷歌乘胜追击，推出比Bard更强大的PaLM 2模型，重点改进模型的多语言翻译、数学、程序语言、推理和自然语言生成能力。同时，Bard也正式面向全球180个国家地区开放使用，并扩展至40种语言，对话能力已有明显提升。

去年12月，经历半年多的不断模型训练和产品迭代，谷歌正式推出迄今为止功能最强大、最通用的多模态通用大模型：Gemini（中文称“双子座”），共包括三个不同尺寸版本：Ultra（超大杯）、Pro（大杯）和Nano（中杯），将全面内置最新、最强大的自研AI超算芯片Cloud TPU v5p。

谷歌表示，在六项基准测试中，Gemini Pro性能表现优于GPT-3.5；而在30项性能基准测试中，Gemini Ultra超越了目前最强模型GPT-4，甚至Ultra在MMLU测试上得分高达90.0%。

简单来说，在数学、物理、法律等57个领域测试中，Gemini Ultra成为全球第一个超越人类专家水平的AI模型。

如此强大的AI技术，谷歌必然要持续推进，不仅统一了AI人才和算力资源，而且全力投资Gemini，并在今年1月的全球一项大模型基准测试中超越GPT-4。

今天，谷歌再度公布多项关于Gemini大模型的最新进展。

皮查伊指出，AI现在是谷歌发展迅速的两大业务——谷歌云和Workspace，Google One的核心。

其中，Google One的付费订阅用户即将突破1亿人。

在皮查伊看来，Gemini的演变不仅仅是模型，而是要支持整个谷歌AI生态系统——从数十亿人每天使用的产品，到帮助开发者和企业创新的 API 和平台。包括文本、图像、音频和视频中都将采用最强大的Gemini模型。

具体到产品中，首先，Bard将更名为Gemini，网站也从bard.google.com，转到Gemini.google.com，网页版支持40种语言，并将在 Android 和 iOS 的“Google”应用App上推出新的Gemini对话功能。

另外，在Pixel 8系列安卓设备中，谷歌上线了Gemini独立 App，并可以通过语音等方式实现搜索与对话。

据悉，即日起，Gemini在美国的Android（安卓）和 iOS 设备上推出英语版本，并将在未来几周内全面推送给所有用户。从下周开始，用户将以英语、日语和韩语访问它，并且即将推出更多国家/地区和语言。

与此同时，大多数用户仍将使用Gemini模型的标准版本，称为Gemini Pro。如果使用该模型最强大的版本 Gemini Ultra，用户必须注册Gemini Advanced付费订阅，每月20美元，是全新Google One AI Premium会员计划的一部分，此外还有2TB 的 Google Drive 存储空间、Google One订阅的所有功能、谷歌AI产品的优先权等。

新的Gemini Ultra，在推理、遵循指令、编码和创造协作方面的能力更强，直接对标GPT-4。不仅如此，Gemini Ultra在订阅的前两个月可免费使用。

全新Google One付费计划（图片来源：谷歌官网，图片中的中文信息来自AI翻译，仅供参考）

比较有趣的是，Gemini Advanced版本的价格与ChatGPT Plus等产品相同。The Verge评价称，这似乎会让更多用户接受它，因此20美元是美国AI付费产品的普遍性价格。

另外，谷歌还将Gemini引入到Workspace、Google Cloud等更多谷歌产品中。其中，Workspace方面，内置的Duet AI即将变成 Gemini for Workspace，同时，AI Premium会员用户也将在Gmail、Docs、Sheets、Slides等产品中使用Gemini功能；Google Cloud方面，Duet AI也将在未来几周变成 Gemini，而且Gemini也将帮助企业提高生产力，帮助开发者更快地编码等。

皮查伊表示，Gemini的多模态技术，是与ChatGPT、微软Copilot AI的重要区别元素之一。这意味着，Gemini接受了多种格式的数据训练，不仅是文本，还包括图像、音频和代码。

据谷歌公布的一组数据，在谷歌搜索中内置Gemini模型，能够为用户提供更快的搜索生成体验（SGE），而且在美国的英语搜索结果延迟降低40%，同时在搜索结果质量方面也有所提高。

但皮查伊也坦言，虽然AI对人类的变革将比火、电力的诞生意义更大，但Gemini 1.0可能不会改变世界，而最好的情况是，Gemini可能会帮助谷歌在生成式AI军备竞赛中赶上OpenAI。

“从某种意义上说，随着搜索的发展、移动设备的出现和用户交互的变化，Gemini将成为用户未来在生成式AI搜索领域的领先技术，”皮查伊认为，谷歌希望对未来保持灵活性，否则将就会出现战略性失误（出错）。

谷歌方面透露，下周该公司会针对为开发者和Cloud客户推出更多产品信息，而且谷歌已经开始训练下一代Gemini模型。

谷歌在AI大战中找到感觉了？

作为Transformer架构的提出者，谷歌在AI领域持续投入长达数十年。但在2023年，AI领域的最大风头却更多被微软和OpenAI“抢走”。

ChatGPT正式发布至今，周活跃用户数超过1亿人；目前有超过200万开发者和客户在该公司的API上进行开发；世界财富500强公司中，有92%的企业在使用其产品。

这一系列惊艳表现，引发全球AI新热潮。

谷歌、微软、苹果、亚马逊、阿里、腾讯、百度等中美科技巨头纷纷重金投入AI大模型赛道当中，如今已形成了“百模大战”这样一个新的AI市场格局。

以苹果公司为例。

据调研机构Stocklytics公布的最新报告显示，2023年，苹果共收购了32家AI初创公司，在美国科技巨头收购相关公司数量上位居榜首。同时，自2017年以来，苹果在AI技术领域的股权和附加投资方面约占全球投资总额的 21%，位列榜首，微软、Alphabet则排名第二、三位，份额分别为12%和8%。

彭博社指出，苹果即将推出一个名为“AppleGPT”聊天机器人产品，目前已在内部测试，有望在今年将AI技术应用于苹果产品当中。

相对于微软的强势捆绑，在过去一年多的技术迭代和应用落地下，“自主可控”的谷歌似乎也已经在这场AI大战中找到感觉了。

今年1月31日，谷歌母公司Alphabet（NASDAQ：GOOGL）公布了2023年第四季度财报。

财报显示，四季度，公司实现营收863亿美元，同比增长13%；净利润同比增长51.84%，至206.87亿美元。其中，在AI技术驱动下，谷歌云业务收入同比增长25%。

尽管AI促进了谷歌云业务，但由于大模型训练需要大量的算力、数据和资本投入，却导致谷歌资本支出大幅增加，去年第四季度，谷歌资本支出同比增加45%至110亿美元，超过了2022年同期，因此，市场对于AI未来是否“盈利”，依然产生怀疑。

The Information的Martin Peers分析认为，目前大幅投入AI的科技公司，最后都需要证明自己的投入是否能够得到经济回报。而谷歌的母公司Alphabet，没有表现出与微软这种大规模AI业务收入。

“不过Alphabet和微软一样，有收益的潜力。”Martin Peers称。

当前，中国、美国两个国家正全面发力AI大模型技术和应用。

2月8日，美国政府宣布，OpenAI、微软、Meta、谷歌、苹果、亚马逊、英伟达等200多家公司正加入美国商务部成立的新的AI安全研究联盟当中；而中国市场，截至2023年10月，中国公开的AI大模型数量已达238个，与美国AI大模型产业分庭抗礼，同时从政府到产、学、研，中国都全面支持AI技术和产业的快速发展。

IDC数据显示，2023年，中国AI市场支出规模将增至147.5亿美元，预计2026年实现264.4亿美元支出，年复合增长率（CAGR）将超过20%；据艾瑞咨询报告，预计到2027年，AI产业规模将达到 6122 亿元。

面壁智能联合创始人、CEO李大海近日对钛媒体App表示，随着时间推移，AI大模型应用可能会“百花齐放”，然而通用基座（千亿）大模型不会太多，可能只有极少数的几家公司最终能“突出重围”。

“未来逐步有些公司会更多往‘应用层’去发展，关于基座模型，相关类型大模型公司不会太多，虽然不会只有一家，但具体是几家我们也不清楚，这个是很难预测的一件事情。”李大海对钛媒体App表示。

皮查伊公开表示，谷歌目前重点是提供正确的生成式AI体验。可以想象同一个用户在免费搜索和Gemini 订阅之间来回切换。换句话说，AI 搜索将不再是“配菜”，而是“主菜单项”——尽管价格更昂贵。

但皮查伊也承认，谷歌Gemini Pro、Ultra依然有产生“幻觉”的风险，而谷歌团队正努力减少模型失控的现象。他坦言，“幻觉”这个词应该谨慎使用，并认为幻觉既是一个特征、也是一个对错误信息的“令人着迷的重塑”。他认为，AI技术应该以事实为基础，但如果把它调整太多，Chat聊天将就会变得非常无聊。

美国咨询公司Stifel分析师表示，Alphabet产生了“健康的广告效果，但还不够”。鉴于谷歌的规模和主导地位，市场对谷歌的期望太高。

皮查伊强调，生成式AI体验应该是“富有想象力的”，目前有点类似于互联网早期时代的“探索”。

那么，随着2024年成为大模型应用年，未来谷歌能否占领生成式AI业务高地，在这场AI军备竞赛中胜出，一切仍有待时间给出答案。