谷歌大战OpenAI,推付费Gemini AI模型和独立App

文章正文
发布时间:2024-02-11 21:17

Bard和Duet AI一夜之间消失,Gemini将成为未来谷歌推向世界的唯一AI技术品牌。

刚刚,谷歌的开年“王炸”正式登场!

钛媒体App获悉,北京时间2月8日21点,正值GoogleBard推出一周年之际,科技巨头谷歌(Google)正式宣布一系列在AI领域的最新进展:

1)谷歌把对标ChatGPT的AI聊天机器人平台Google Bard,更名为Gemini。

2)Gemini发布安卓版本的独立App(目前似乎仅支持Pixel),并将在Google iOS和安卓版本中内嵌Gemini对话功能。其中,在安卓独立App上,用户可以选择使用Gemini替代原来的Google Assistant,成为手机的默认语言助手。

3)历经60天等待,谷歌正式向公众发布史上性能和功能最强大的Gemini Ultra 1.0模型,并推出基于此模型的付费Gemini Advanced产品,用户需每月支付20美元,选择Google One AI Premium(高级)版本。

4)谷歌大模型能力将接入Google Workspace(包括 Gmail、Docs、Meet 等应用)和 Google Cloud中。此前两款产品内置的 Duet AI产品都纳入Gemini品牌,并重新命名,如Gemini for Workspace等。

很显然,在经历ChatGPT一年多的爆火之后,谷歌不仅要“奋起直追”,而且不断统一资源,让Gemini成为行业“头雁”。

如今,Bard和Duet一夜之间都“消失”了,Gemini或将成为未来谷歌推向世界的唯一AI模型和产品系列。

“我认为这是构建真正AI助手的非常重要的一步。”Google Bard(现为 Gemini)负责人 Sissie Hsiao表示。

谷歌和Alphabet 公司CEO桑达尔·皮查伊 (Sundar Pichai) 对《连线》杂志表示,全新、功能更强大的谷歌Gemini聊天机器人是一项创新“实验”,利用AI重塑其核心搜索产品并形成生成式AI搜索体验,旨在为用户提供一种无需搜索引擎即可查找信息并完成工作的方法。

《连线》直言:谷歌正在对不再成为“搜索引擎王者”的未来做好准备。

从追赶到比拼,谷歌大战OpenAI

时代变了。

过去14个月,伴随ChatGPT风靡全球,全球开启新一轮AI热潮。而深耕 AI多年的谷歌,却遭到OpenAI“偷家”了。

2023年2月8日,谷歌紧急推出基于LaMDA对话语言模型的AI聊天机器人产品Bard。

在此之前,谷歌内部发起“红色代码警报”(Code red),创始人拉里·佩奇和退隐多年的谢尔盖·布林重回公司,并斥资接近4亿美元投资 OpenAI的对手Anthropic,以对抗微软和OpenAI的“强强联合”。

然而,为应对ChatGPT,谷歌Bard研发时间很短,仅数月而已。所以,Bard发布之后,用户晒出多个错误性回答,被市场广受诟病,最终导致谷歌股价大跌。

2023年5月12日,经过不断技术迭代和优化之后,谷歌乘胜追击,推出比Bard更强大的PaLM 2模型,重点改进模型的多语言翻译、数学、程序语言、推理和自然语言生成能力。同时,Bard也正式面向全球180个国家地区开放使用,并扩展至40种语言,对话能力已有明显提升。

去年12月,经历半年多的不断模型训练和产品迭代,谷歌正式推出迄今为止功能最强大、最通用的多模态通用大模型:Gemini(中文称“双子座”),共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将全面内置最新、最强大的自研AI超算芯片Cloud TPU v5p。

谷歌表示,在六项基准测试中,Gemini Pro性能表现优于GPT-3.5;而在30项性能基准测试中,Gemini Ultra超越了目前最强模型GPT-4,甚至Ultra在MMLU测试上得分高达90.0%。

简单来说,在数学、物理、法律等57个领域测试中,Gemini Ultra成为全球第一个超越人类专家水平的AI模型。

如此强大的AI技术,谷歌必然要持续推进,不仅统一了AI人才和算力资源,而且全力投资Gemini,并在今年1月的全球一项大模型基准测试中超越GPT-4。

今天,谷歌再度公布多项关于Gemini大模型的最新进展。

皮查伊指出,AI现在是谷歌发展迅速的两大业务——谷歌云和Workspace,Google One的核心。

其中,Google One的付费订阅用户即将突破1亿人。

在皮查伊看来,Gemini的演变不仅仅是模型,而是要支持整个谷歌AI生态系统——从数十亿人每天使用的产品,到帮助开发者和企业创新的 API 和平台。包括文本、图像、音频和视频中都将采用最强大的Gemini模型。

具体到产品中,首先,Bard将更名为Gemini,网站也从bard.google.com,转到Gemini.google.com,网页版支持40种语言,并将在 Android 和 iOS 的“Google”应用App上推出新的Gemini对话功能。

另外,在Pixel 8系列安卓设备中,谷歌上线了Gemini独立 App,并可以通过语音等方式实现搜索与对话。

据悉,即日起,Gemini在美国的Android(安卓)和 iOS 设备上推出英语版本,并将在未来几周内全面推送给所有用户。从下周开始,用户将以英语、日语和韩语访问它,并且即将推出更多国家/地区和语言。

与此同时,大多数用户仍将使用Gemini模型的标准版本,称为Gemini Pro。如果使用该模型最强大的版本 Gemini Ultra,用户必须注册Gemini Advanced付费订阅,每月20美元,是全新Google One AI Premium会员计划的一部分,此外还有2TB 的 Google Drive 存储空间、Google One订阅的所有功能、谷歌AI产品的优先权等。

新的Gemini Ultra,在推理、遵循指令、编码和创造协作方面的能力更强,直接对标GPT-4。不仅如此,Gemini Ultra在订阅的前两个月可免费使用。

图片

全新Google One付费计划(图片来源:谷歌官网,图片中的中文信息来自AI翻译,仅供参考)

比较有趣的是,Gemini Advanced版本的价格与ChatGPT Plus等产品相同。The Verge评价称,这似乎会让更多用户接受它,因此20美元是美国AI付费产品的普遍性价格。

另外,谷歌还将Gemini引入到Workspace、Google Cloud等更多谷歌产品中。其中,Workspace方面,内置的Duet AI即将变成 Gemini for Workspace,同时,AI Premium会员用户也将在Gmail、Docs、Sheets、Slides等产品中使用Gemini功能;Google Cloud方面,Duet AI也将在未来几周变成 Gemini,而且Gemini也将帮助企业提高生产力,帮助开发者更快地编码等。

皮查伊表示,Gemini的多模态技术,是与ChatGPT、微软Copilot AI的重要区别元素之一。这意味着,Gemini接受了多种格式的数据训练,不仅是文本,还包括图像、音频和代码。

据谷歌公布的一组数据,在谷歌搜索中内置Gemini模型,能够为用户提供更快的搜索生成体验(SGE),而且在美国的英语搜索结果延迟降低40%,同时在搜索结果质量方面也有所提高。

但皮查伊也坦言,虽然AI对人类的变革将比火、电力的诞生意义更大,但Gemini 1.0可能不会改变世界,而最好的情况是,Gemini可能会帮助谷歌在生成式AI军备竞赛中赶上OpenAI。

“从某种意义上说,随着搜索的发展、移动设备的出现和用户交互的变化,Gemini将成为用户未来在生成式AI搜索领域的领先技术,”皮查伊认为,谷歌希望对未来保持灵活性,否则将就会出现战略性失误(出错)。

谷歌方面透露,下周该公司会针对为开发者和Cloud客户推出更多产品信息,而且谷歌已经开始训练下一代Gemini模型。

谷歌在AI大战中找到感觉了?

作为Transformer架构的提出者,谷歌在AI领域持续投入长达数十年。但在2023年,AI领域的最大风头却更多被微软和OpenAI“抢走”。

ChatGPT正式发布至今,周活跃用户数超过1亿人;目前有超过200万开发者和客户在该公司的API上进行开发;世界财富500强公司中,有92%的企业在使用其产品。

这一系列惊艳表现,引发全球AI新热潮。

谷歌、微软、苹果、亚马逊、阿里、腾讯、百度等中美科技巨头纷纷重金投入AI大模型赛道当中,如今已形成了“百模大战”这样一个新的AI市场格局。

以苹果公司为例。

据调研机构Stocklytics公布的最新报告显示,2023年,苹果共收购了32家AI初创公司,在美国科技巨头收购相关公司数量上位居榜首。同时,自2017年以来,苹果在AI技术领域的股权和附加投资方面约占全球投资总额的 21%,位列榜首,微软、Alphabet则排名第二、三位,份额分别为12%和8%。

彭博社指出,苹果即将推出一个名为“AppleGPT”聊天机器人产品,目前已在内部测试,有望在今年将AI技术应用于苹果产品当中。

图片

相对于微软的强势捆绑,在过去一年多的技术迭代和应用落地下,“自主可控”的谷歌似乎也已经在这场AI大战中找到感觉了。

今年1月31日,谷歌母公司Alphabet(NASDAQ:GOOGL)公布了2023年第四季度财报。

财报显示,四季度,公司实现营收863亿美元,同比增长13%;净利润同比增长51.84%,至206.87亿美元。其中,在AI技术驱动下,谷歌云业务收入同比增长25%。

尽管AI促进了谷歌云业务,但由于大模型训练需要大量的算力、数据和资本投入,却导致谷歌资本支出大幅增加,去年第四季度,谷歌资本支出同比增加45%至110亿美元,超过了2022年同期,因此,市场对于AI未来是否“盈利”,依然产生怀疑。

The Information的Martin Peers分析认为,目前大幅投入AI的科技公司,最后都需要证明自己的投入是否能够得到经济回报。而谷歌的母公司Alphabet,没有表现出与微软这种大规模AI业务收入。

“不过Alphabet和微软一样,有收益的潜力。”Martin Peers称。

当前,中国、美国两个国家正全面发力AI大模型技术和应用。

2月8日,美国政府宣布,OpenAI、微软、Meta、谷歌、苹果、亚马逊、英伟达等200多家公司正加入美国商务部成立的新的AI安全研究联盟当中;而中国市场,截至2023年10月,中国公开的AI大模型数量已达238个,与美国AI大模型产业分庭抗礼,同时从政府到产、学、研,中国都全面支持AI技术和产业的快速发展。

IDC数据显示,2023年,中国AI市场支出规模将增至147.5亿美元,预计2026年实现264.4亿美元支出,年复合增长率(CAGR)将超过20%;据艾瑞咨询报告,预计到2027年,AI产业规模将达到 6122 亿元。

面壁智能联合创始人、CEO李大海近日对钛媒体App表示,随着时间推移,AI大模型应用可能会“百花齐放”,然而通用基座(千亿)大模型不会太多,可能只有极少数的几家公司最终能“突出重围”。

“未来逐步有些公司会更多往‘应用层’去发展,关于基座模型,相关类型大模型公司不会太多,虽然不会只有一家,但具体是几家我们也不清楚,这个是很难预测的一件事情。”李大海对钛媒体App表示。

皮查伊公开表示,谷歌目前重点是提供正确的生成式AI体验。可以想象同一个用户在免费搜索和Gemini 订阅之间来回切换。换句话说,AI 搜索将不再是“配菜”,而是“主菜单项”——尽管价格更昂贵。

但皮查伊也承认,谷歌Gemini Pro、Ultra依然有产生“幻觉”的风险,而谷歌团队正努力减少模型失控的现象。他坦言,“幻觉”这个词应该谨慎使用,并认为幻觉既是一个特征、也是一个对错误信息的“令人着迷的重塑”。他认为,AI技术应该以事实为基础,但如果把它调整太多,Chat聊天将就会变得非常无聊。

美国咨询公司Stifel分析师表示,Alphabet产生了“健康的广告效果,但还不够”。鉴于谷歌的规模和主导地位,市场对谷歌的期望太高。

皮查伊强调,生成式AI体验应该是“富有想象力的”,目前有点类似于互联网早期时代的“探索”。

那么,随着2024年成为大模型应用年,未来谷歌能否占领生成式AI业务高地,在这场AI军备竞赛中胜出,一切仍有待时间给出答案。