谷歌·Bard“史诗级”更新:定制化的中文服务,开放图像分析功能

文章正文
发布时间:2023-07-16 17:20

大数据文摘出品

今年三月份,谷歌宣布生成式AI Bard推出Beta测试版,当时的版本只面向美国和英国用户开放公测,且暂时只支持英语。

图注:Bard已经有专属中文界面!堪称定制化的中文服务

今天,Bard发布重大更新!Bard 支持的语言目前新增了 40 多种,包括阿拉伯语、中文(简体/繁体)、德语、印地语、西班牙语等。

同时,谷歌还增加了推出 Bard 的地区,包括欧盟的 27 个国家/地区和巴西。不过仍然没包含中国。

对于此次更新,称之为“史诗级”:Today we’re announcing Bard’s biggest expansion to date.

1.Bard 支持 Google 智能镜头:与 Bard 对话时,你可以上传图片及文字,并要求Bard提供有关图片的信息,相关功能暂时只支持英语。

2.Bard 可以朗读回答内容了:在 Bard 中添加了文字转语音功能。该功能支持 40 多种语言,包括印地语、西班牙语和英语(美国)。

3.固定对话和近期对话:可以随时返回之前与 Bard 的对话继续互动,还可根据需要整理对话。

4.与他人分享 Bard对话:利用可分享的链接,让其他人只需轻轻一点,即可轻松流畅地查看你的 Bard 对话内容和相关信息来源。

图注:修改回答

5.修改 Bard 的回答:推出了 5 个新选项,可用来修改 Bard 的回答。只需点按相应的选项,即可让回答内容变得更加简单一点、详尽一点、简短一点、专业一点或随意一点。

6.将 Python 代码导出至 Replit:除了 Google Colab 之外,还可以将 Python 代码导出到 Replit。

关于谷歌的Bard计划

目前Bard 是一个实验项目,由Google 的 PaLM 2 模型提供支持,让用户能够与生成式 AI 协同合作。

自从OpenAI在2022年11月发布ChatGPT后,Google似乎一直在努力迎头赶上其AI的发展。

2023年5月的Google I/O年度大会有了实质性的动作。在长达两小时的主题演讲中,谷歌CEO Sundar Pichai和其他高管演讲者,更是多达140次以上提到了“生成式AI”。

谷歌全力投入到科技潮流中。尽管Bard的用户数未能达到ChatGPT的水平,但近期增长显著,今日的更新可能进一步推动其增长。

相比ChatGPT,Bard的最大优势是巨大的信息资源,他们可以依托谷歌的搜索工具获取最新信息,根据自己的梳理给出答案。此前ChatGPT的训练数据最新只到2021年,无法回答2022年之后的信息咨询。此外,Bard的回复速度也明显快于ChatGPT。

Bard可以联网搜索信息,意味着用户可以直接询问今天的体育比赛比分、股价价格走势、系列新闻动态。

文摘菌试了一下,搜索中文资料的功能,感觉非常差。

图注:Bard的中文搜索功能

不过,有网友表示,Bard的精准识图功能异常强大:更新后的Google Bard能够查看我的手表的照片,正确识别手表的特定品牌和型号,并从手表表面读取数据。

谷歌人工智能现状:骨干研究员“出逃”

从体验上可以看出,谷歌Bard的功能在生成文本,理解内容方面不如GPT-4;在上下文窗口容纳方面没“卷”过Claude。虽然新增了“精准识图”功能,但能释放的生产力肯定不如前者。

似乎谷歌的AI之路这两年总是慢了半拍。究其原因,除了犹豫是否发布与ChatGPT类似的聊天机器人的“墨迹”的性格,可能还和“留不住人”的企业文化有关。彭博社消息,Transformer合作者Llion Jones将于本月底离开谷歌。

Transformer来源于论文“Attention is All You Need”,这篇开山之作奠定了今天生成式AI和大模型的基石。算上Llion Jones,当时署名的6位谷歌研究员,已经全部离职。

Ashish Vaswani在Google Brain工作了五年后离职,创办了Adept(生成性AI工具);

Noam Shazeer在Google工作了21年,现在是Character.AI的首席执行官;

Niki Parmar在Google工作后与Vaswani一起创立了Adept,但后来她也离开了Adept创立了新的公司;

Jakob Uszkoreit在Google工作13年,现在他是Inceptive的联合创始人;

Aidan Gomez现在是Cohere的联合创始人和首席执行官;

Lukasz Kaiser离开Google后加入了OpenAI,他对OpenAI的GPT-4做出了重要贡献;

Illia Polosukhin在Google工作三年后创立了NEAR,致力打造Web3系统。

此外,还有一些重磅论文的重要作者也离开谷歌。例如:提出通用的端到端的序列学习方的论文“Sequence to Sequence Learning with Neural Networks”。

Ilya Sutskever著名论文“序列-to-序列”的第一作者,在谷歌待了3年,于2015年离开谷歌,目前是OpenAI的首席科学家。

Google的首个聊天机器人Meena 的技术论文“Towards a Human-like Open-Domain Chatbot”,被认为是大语言模型的又一个重要里程碑,论文提出了一种想法,即创建一个大型语言模型,对任何问题生成像人一样的回应,无需硬编码(hard-coded)训练。

但里面的两个研究员Daniel De Freitas和Romal Thoppilan都已经离职,前者在Google Brain工作了五年,后者工作了七年,现在两者共同成立了Character.AI。

论文“LaMDA: Language Models for Dialog Applications”是Bard聊天机器人的技术基础,比Meena更强大,目前LaMDA的几位主要研究人员已经离开谷歌,加入了Character.AI,包括前面提到的:Noam Shazeer、Daniel De Freitas。此外,在谷歌工作了四年的Alicia Jin也已经加入了Character.AI。

BERT是一种基于Transformer模型的自然语言处理工具,它通过预测隐藏或"掩码"的词来更好地理解文本。例如,如果你查询"你能否为别人在药店买药",它会理解到"别人"是查询的关键部分。自2019年Google将BERT纳入搜索以来,它已经极大地提高了搜索的准确性。这篇论文由Jacob Devlin领导,他曾短暂在OpenAI工作,但最近又回到了Google。

论文“Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”提出了著名的T5架构,这篇论文的主导者Colin Raffel,也在2021年离开Google Brain。Raffel现在是北卡罗来纳大学教堂山分校的助理教授,并在Hugging Face每周担任一天的研究员,用户可以在那里共享大型语言模型和数据集。

论文“Chip placement with deep reinforcement learning”和“A graph placement methodology for fast chip design” 能利用AI在芯片设计中达到最大性能,同时减少面积和电力使用。这些发现帮助Google设计了专为机器学习任务的TPU芯片。论文的两位重要作者Mirhoseini和Goldie在2022年离开Google,加入了开发大型语言模型和名为Claude的聊天机器人的Anthropic。

至于离职的原因,有员工表示,在AI发展如此激动人心的时刻,初创公司为研究人员提供了机会,让他们拥有更多的自主权,并可能产生更大的影响。

换句话说,在谷歌推出新的想法 “太难了”,因为一旦失败会对大公司声誉造成非常大的影响。

原标题:《谷歌·Bard“史诗级”更新:定制化的中文服务,开放图像分析功能》