亚马逊云科技陈晓建:生成式AI浪潮才刚开始 行业细分模型将成趋势

文章正文
发布时间:2023-04-27 21:57

陈晓建认为,并不能单纯从规模、参数来判断模型的价值。“不少小模型也具备了相当好的能力,以非常少的资源就可以进行单机部署。未来这一两年内,会看到更多并非特别大的模型,但在某些能力上表现优秀。


《科创板日报》4月27日讯(记者 黄心怡)近日,亚马逊云科技正式官宣加入生成式AI赛道,推出Bedrock生成式AI基础大模型云服务Amazon Bedrock,自有大语言模型Amazon Titan,并宣布基于自研芯片Amazon Trainium和Amazon Inferentia2的两款EC2的新实例Amazon EC2 Trn1n和Amazon EC2 Inf2实例,以及自动代码生成工具AI编程工具Amazon CodeWhisperer正式可用。

“云计算的价值在于推动生成式AI的普惠化。”亚马逊云科技大中华区产品部总经理陈晓建在接受《科创板日报》记者采访时表示,“在通用模型的基础上,发展适合自己场景的细分行业模型,这是大模型未来的发展格局。”

陈晓建认为,并不能单纯从规模、参数来判断模型的价值。“不少小模型也具备了相当好的能力,以非常少的资源就可以进行单机部署。未来这一两年内,会看到更多并非特别大的模型,但在某些能力上表现优秀。”

▍生成式AI服务正在邀请测试

此次推出的Amazon Bedrock基础大模型生成式AI全托管云服务,用户可通过API访问其自研和第三方的预训练基础模型。

“Amazon Bedrock是全托管服务,让用户可以把精力放在自己要做的训练模型的工作上面。” 陈晓建介绍,“这样,用户不用担心后端所使用的各种基础资源的申请、管理和各种运营的服务,可以完全把这些工作交给Amazon Bedrock来执行。”

据悉,亚马逊云科技基于Amazon Bedrock服务提供基础大模型Amazon Titan,以及基于不同场景下的两个子模型TitanText和Titan Embeddings,以及来自于AI21 Labs、Anthropic、Stability AI等第三方合作伙伴的模型,目前该服务处于邀请测试的状态。

“现在市场变化很快,各家都有大模型,企业希望找到更加适用于自身行业、具体业务的模型。”亚马逊云科技大中华区数据技术专家团队总监王晓野指出,“比如,Stability AI的模型更偏向于多模态的文生图或者自然语言能生成图片。Anthropic的Claude则更多地关注对话文字生成,AI21 Labs的模型在多语言支持上表现比较好的,包括对法语、西班牙语等小语种的支持。”

要想真正在企业中训练和落地,大模型需要根据企业需求进行定制化。目前,阿里云等国内厂商已经发布伙伴计划,希望通过定制化的专属大模型来加快行业应用。《科创板日报》记者了解到,Amazon 亚马逊的Bedrock也支持帮助用户定制模型。

“用户在使用大模型的时候,需要能找到最合适他们业务场景的大模型,并让其与业务进行无缝集成。” 陈晓建指出,“大模型的使用还要尽可能地简单,且保证数据和业务的安全。”

“很多客户可能不具备能力和时间,从头搭建一个环境来训练自己的大模型,所以他们需要依赖于已有的大模型环境,通过对行业的积累和理解,以及自身拥有的行业数据,能够对大模型进行定制化优化和重新训练,从而获得最适合其场景的模型。”

对于潜在数据安全和隐私保护鞥先,陈晓建强调,“在安全加密方面,所有用户的环境都基于它自身的VPC(私有网络环境),与其他客户完全隔离。同时所有数据都进行加密。”

▍生成式AI的浪潮才刚刚开始

在 Gartner 发布的 2022 年新兴技术成熟度曲线中,生成性式AI(AIGC)被列为2022 年五大影响力技术之一,处于技术萌芽期并加速发展中。Gartner预测,到 2025 年生成性AI 所创造的数据可占到所有已生产数据的10% 。

“生成式AI的浪潮才刚刚开始,很多技术还是处在非常早期的阶段。”陈晓建认为,“未来AIGC的应用不会只依赖一个生成式大模型,我们可能会有多个针对于不同场景的大模型来支撑各行各业的应用。”

其中,行业数据成为关键因素。“人工智能本质上讲就是算力、算法和数据。如果算力和算法是通用性的,数据一定是跟行业相关。数据的丰富度、准确性,对最终模型的效果会起到非常直接的作用。比如通过Priming技术,把自己的数据去喂大模型,帮助大模型做再次训练,从而为特定场景服务。”

同时,云计算将推动生成式AI的普惠化,未来在细分领域的行业场景会有更多产品和方案出现。“亚马逊云科技这次发布新产品和功能,都是为了降低生成式AI的技术门槛。为什么要有自研芯片,这是专门为训练和推理场景所设计的,结合其他硬件,比如Nitro安全加密芯片、网络增强型的功能,最大限度地提供最高性价比的训练算力环境。”

陈晓建判断,多模态的大模型会是热点。

“现在的大模型更多是文生文、文生图等应用。未来会朝着多模态的方式去发展,不仅是文本和静止的图片,视频显然是一大热点。除了视频之外,还有其他的各类应用,比如图生文也会是值得期待的。”

同时,打造细分行业的模型将成为常态。“在通用模型的基础上,发展适合自己场景的细分行业模型,我觉得是大模型的未来发展格局。”

陈晓建还认为,小模型的发展也值得关注,并不能单纯从规模、参数来判断模型的价值

“除了普遍受到关注的大模型以外,也有很多开源社区提供一些较小的模型。与这些顶级大型模型相比,这些小模型以非常少的资源就可以进行单机部署,也具备了相当好的能力,跟一两年前的大模型相比也毫不逊色。随着技术的发展,在未来这一两年内,会看到更多并非特别大型的模型,却在部分能力方面表现优秀,同样可以适用一些领域。”陈晓建说。

ChatGPT和生成式AI的迅猛势头,将对各行各业现有的工作岗位产生冲击,对于AI是否会带来失业潮,陈晓建表示,AIGC一方面会代替掉很多以前传统的重复性、低效、低价值工作,但是同时会释放从未有过的生产力。

“AIGC让人类社会可以做很多以前根本不能做的事情。这会带来非常多的工作机会。尽管失业一定会存在,但AIGC也会为人类社会带来更多价值和机遇,将很多新的不可能变为可能。”

黄心怡


lixiadongzhi

科创板日报记者