中国战略新兴产业融媒体记者 卜文娟
“有问题找百度”,当你有信息获取需求时,百度可以告知答案;然而对于百度而言,也一直在寻找成长的答案。
10年前,也就是2013年,在那个行业对AI认知几乎为零的时代里,百度率先意识到随着人工智能技术的发展,无人驾驶将有可能实现,开始了对自动驾驶技术十年如一日的压强投入。过去十年,“ALL IN AI”的声音依然在耳畔回响,AI带来的变革,也实实在在地在百度内部发生着。
新一波AI热潮下,OpenAI、谷歌、微软等科技公司都在不断发力AI,百度顶住压力,战略初见成效,充分展现了一家互联网科技企业的核心创新能力。
All in AI
百度转型人工智能之前,对其他互联网细分领域的尝试算不上成功。在移动互联网的浪潮中,百度虽然推出包括百度空间、百度视频、百度地图、百度杀毒、百度hi等二十多个产品,却“成绩平平”。一方面,今日头条等大流量入口的App蚕食其核心业务;另一方面,一系列负面舆论也压得百度喘不过来气。
内忧外患之下,百度把赌注押在了人工智能上。从2013年起,百度先后建立了深度学习实验室、大数据实验室、硅谷的百度人工智能实验室,以及增强现实实验室,建立起百度大脑。
时间回到2017年初,百度创始人李彦宏请来陆奇来担任百度COO,负责产品、技术、销售、运营。陆奇的加入就像一剂强心针,把百度从迷茫中拉回兴奋。同年,在百度首届AI开发者大会上,百度喊出了“All in AI”口号。
在陆奇带领下,百度显露出全力押注AI的架势。经过一轮大刀阔斧的业务架构调整,百度原有的深度学习研究院、自然语言处理、知识图谱、语音识别、大数据部门等核心技术部门,被整合成AI技术平台体系(AIG),自动驾驶事业部则升级为智能驾驶事业群(IDG)。
陆奇帮助百度成功从依赖搜索业务的互联网公司转型成为AI公司。在合并百度研究院的同时,陆奇砍掉了百度医疗事业部、百度外卖、移动游戏等多个业务或部门,让百度放弃了“赚快钱”的渠道,并且被推上“决胜AI时代”的舞台。在陆奇离开的4年多时间里,百度依然在AI赛道持续投入。
2020年,百度宣布全面升级AI体系,对原有的AIG、TG以及ACG进行重新整合。整合之后的系统称之为百度人工智能体系,包括TPG和ACG两大群。同时,对原有的四大业务板块进行升级,升级为四大事业部。并加大对视频、工业互联网以及工业质检等方面的投入。
从去年开始,元宇宙、数字人、AIGC等关键词基本可以囊括百度所有动作,无论是语言大模型、自动驾驶,还是Web3.0技术产品(百度希壤、百度曦灵数字人平台等),也可以看到,更多的是百度在不断追逐热点,寻找业务增量的过程。
例如飞桨是百度在深度学习技术领域深耕多年的核心成果,更是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。目前,飞桨凝聚了535万开发者,服务20万家企事业单位,基于飞桨创建了67万个模型,已经构建起一个繁荣的深度学习生态。
“让每一个人都感受到技术带来的改变,这就是技术的价值。”李彦宏在2021百度世界大会上,用一系列人工智能技术成果展示了百度的AI技术正在出行、生活、产业、自主创新等领域改善着社会民生。总的说来,百度人工智能研究的一个主要目标是让机器胜任一些一般需要人类智能化才能完成的繁琐工作,落实于民生,AI才有未来。
文心一言更适合中国市场
“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比乐未央”。这是今年3月16日的百度发布会现场,文心一言即兴作的一首“藏头诗”,不仅如此,它还能准确讲出“洛阳纸贵 ”这一成语典故以及对应的经济学原理。
李彦宏认为,与海外开发的模型相比,文心一言更适合中国市场。首先,生成式AI产品承载着搜索引擎从“模糊搜索”到“精准推送”的目标,但是由于中英文的语言结构和语法规则有所不同,且中文语料学习库少,ChatGPT在同一套机器学习技术和算法下,处理中英文时表现有所差异。其次,百度搜索的交互方式将发生变革。通过文心一言的加持,百度搜索可以提供全新的交互方式,用户可以进行聊天式的持续对话方式,实现对问题的求解。
其实,文心一言并非“横空出世”。
2019年,百度推出了文心大模型ERNIE 1.0。经过近4年研发和迭代,文心大模型如今已经形成了产业级知识增强大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算、行业大模型,以及支撑大模型应用的工具平台,蕴含了大量自主创新并且在大规模产业应用中得到验证的技术。目前,ERNIE 3.0每天接受数十亿次用户的搜索请求,已经拥有千亿级参数,并具备智能创作等各类自然语言理解和生成任务。
李彦宏表示,“我们之所以能够在Google、Meta、Amazon等大厂之前先做出来,是因为我们在芯片、框架、模型、应用四个层面做到全球唯一全栈布局、层层领先,我们在进行联合优化的时候,多数友商还躺在上个时代的芯片、操作系统和应用这样的三层架构上。”
百度集团执行副总裁、百度智能云事业群总裁沈抖表示,“文心一言”内测以来,一个多月的时间里完成了4次大的技术升级,大模型推理性能提升了近10倍。目前已有15万企业申请参与内测,其中有超过300家生态伙伴在400多个具体场景已取得测试成效。
百度智能云云计算产品解决方案和运营部总经理宋飞表示:“大家可能会觉得堆积算力、写好代码、然后进行模型训练,把它跑起来就行了。实际上在训练过程中会遇到各种各样的挑战,很少有人能够使得一个大模型训练过程能够在连续一两天内不出问题。百度AI大底座可以为大模型提供高效、稳定的训练和有效的收敛,千卡加速比达到 90%,资源利用率达到70%,开发效率提升100%,这是AI大底座为大模型的开发和应用带来的价值。”
据了解,百度计划逐步将文心一言融入所有业务,为产品及服务赋能。
Apollo面临商业化难题
百度的AI战略另一个有两大核心,即DuerOS和Apollo。
前者是百度人工智能综合能力的开放输出,后者是百度无人驾驶技术的输出。2021百度世界大会上百度“汽车机器人”Apollo的亮相,意味着埋头研发8年之久的无人驾驶技术已经从验证阶段进入到规模化商业运营阶段。配合无人车出行服务平台“萝卜快跑”,其核心创新和服务化新进展也得到全面展现。
据了解,最新一代Apollo RT6,全车共搭载了38个传感器,包括8个激光雷达、6个毫米波雷达、12个超声波雷达,以及12个摄像头。其中车身周围采用了4颗一径科技新一代补盲激光雷达,赋予自动驾驶应用可靠稳定、宽视角、远距离及高分辨率的三维深度感知能力。RT6深度融合AI技术和车辆工程,具备高安全、高质量、低成本等优势,可实现城市复杂道路的无人驾驶能力,成本为25万元。
《无人之境旅途:2022百度自动驾驶出行服务年度报告》中,百度公布了“萝卜快跑”的最新运营成绩,2022年萝卜快跑平台活跃用户数量较2021年增长了将近2倍,订单量也实现了多倍数增长。截至2023年一季度,萝卜快跑全国订单量已超200万,APP用户满意度评价达4.9分,其中5分满分好评占比最新数据高达97.12%。
“萝卜快跑”先后签约北京、上海、广州、深圳、重庆、武汉多地,其中武汉等地还实现全无人商业化运行,连安全员都不用。当地乘客在武汉市经开区范围内的无人车等候点,打开“萝卜快跑”APP下单,车子就会自动停靠等候,全程“自助”。
目前,百度Apollo自动驾驶落地新城市技术交付时间仅需20天。按照百度方面的规划,“萝卜快跑”的目标是在2025年将业务扩展到65个城市,到2030年扩展到100个城市。
此外,根据全球知识产权解决方案提供商Questel发布的《2022年自动驾驶和智能交通专利全景分析报告》显示,百度以1193项高级别自动驾驶专利组数量占据全球第一的宝座。目前,百度Apollo的汽车智能化解决方案已在31个汽车品牌的134个车型上实现量产,累计搭载超700万辆。
但是,Apollo业务仍然面临商业化难题,政策示范性的意味还是浓了一些。目前,运营车辆限定固定区域内完成订单,用户大多还是以体验为主,而非真正意义上能够盈利的商业化运营。
以武汉为例,虽然运营区域内实现了核心商业区、居住区、产业园及高校的覆盖,但测试路线相对固定,只能满足部分出行场景的需求。而武汉经开区的“萝卜快跑”无人车仅有100多辆,虽然初具规模,但仍然很难支撑起庞大的运营成本。虽然部分地区内无安全员的自动驾驶车辆已经开始投入运营,但离真正的“全区域、全无人运营”还有是较大差距。
李彦宏此前预测,萝卜快跑会随着经营规模的进一步扩大,在2024年便开始贡献利润。
创新是买不来的
人工智能这条道路一定通向未来,但有多少公司能够克服种种困难,实现真正的商业化落地,还未为可知。就目前而言,成本问题依然是横亘在前的难题。
根据国盛证券报告《ChatGPT需要多少算力》显示,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。
这种耗资巨大的投入,并非每一个企业都能支撑得起。
过去十年,百度在AI上进行了巨大的投入。李彦宏曾说:“有1块钱的时候,我们会投进技术里;有1个亿,我们会投进技术里;有100个亿,我们还是会投进技术里。”过去几年百度对重点业务的探索,证明了他对于创新的执着是一贯的,对于技术的投入是长期的、从未动摇的。
2019年,仅仅为推广一站式开发平台AI Studio ,百度就拿出总价值1亿元的免费算力开放;2020年,为培养高校AI人才,飞桨启航计划投入总价值5亿元的资金与资源;2021年,飞桨再发布“大航海”计划,3年投入15亿元资金和资源。
2022年世界人工智能大会上,李彦宏表示,百度在AI领域的累计研发投入已经超过1000亿元,仅2021年的核心研发占比就达到23%。此外,财报显示,2022年百度核心研发费用214.16 亿元,占百度核心收入比例达到22.4%。
创新是买不来的,百度一直在努力。持续的研发投入也为百度带来技术水平的成长,这在其专利数量上有所体现。《百度人工智能创新与专利白皮书2023》显示,仅2022年,百度就获得5项中国专利奖;在当下的IT技术栈四层模式中,百度在框架层、模型层、应用层三层专利储备国内第一。
百度首席技术官王海峰认为,专利本身意味着技术是自主研发、行业领先,期待与产业界一起,加快科技自立自强步伐。当下,人工智能正在深刻改变着全球格局和人们生活,引发颠覆性的科技革命,生成式AI的“智能涌现”更助推人工智能产业的加速成长。随着人工智能技术的不断创新和专利积累的不断提升,亟待通过专利的推广、应用和共享,赋能人工智能产业高质量发展。
围绕AI,百度用十年时间,深耕相关技术领域,从底层的高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,如今百度搭建起了一个由芯片层、框架层、模型层以及应用层组合起来的技术架构,每一层之间,都可以通过不断互相反馈,实现端到端优化。