“今天,全球所有顶尖科技公司都在关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。”在百度世界2024大会上,李彦宏表示,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。
智能体是AI应用的最主流形态,即将迎来爆发点
“做智能体很像PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人、更智能,更像你的销售、你的客服、你的助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
李彦宏解释说,一方面,做智能体的门槛足够低,谁都能上手,在百度的文心智能体平台上,甚至已经有11岁的小学生在创造智能体,然后通过搜索和其他渠道分发出去;另一方面,智能体的天花板又足够高,可以做出功能非常强大的应用。多个智能体的协作,还可以解决更加复杂的问题。
“目前,文心智能体平台上已经吸引了15万家企业和80万名开发者参与,覆盖的应用场景非常多。文心智能体平台的TOP100智能体是我们基于智能体的分发量、平均对话轮次、用户喜爱度等指标综合遴选出来的。有角色类的,像农民院士智能体,有工具类、行业类的智能体,更有职场、情感、娱乐等类型的智能体。”
“公司类智能体相当于AI时代的公司官网。传统官网具有的那些能力,比如公司介绍、产品图片和参数展示、线下门店位置等等,公司类智能体都有。而传统网站没有的主动推荐、及时响应和一对一服务能力,公司智能体也有。”
智能体与传统官网有什么不同?区别就是,对最新信息或者最个性化问题的回答。传统的官网,对外界市场信息变化往往不敏感,客服人员对于个性化的问题也难以给出令人满意的回答,就只能做记录,再电话回访。而智能体可以利用大模型的理解、生成、逻辑、记忆四大能力和检索增强能力,快速从网上获取最新、最准确的消息,并在一秒内就给出一个令人满意的答案。即便是更复杂的问题,智能体也可以通过不断地互动、澄清、反问,来最终满足需求。
“不仅是比亚迪,像联想、沙宣、洋河这些企业,现在都已经拥有了自己的官方智能体。比起传统的官网,智能体既是品牌顾问又是金牌销售和客服,既专业又贴心,一对一的服务,大幅地提升了互动营销的效率。比亚迪的官方智能体上线后,销售线索转化率提升了119%。联想AIPC智能体在9月份的互动率提升了89%,销售线索转化率提升了80%。”
中国AI应用潮爆发 百度文心大模型日均调用量超15亿次
“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”李彦宏的演讲中这样的论述,吸引了很多人的注意。
幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是RAG,即检索增强。回顾过去两年,李彦宏认为,检索增强生成(RAG)从百度特色,逐渐发展成为行业共识。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。
目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。
针对上述问题,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标还是作为背景的长城,均未出现错误或变形的幻觉问题。同时展示的“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。
iRAG技术极大地提高了AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄大几十万,但现在的创作成本接近于0。简单而言,文心iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。
根据现场曝光的文心大模型的日均调用量变化曲线图,到11月12日,日均调用量已经超过了15亿次。“这是一条非常陡峭的增长曲线,代表着过去两年中国大模型应用爆发。说实话,这个增速是超出了我的预期的。”李彦宏回忆,6个月之前,当文心一言日均调用量达到两亿的时候,他曾经和高管们讨论大模型的未来。“我当时说,如果我们的日均调用量一年之内涨10倍,也就是从2亿涨到20亿,我认为就成了,就说明大家是真需要。现在仅仅半年过去,我们就比较接近这个数字了,势头非常猛。”
无代码工具“秒哒”发布,将迎来一个“只靠想法就能赚钱的时代”
李彦宏还带来无代码工具“秒哒”,一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。它可以帮助更多人、更多企业打造出数百万“超级有用”的应用。
他介绍说,无代码编程,由大模型直接生成代码,不需要人写一行代码。它门槛很低,人人可上手;多智能体协作,是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;多工具调用,是通过文心大模型的工具调用能力,可调用网页检索、iRAG、地图API等各类型工具。
南京晨报/爱南京记者 杨静