半岛都市报
-A05版:城事看点-2023年09月01日
日期:09-01
半岛全媒体首席记者 刘玉凡 实习生 简婕 郝梓闻
8月31日,国内多款大语言模型向全社会开放服务,引发舆论广泛关注。从年初大火的ChatGPT到文心一言,大众在感叹人工智能发展进程的同时,也担心人工智能给各个行业带来的颠覆性影响。带着诸多疑问,半岛全媒体记者实测了多款大语言模型,虽然多家公司产品拥有了理解人类话语、指令并且生成类似人类语言文本的能力,但系统错误和漏洞还有不少。
现象:
“国产大模型”群雄逐鹿
由ChatGPT烧起的这把火,从年初一直烧到了8月底,截至目前,国内已正式上线了多家大语言模型,并向全社会开放服务。
8月31日凌晨,文心一言率先向全社会全面开放。作为全球大厂中首个发布的生成式AI产品,文心一言的基础模型文心大模型早在2019年就在国内率先发布。据悉,百度还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
百度创始人、董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。
2023年8月31日,百川智能率先通过《生成式人工智能服务管理暂行办法》备案,即日起面向全社会开放服务。广大用户可以登录www.baichuan-ai.com,感受百川大模型在知识问答、文本创作等领域带来的全新体验。
公开资料显示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司以帮助大众轻松、普惠地获取世界知识和专业服务为使命,致力于通过语言AI的突破,构建中国最优秀的大模型底座。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。成立仅四个月,百川智能便相继发布了三款通用大语言模型。
8月31日,智谱AI正式上线首款生成式AI助手——智谱清言。目前,智谱清言已具备“通用问答、多轮对话、创意写作、代码生成以及虚拟对话”等丰富能力,未来还将开放多模态等生成能力。
此外,商汤大模型应用“商量SenseChat”即日起全面向广大用户开放服务。
实测:
大预言模型有问必答
8月31日,记者实测发现,随着文心一言、百川大模型、智谱清言三大模型正式上线,智谱与文心一言官方APP登上了各大APP平台,百川、商量SenseChat也可通过链接进入智能问答页面。几大模型都只需要简单地输入电话号码,验证通过便可运行。记者分别向几大模型提问与ChatGPT的区别,文心一言表示每个模型在各种应用场景下都各有价值;百川大模型表示与ChatGPT相比能够为用户提供更丰富全面的语言服务;智谱清言则用于日常交互场景的运用。
记者注意到,文心一言已上线为AI画图的功能,但百川大模型与智谱清言在这项功能上尚未推出。针对人类一些工作是否会被人工智能取代的问题,几大模型的回答大同小异,除了肯定人工智能发展对工作的正面作用,也指出了律师、翻译、文员及记者等职位工作的特殊性,结论是无法完全取代。
隐忧:
离“听得懂人话”尚有距离
记者体验发现,虽然各大语言模型能及时答复记者提出的问题,但有时会出现“文不对题”的情况,例如,记者在商汤“SenseChat”上提问:“你和文心一言谁更好?”“SenseChat”给出的答案是:“作为人工智能助手,我和文心一言并不存在绝对的优劣之分。我是OpenAI开发的ChatGPT,而文心一言则是百度研发的ERNIE Bot。我们都能为用户提供自然、流畅的语言交互,解答各种问题,提供相关的知识和信息。”
此外,语言模型中有的回答并不准确,针对“中国男篮在本届世界杯上的表现”这一问题,文心一言给出的答案是上一届世界杯的信息,与之形成鲜明对比的是,“SenseChat”给出的答案较为精准。记者向几大模型提问,是否知晓华为Mate 60 Pro已经上线。文心一言、百川大模型回答已知晓,并能够告知提供一些基本信息。而智谱清言则回答并未知晓上线信息。此外,当记者搜索一些小众歌手的时候,各大模型无法检索,且无法给出正确的答案。
在绘图功能上,记者要求文心一言绘制“老婆饼”“狗主人”“虎背熊腰的男人”等图案,软件也未按照要求绘制,一些图片令人哭笑不得,各大语言模型距离真正“听得懂人话”尚有距离。