本报讯 记者施展华报道:近日,全球AI操作能力权威基准测试ScreenSpot-Pro榜单最新公布结果显示,珠海企业金智维科技凭借KV-Ground 8B模型斩获全榜单第一,以更小模型实现更高性能,超越包括更大参数规模在内的所有模型,彰显珠海企业在企业级AI领域的技术实力。
ScreenSpot-Pro是衡量AI“操作电脑”能力的世界级标杆,重点考察GUI Grounding技术能力,即AI根据自然语言指令,在高分辨率专业软件界面中精准定位按钮、菜单等控件的基础执行力。该测试覆盖办公、开发、设计、工程分析等23款真实应用,场景贴近企业真实应用,被多个主流GUI智能体项目采用。
不同于行业单纯追求大参数的思路,金智维通过专项技术优化,让不同规模模型均实现精度提升。小参数模型的领先表现,可以大幅降低企业AI部署成本:原本需数十万元服务器的算力需求,降至万元级设备即可满足,时延更低、性价比更高,有效破解企业AI落地“用不起、跑不动”的难题。
长期以来,企业智能体存在“理解易、操作难”的痛点:大模型懂任务却难执行,传统自动化工具灵活度不足。金智维此次技术突破,填补了AI理解与实际操作间的断层,无需改造现有系统,AI便可适配企业业务流程,助力企业实现从决策辅助到自主执行的升级。
“ScreenSpot-Pro是全球主流权威大模型评测榜单,几乎所有头部大模型均参与角逐。金智维8B模型以80.5分荣登榜首,而80分以上通常被视作达到人类水平。”金智维首席AI科学家胡箐表示,此次斩获榜单第一标志着金智维在智能体核心能力领域已达到国际领先水平。