(记者 陈坚 通讯员 王艺涵 林琰旻) 130多套系统、40多万张表格、600多万个字段……要把这么庞大的数据进行分类分级,充分掌握其中敏感数据分布、类型、量级,需要多长时间?
“人工团队大概需要一年,交给AI数据分类分级系统,不到2个月就可以搞定。”全知科技(杭州)有限公司产品研发专家姜浩骏说,处理后的数据满足国家合规要求,数据安全有保障。
从前,车马很慢;如今,AI全知。全知科技成立于2017年,团队核心成员来自阿里巴巴、微软、亚马逊等技术大厂。他们做的事,直击当下企业关心的痛点:数据资产到底该怎么管?
95%准确率背后的技术突围
“传统数据分类靠人工,效率低、易出错。一个字段反复核对,一张表耗掉半天。”姜浩骏介绍,全知科技开发的AI数据分类分级系统能以95%的准确率,同时处理数据库中的结构化数据和文档、图片等非结构化数据,其核心在于“策略引擎+机器学习+大语言模型”的三驱架构。
“我们不是盲目追求大参数,而是用知识库‘框’住AI的思考范围。”姜浩骏解释,“让它更快、更准、更可控。”
即便是图片中文字、表格中的复杂关系,也能通过扫描后的电子文本和图像语义分析实现跨模态判定。不同行业的分类标准,如金融中的客户信息、医疗中的病历数据,均可动态调整。
让AI“既干活又不看数据”
某电信运营商是全知科技的老客户。2022年起,双方开始合作数据分类分级。“他们当时有130多套系统、40多万张表、600多万个字段。”姜浩骏回忆道,“数据质量低、规模大、行业知识复杂,双方团队投入巨大,效果却有限。”
2024年,全知科技上线AI分级分类系统,工作模式彻底颠覆,AI承担理解、打标、清洗工作,人工只需确认结果。“不到两个月,干完了以往一年的工作量。”姜浩骏说,“准确率还远超考核要求。”
用AI处理敏感数据,企业最怕什么?信息泄露。
“我们不需要真实数据,只取元数据,有字段名、描述就够了。”姜浩骏介绍,该系统还支持全私有化部署,数据不出机房。加上全知科技手握150多项资质认证,参与60多项国家、地区及行业标准制定,技术背书逐渐消解了客户的疑虑。
重塑数据安全的基石
数据分类分级只是起点。全知科技已打造出一套可知、可管、可控、可见的数据安全产品矩阵:从API风险监测、数据资产地图,到数据出境合规平台、风险评估服务。
未来,全知科技还将推出“泛监测体系”,将风险监测能力从HTTP拓展至数据库、FTP、邮件等多协议场景,实现全域数据流动的实时管控。
更底层的支撑,是全知科技创始人方兴的技术理想——从黑客到安全专家,再到连续创业者,他始终坚信:“数据在流动,可见才安全。”
记者手记
没有机器轰鸣的工厂,没有人声鼎沸的生产线,在全知科技的机房里,一场关乎效率与安全的变革正在悄然发生。
用AI一天处理16万个字段,不再是一行苍白的参数,而是化为企业合规成本的降低、数据泄露风险的规避,乃至社会整体数据治理水平提升的坚实阶梯。
全知科技市场负责人杨苏健告诉我,从梦想小镇走到浙大校友企业总部经济园,企业成长的每一步都离不开余杭政府的支持与帮助。不久前,我区还牵头帮公司拓展合作渠道,促成与更多重点单位的交流合作,推动项目从技术走向场景、从产品走向落地。余杭始终以包容开放的姿态,为像全知科技这样的创新企业提供从人才引进、技术孵化、成果转化到市场对接的全链条支持。
在这片崇尚创新、宽容失败、鼓励突破的土壤里,无数颗科技的种子正悄悄地生根发芽、抽枝展叶,它们终将长成支撑数字未来的参天大树。