电子报阅读机
2026-03-30
星期一
当前报纸名称:扬子晚报

国内多数AI模型训练使用的中文数据占比已超60%

日期:08-22
字号:
版面:第A06版:时评/快读       上一篇    下一篇

  新华社电 国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。

  据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。