“80后死亡率超5.2%”系谣言,祸首是AI?
日期:02-20
“截至2024年末,80后死亡率突破5.2%,相当于每20个80后中就有1人已经去世。”你是否也被类似的观点刷屏?据“上海网络辟谣”消息,不少自媒体文章都号称其数据来自第七次人口普查的“权威数据”,而该说法漏洞百出,中国人民大学教授李婷溯源后认为,最初来源很可能是和AI的对话所得。也有文章表示,是假数据“污染”了AI。
相关数据未找到官方信息来源
记者在微信平台以“80后死亡率”为关键词搜索文章,不但微信自带的AI搜索功能会推送这条数据,各种自媒体工作号也是铺天盖地般引用转载,甚至不少自媒体开始为80后们鸣不平,称他们为“被时代透支的一代”“被诅咒的黄金一代”。
细看文章发现,大多数公众号都号称其数据来自第七次人口普查的“权威数据”。
令记者感到疑惑的是,2020年开展的七普,是如何得出2024年人口数据结论的呢?
此外,5.2%死亡率这个数字统计也很奇怪。国家统计局官网对于死亡率指标的解释,应该用年死亡人数除以年平均人数,再乘上1000‰,这意味着死亡率的指标是以“千分之几”为单位表示的,而不是常用的百分比。
在数字的细节上,也有很多错误。比如“80后”现存2.12亿的数据,无法找到任何官方信息来源。死亡人数1100万,也未找到相关数据。
最初来源是和AI的对话所得?
这一说法漏洞百出,对此,中国人民大学教授李婷在一篇文章中也作出了反驳。
她提出,通过普查来计算死亡状况,理论上有两个方案,一个是直接利用每次普查公布的分年龄的人口数来计算。另一个方案是根据普查收集的死亡数据来推算死亡水平。
李婷指出,两种方法都有一定缺陷。方法一依赖于人口数据统计的准确性,但在2020年普查启动身份证号码关联以前,各次普查都存在程度不同的问题。比如早年的出生漏报,即婴幼儿年龄段的人口数量低于实际数量;又比如2010年普查因为调查方式的问题,使得流动人口在流出地和流入地两头登记的现象比较普遍,造成青壮年的重报。方法二则面临死亡漏报问题。
不过,她通过公开统计数字计算后得出,虽然两种方法都有缺陷,但是都可以证明,80后的存活状况是要好于70后的,而死亡率也要远低于5.2%这个数字。
那么,这条假数据来自哪里呢,李婷教授根据学生找到的网帖截图,认为假消息来自用户跟DeepSeek的一次对话。
尽管AI对话后标注了数据存在局限性,存在间接推算和估算的情况,但这条假新闻还是被加上骇人听闻的标题在互联网上大肆传播。
溯源认为可能是假数据“污染”了AI
上述分析看似在理,但溯源溯得可能不够彻底,有文章继续考证:“80后存活率降至94.8%”的说法最主要的传播节点,来自某自媒体账号今年2月12日的一篇文章,该文章又转自另一个自媒体账号2月10日发布的文章,有可能是这类错误数字“污染”了DeepSeek。
也就是说,在此问题上,可能是假消息出现在前,AI工具“抓取”在后。不是AI生成的假数据造成了“污染”,而可能是底层数据“污染”了AI。AI纵使有“罪”也谈不上罪魁祸首,罪魁祸首是“人”。
这不是说不要警惕AI幻觉、AI伪造、AI误导之类的问题,只是说在AI训练语料库来自网络的背景下,同样要警惕人为造假导致信息传播走样失序的问题。
据中新网、上海网络辟谣、红星新闻