您现在的位置:新生活在线 正文

数据,被称为人工智能发展的“原料”。今天,《全国数据资源调查报告(2025年)》在第九届数字中国建设峰会上正式发布。报告显示,过去一年,我国数据资源正以更大力度的开放、流通与利用,深度赋能人工智能创新发展,为数字经济建设筑牢“数据底座”。

核心数据:词元调用量实现指数级增长

报告首次重点披露了“词元”(Token)这一关键指标。词元是人工智能大模型为了高效处理自然语言等数据而拆分出的最小信息单元,可以理解为大模型“思考”的基本颗粒。

日均词元调用量:从2025年年初的超过1万亿,增长到年末的100万亿,短短一年内实现指数级跃升。

全年词元累计调用量:达到约21100万亿。

这一数据的爆发式增长,直观反映了我国人工智能大模型在训练、推理、应用等环节的活跃程度。无论是智能客服、代码生成、医疗问诊,还是内容创作、教育辅导、科学研究,每一次人机交互的背后,都有海量词元的调用与处理。

一位参与报告撰写的专家指出:“词元调用量的指数级增长,说明我国AI应用已从‘试探性使用’进入‘规模化落地’阶段。数据作为原料,正在被高效地‘开采’和‘加工’。”

数据赋能AI:从“有数据”到“用好数据”

报告指出,2025年我国数据资源体系建设取得显著进展,呈现三大趋势:

数据规模持续扩大:公共数据、行业数据、企业数据、个人数据(经合规处理后)的开放共享程度不断提升,为AI训练提供了更丰富的“原料库”。

数据质量稳步提高:数据清洗、标注、治理等环节更加规范,高-quality数据集占比上升,直接提升了AI模型的准确性与可靠性。

数据流通机制加速完善:数据交易所、数据信托、隐私计算等技术与制度探索不断深入,数据“供得出、流得动、用得好”的生态正在形成。

报告特别强调,数据资源对AI的赋能已从“通用领域”向垂直行业深度渗透。医疗、金融、制造、教育、交通等领域的行业数据集建设提速,推动大模型从“通才”向“专才”进化。

 

责任编辑:admin

免责声明: 转载目的在于传递更多信息,文章版权归原作者所有,内容为作者个人观点。本站只提供参考并不构成任何投资及应用建议。如涉及作品内容或其它问题,请在30日内与工作人员联系(18731251601),我们将第一时间与您协商。谢谢支持!

进入新闻频道新闻推荐
商讯新闻商讯新闻
资讯资讯