同行评审期刊/全国中文核心期刊/中国人文社会科学核心期刊/中文社会科学引文索引来源期刊
文章快速检索

图书馆建设 ›› 2025, Vol. 334 ›› Issue (4): 111-.

• 数据纵横 • 上一篇    下一篇

合成数据:生成式人工智能数据训练中隐私保护和数据利用并行的新路径#br#

  

  • 出版日期:2025-07-15 发布日期:2025-08-25

  • Online:2025-07-15 Published:2025-08-25

摘要: 数据的价值在流通利用中得以彰显,其中的个人数据亦不例外。在促进技术创新与大力发展生成式人工智能产业的 同时,如何保护个人数据主体的隐私利益成为需要考虑的棘手问题。生成式人工智能数据训练面临非法获取语料库数据风险和数 据泄露风险。在生成式人工智能数据训练中隐私保护和数据利用并行的实现上,有赖于匿名化和去标识化的传统路径显得力不从 心,需要进行思维转型并另辟蹊径。基于生成式人工智能数据训练隐蔽的特性,同时也是为了破解个人数据利用中固有的隐私- 效用难题,生成式人工智能数据训练中隐私保护和数据利用并行的实现可以通过隐私增强技术找到突破口。综合运用隐私增强技 术,并协同推进合成数据的开发与应用,可以为实现有效平衡隐私保护与数据效用之间的关系提供新的思路,以此推动生成式人 工智能技术的健康发展为社会带来更大的福祉与进步。