警惕!我们正在被“生病”的AI包围

  • 打印
  • 收藏
收藏成功


打开文本图片集

2022年11月,ChatGPT 3.5发布以来,越来越多的AI生成的内容被发布到网上。而新一代的AI模型在训练时,不可避免地会将这些内容作为训练数据的一部分。

当AI开始用自己生成的内容来训练下一代AI时,AI生成的内容会失去多样性,变得越来越单一。就像不断复印复印件的过程一样,训练的过程中,每一代模型都会丢失一些信息,特别是那些罕见但重要的尾部数据!

让我们看一个真实的案例,AI模型在递归生成数据上进行训练时会导致的模型崩溃。(剩余1870字)

目录
monitor
客服机器人