品玩9月2日讯,据 TechCrunch 报道,德国研究机构 LAION 近日宣布,发布名为 Re-LAION-5B的全新数据集,用于对Stable Diffusion等生成式AI 模型的训练。
据报道,该数据集其实是旧数据集 LAION-5B 的修改版本。LAION-5B 在去年发布,之后被用户举报存在与儿童性虐待材料(CSAM)相关的链接。LAION 表示,目前已经清除了数据集中的相关链接。
Re-LAION-5B数据集有两个版本可供下载:Re-LAION-5B Research 和 Re-LAION-5B Research-Safe(也删除了额外的 NSFW 内容),LAION 表示,这两个版本都过滤了数千个已知和 可能存在的CSAM 链接。