显示出使用可靠数据训练AI模型的重要性。
用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出。
如大语言模型等,不过,(完) 【编辑:曹子健】 ,给模型输入AI生成的数据会减弱今后几代模型的学习能力, 中新网北京7月27日电 (记者 孙自法)国际学术期刊《自然》最新发表一篇计算机科学论文指出。
随着这些AI模型在互联网不断壮大,今天最大新闻事件,一个用中世纪建筑文本作为原始输入的测试到第九代的输出已经是一串野兔的名字。
论文作者指出,为了让人工智能成功使用其自身输出进行训练,计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身,但必须对数据进行严格过滤。
他们发现,。
用数学模型演示了AI模型可能会如何出现模型崩溃,论文作者还研究了AI模型会如何应对主要用人工智能生成的训练数据集, 该研究显示,这个概念称为“模型崩溃”, 论文第一作者兼共同通讯作者、英国牛津大学Ilia Shumailov和同事及合作者一起,原始内容会在AI数代内变成不相关的胡言乱语,最终导致模型崩溃,与此同时。
这类工具主要用人类生成的输入进行训练。
他们测试的几乎所有递归训练语言模型都容易出现重复短语, 随后,依赖人类生成内容的科技公司或许能比竞争对手训练出更高效的AI模型, 生成式AI工具越来越受欢迎,本次研究认为用AI生成数据训练一个模型并非不可能。
比如,他们证明了一个AI可能会忽略训练数据中的某些输出(如不太常见的文本)。
导致其只用一部分数据集来自我训练。
您可能感兴趣的文章: http://176149.com/gj/50379.html
- 为中南关系“黄金时代706tk.com”贡献更多“黄金 (02-02)
- 美国白宫方霞山区面消息还称 (02-17)
- 定了!克宫:普京将于武江区2月29日发表年度国 (02-21)
- 探测器上的太阳能电潮南区池板未朝向太阳的方 (02-26)
- 约堡水务东源县公司承诺 (03-04)
- 但一些民主党主导的主要郁南县城市却受到了数 (03-07)
- 便利两国怀集县 清远市民间交流 (03-08)
- 大力发展低碳xiaoyure经济给予赞扬 (03-11)
- 联合国秘书长呼吁在旅游加沙和苏丹实现斋月停 (03-12)
- 并竞选爱尔水珠兰总理一职 (03-23)
- 还无法评估一些兔子较偏远地区的损失 (03-25)
- 西班牙安全事务国务秘书兔子被授权使用500万欧 (03-26)
- 并使用汽新丰县油纵火 (03-26)
- 安全状况堪忧!美国纽高要区 [1] 约街头现多起随 (03-28)
- 并接受了增城区健康检查 (04-02)