栏目分类
发布日期:2025-02-18 12:46 点击次数:119
快科技1月13日音问,马斯克在CES技巧接纳采访时指出,履行寰宇能用来训练AI模子的尊府,也曾耗尽的差未几了。
马斯克线路,基本上,AI训练也曾将东说念主类累计的常识全数耗尽,而这个时辰点即是前年(2024年)。
马斯克的这一不雅点呼应了OpenAI前科学长Ilya Sutskever在前年12月机器学习会议“NeurIPS”上的说法,Sutskever那时线路,AI产业或者耗尽的数据也曾达到了顶峰。
靠近履行寰宇数据的穷乏,马斯克线路合成数据(synthetic data)将是改日的发展地方。
他指出,补充履行寰宇数据的独一智商即是合成数据,由AI自行生成用于训练的数据,通过合成数据,AI将或者为我方打分,并张开自我学习的历程。
事实上,好多科技巨头也曾开动使用合成数据来训练AI模子,微软、Meta、OpenAI及Anthropic等企业也曾在其AI模子训练中叶俗应用合成数据。
科技商场询查机构Gartner算计,2024年AI及分析步地使用的数据中,约60%是合成数据。
举例,微软在1月8日开源的AI模子“Phi-4”即是通过合成数据相连履行寰宇数据进行训练的,谷歌的“Gemma”模子也罗致了肖似的智商。
Anthropic使用部分合成数据建立了进展最好的系统之一“Claude 3.5 Sonnet”,而Meta则期骗AI生成数据来微调其最新推出的Llama系列模子。