栏目分类
发布日期:2025-02-18 12:32 点击次数:123
自动驾驶汽车以及莽撞行走、交谈并与咱们并肩职责的东谈主形机器东谈主,是 AI 在不久的昔时蜕变宇宙的两个令东谈主惊叹的式样。
但要思安全灵验地运转,这些物理 AI 器具和诓骗必须莽撞剖释实践宇宙。
在本年的拉斯维加斯耗尽电子展上,NVIDIA 刚刚晓谕推出其 Cosmos 平台,该平台旨在加快物理 AI 系统的建树。
被称为"机器东谈主边界的 ChatGPT 工夫",Cosmos 莽撞生成海量合成数据。尽管这些数据是东谈主工创建的,但它们与真实宇宙实足接近,足以让机器东谈主、自动驾驶汽车和其他物理 AI 算法从中学习。
但是,一些东谈主觉得,不管些许合成数据皆无法统统模拟机器需要准备草率的总共实践场景。这即是为什么特斯拉破耗多年时代,通过其搭载传感器的汽车网罗真实宇宙数据的原因。CEO 埃隆·马斯克在推特上写谈:"两种数据不错无尽推广:合成数据存在'是否真实?'的问题,而真实宇宙的视频则不存在这个问题。"
争论的焦点在于,合成数据穷乏真实宇宙的微辞不成掂量性和复杂性,而这些关于构建全面且安全的 AI 系统至关进军。让咱们更忽闪地探讨这个问题。
合成数据与真实宇宙数据的对比
在自动驾驶系统中,视觉数据(图像)用于磨真金不怕火算法,决定车辆怎样对谈路上的不同条目和情况作念出响应。这些数据不错通过装配在车辆上的录像头拿获(真实宇宙数据),也不错由 AI 算法凭证究诘真实宇宙数据所学到的法例生成(合成数据)。
这两种法度皆有其上风和劣势。
合成数据的网罗时时比真实宇宙数据更快、更经济。无需实地网罗数据,只需由机器生成即可。
这也能带来安全方面的平正。举例,在谈路上测试自动驾驶汽车彰着存在一定风险,但淌若仅仅模拟行驶,这些风险就不错排斥。
此外,情境、环境和好多其他变量皆不错自界说,而无用恭候理思的数据网罗条目在实践宇宙中出现。举例,究诘东谈主员不错模拟疏远的天气事件,在危急场景中测试自动驾驶车辆,或模拟复杂的制造时弊,而无需承担实践宇宙的风险或蔓延。
生成合成数据还不错减少或排斥实践宇宙中可能存在的秘密和数据保护问题,因为不存在敏锐个东谈主数据被不测存储或裸露的风险。
这种情况在网罗真实宇宙数据时可能会发生。举例,自动驾驶汽车的录像头拿获的车招牌码可能会被关联到车主并用于识别和跟踪他们。
正如马斯克指出的,真实宇宙数据具有不成否定的真实性上风。难以通过合成式样生成的微辞和难以掂量的东谈主类行径,更有可能在真实数据中获得体现。
监管也可能是一个问题。AI 相干法律正在快速发展,监管机构可能会出于安全议论,要求某些模子或诓骗在特定时代或特定地区必须使用真实宇宙数据进行磨真金不怕火。
量度礼聘
事实上,真实宇宙数据和合成数据关于磨真金不怕火下一代物理 AI 车辆和机器东谈主皆至关进军。
两者皆具有独有的上风和挑战,采选混杂法度可能是通往收效的最好路线。
关节在于识别哪种法度最稳健特定用例。举例,合成数据可能更适用于责罚敏锐信息或在危急条目下操作的任务或诓骗。
而真实宇宙数据则可能在捕捉动态东谈主类行径或可能遭遇微辞不成意象事件的情况下证明更好。
这意味着,采选均衡法度的 AI 神色,由剖释合成数据和真实宇宙数据怎样相得益彰而非互相竞争的东谈主员带领,更有可能创造真实的买卖价值。