栏目分类
发布日期:2024-12-30 14:59 点击次数:144
这种新开采诳骗光在芯片上实践深度神经收罗的关键操作,为简略及时学习的高速处理器通达了大门。
为咫尺最尖酸的机器学习应用提供能源的深度神经收罗模子依然变得如斯弘大和复杂,甚至于它们正在糟塌传统电子狡计硬件的极限。
光子硬件不错诳骗光进行机器学习狡计,提供了一种更快、更节能的替代有假想。然则,有一些类型的神经收罗狡计是光子开采无法实践的,需要使用片外电子开采或其他技能,这顽固了速率和后果。
经过十年的商榷,麻省理工学院和其他处所的科学家依然开发出一种新的光子芯片,克服了这些贫苦。他们展示了一个统统集成的光子处理器,不错在芯片上光学地实践深度神经收罗的所关联键狡计。
该光学开采简略在不到半纳秒的时辰内完成机器学习分类任务的关键狡计,同期终了朝上92%的准确率,这一性能与传统硬件极度。
该芯片由互相长入的模块构成,变成一个光学神经收罗,领受交易锻造工艺制造,这不错使该技能的界限和集成到电子产物中。
从永久来看,光子处理器不错为激光雷达、天体裁和粒子物理学的科学商榷或高速电信等狡计条目高的应用带来更快、更节能的深度学习。
“在很厚情况下,模子的发扬怎样并不是独一伏击的事情,伏击的是你能多快取得谜底。现在咱们有了一个端到端系统,不错在纳秒的时辰圭臬上运行光学神经收罗,咱们不错开动在更高级次上念念考应用和算法,”Saumil Bandyopadhyay说,他是电子商榷实验室(RLE)量子光子学和东谈主工智能小组的看望科学家,亦然NTT商榷公司的博士后,他是一篇对于新芯片的论文的主要作家。这项商榷今天发表在《当然光子学》杂志上。
机器学习与光
深度神经收罗由很多互相长入的节点层或神经元构成,它们对输入数据进行操作以产生输出。深度神经收罗中的一个关键操作触及使用线性代数来实践矩阵乘法,它在数据从一层传递到另一层时进行调遣。
但除了这些线性操作除外,深度神经收罗还实践非线性操作,匡助模子学习更复杂的形状。非线性运算,如激活函数,赋予深度神经收罗措置复杂问题的能力。
2017年,该论文的资深作家Dirk Englund的团队与Cecil和Ida Green物理学支持Marin Soljačić实验室的商榷东谈主员沿路在单个光子芯片演出示了一种光学神经收罗,该收罗不错与光进行矩阵乘法。
但那时,该开采无法在芯片上实践非线性操作。光学数据必须被调遣成电信号,然后送到数字处理器进行非线性运算。
“光学中的非线性是极度具有挑战性的,因为光子阻挠易互相作用。这使得触发光学非线性相等耗电,因此构建一个不错以可膨胀的神志完成的系统变得具有挑战性,”Bandyopadhyay施展谈。
他们通过假想一种名为非线性光学功能单位(NOFUs)的开采克服了这一挑战,该开采将电子和光学相连起来,在芯片上终了非线性操作。
商榷东谈主员在光子芯片上设置了一个光学深度神经收罗,使用三层器件进行线性和非线性操作。
统统集成的收罗
一开动,他们的系统将深度神经收罗的参数编码为光。然后,2017年论文中展示的一组可编程分束器对这些输入实践矩阵乘法。
然后,数据传递给可编程的NOFU, NOFU通过将少许的光虹吸到光电二极管中来终了非线性功能,光电二极管将光信号调遣为电流。这个流程不需要外部放大器,浪费的能量很少。
“咱们一直停留在光学界限,直到终末咱们想要读出谜底。这使咱们简略终了超低延伸,”Bandyopadhyay说。
终了如斯低的延伸使他们简略有用地在芯片上试验深度神经收罗,这一流程被称为原位试验,在数字硬件中频频会浪费多半能量。
他说:“这对导航或电信等对光信号进行域内处理的系统终点有用,但对那些想要及时学习的系统也很有用。”
该光子系统在试验测试中达到96%以上的准确率,在推理流程中达到92%以上的准确率,与传统硬件极度。此外,该芯片在不到半纳秒的时辰内完成关键狡计。
“这项责任标明,狡计 —— 其骨子是输入到输出的映射 —— 不错被编译到线性和非线性物理的新架构中,这使得狡计与所需的勉力有了根底不同的比例限定,”Englund说。
系数电路是使用分娩CMOS狡计机芯片的相易基础范例和代工工艺制造的。这不错使芯片大界限分娩,使用可靠的技能,在制造流程中引入很少的差错。
Bandyopadhyay示意,扩大他们的开采并将其与试验宇宙的电子开采(如相机或电信系统)集成将是异日责任的主要重心。此外,商榷东谈主员但愿探索简略诳骗光学上风的算法,以更快的速率和更好的能源后果试验系统。
这项商榷部分由好意思国国度科学基金会、好意思国空军科学商榷办公室和NTT商榷所资助。