速度更快、能效更高的衍射光神经网络可用于图像和视频处理。研究人员首次利用表面法向非线性光电探测器(SNPD)的力量提高了衍射光神经网络(ONN)的速度和能效。这种创新装置为开发大规模 ONN 铺平了道路,这种 ONN 能够以极其节能的方式以光速执行高速处理。
诺基亚贝尔实验室的Farshid Ashtiani将在2023年10月9日至12日于华盛顿州塔科马(大西雅图地区)大塔科马会议中心举行的"光学与激光科学前沿"(FiO LS)会议上介绍这项研究。
"人工智能(AI)在我们的生活中扮演着越来越重要的角色。从大型语言模型到自动驾驶汽车,我们看到人工智能带来的巨大进步,"Ashtiani 解释说。"神经网络的灵感来自人脑如何学习和执行各种任务,是人工智能进步的核心。神经网络的广泛应用之一是识别模式和物体,为机器提供视觉。例如,每一辆自动驾驶汽车,甚至是半自动驾驶汽车,都必须通过能够看到事物来了解周围环境。"
探测器阵列。资料来源:Farshid Ashtiani,诺基亚贝尔实验室
传统处理与光学神经网络
诺基亚贝尔实验室的 Mohamad Hossein Idjadi 说:"传统上,图像由相机拍摄,转换为电信号,然后使用 CPU 或 GPU 等电子处理器进行处理,以识别物体。然而,由于图像最初是在光域(即光)中拍摄的,因此使用 ONN 进行光学处理可以更快、更节能。在不同的技术中,基于空间光调制器的 ONN 能够对高分辨率图像和视频进行光学处理。这种处理需要非线性模块,相机传感器通常用于引入所需的非线性,这需要几毫秒的时间。"
"我们的新型探测器设备使这种非线性处理速度比此类相机快 1000 倍,能效更高。这对下一代机器视觉系统至关重要,因为我们都需要速度更快、能耗更低的智能小工具"。
自由空间衍射 ONN 的优势
自由空间衍射 ONNs 使用空间光调制器,特别适合创建图像和视频处理所需的大规模神经元网络。然而,这类 ONN 的速度和能效通常受到用于实现非线性激活函数的图像传感器的限制,而非线性激活函数可实现多层神经元以创建深度神经网络。
单个探测器。资料来源:Farshid Ashtiani,诺基亚贝尔实验室
在这项新工作中,研究人员建议在高分辨率衍射 ONN 中使用 SNPD,他们之前已将 SNPD 演示为高速电光调制器。测试表明,SNPD 的 3 分贝带宽为 61 千赫,相当于不到 6 微秒--比此类 ONN 传统使用的相机传感器的典型响应时间快 1000 倍。此外,该传感器的功耗仅为 10 nW/像素,比普通摄像头的效率高出三个数量级。
测试和意义
为了衡量传感器在 ONN 中的功效,研究人员将图像输入卷积层(神经网络的主要构件)。卷积层有 32 个并行的 3 × 3 核,跨距为 1,并使用实际测量的 SNPD 响应作为激活函数,而不是标准的整流线性激活函数。在这种模拟设置下,网络的测试分类准确率达到了约 97%,与在同一网络中使用理想的整流线性激活函数的性能相同。
这项研究证明了在自由空间衍射 ONN 中使用 SNPD 的潜力。事实上,这种检测器比照相机快三个数量级,效率更高,因此很有希望用于大规模自由空间 ONN 设置。
诺基亚贝尔实验室的 Stefano Grillanda 补充说:"我们需要制造大量的探测器设备,可能需要数百万个,才能建立一个完整的视觉系统,并与传统相机提供的高分辨率相抗衡。好消息是,这在技术上是可行的。另一个研究方向是进一步减少探测器的占地面积、能耗和响应时间,使其成为未来人工智能视觉系统更好的解决方案。"