修车大队一品楼qm论坛51一品茶楼论坛,栖凤楼品茶全国楼凤app软件 ,栖凤阁全国论坛入口,广州百花丛bhc论坛杭州百花坊妃子阁

检测多个物体的位置、大小和类别的高速方法

发布时间:2023-05-09 08:00:00 阅读数: 682

科学家们已经开发出一种新的高速方法来检测几个物体的大小、位置和类别。这是在不需要图像或需要复杂场景重建的情况下完成的。

研究人员开发了一种新的高速方法来检测多个物体的位置、大小和类别,而无需获取图像或需要复杂的场景重建。图片来源:北京理工大学的彭林涛

由于新方法高度降低了物体检测所必需的计算能力,它可能有利于确定驾驶时的风险。

我们的技术基于单像素检测器,它可以直接从少量的二维测量中实现高效和稳健的多物体检测。-中国北京理工大学研究小组组长边立恒


Bian补充说:"这种类型的无图像感知技术有望解决现有视觉感知系统的沉重通信负荷、高计算开销和低感知率等问题"。

目前已有的无图像感知技术只能获得单一物体的识别、分类或跟踪。为了同时进行这三项,科学家们想出了一种叫做无图像单像素物体检测(SPOD)的方法。

在Optica出版集团的《光学通讯》杂志上,科学家们报告说,SPOD可以实现略高于80%的物体检测精度。

SPOD方法建立在该研究小组早期的成就之上,即提出了一种无成像传感技术作为有效的场景感知技术。他们之前的工作包括无图像分类、分割和字符识别,这些都取决于单像素检测器。

对于自动驾驶,SPOD可以与激光雷达一起使用,以帮助提高场景重建速度和物体检测精度。我们相信,它对自主驾驶有足够高的检测率和准确率,同时也能减少物体检测所需的传输带宽和计算资源要求。-卞立恒,中国北京理工大学研究团队负责人

无图像的检测

一般来说,高级视觉任务的自动化--如果用来导航车辆或跟踪移动的飞机--需要精心制作的场景图像,以提取确定物体所需的特征。

但是,这需要复杂的成像硬件或复杂的重建算法,导致运行时间长,计算成本高,数据传输负荷大。

依靠单像素探测器的无图像传感技术有可能减少物体检测所需的计算能力。

单像素成像技术不是应用像CMOS或CCD那样的像素化探测器,而是用一连串的结构化光线模式来照亮场景。此外,它还进一步记录透射光强度以获得物体的空间信息。然后利用这些数据来计算重建物体或评估其属性。

就SPOD而言,科学家们利用一个小的但经过改进的结构光模式来快速扫描完整的场景并实现2D测量。

这些测量结果被送入一个称为基于变压器的编码器的深度学习模型,以提取场景中的高维重要特征。此外,这些特征被送入一个基于多尺度注意力网络的解码器,它同时输出场景中所有目标的位置、类别和尺寸信息。

与其他单像素检测方法使用的全尺寸图案相比,小的、优化的图案产生了更好的无图像感应性能。同时,SPOD解码器中的多尺度注意网络加强了网络对场景中目标区域的注意。这可以更有效地提取场景特征,实现最先进的物体检测性能。-彭林涛,小组成员,北京理工大学

 

概念验证演示
为了对SPOD进行实验说明,科学家们建立了一个概念验证装置。从Pascal Voc 2012的测试数据集中随机选择的图像被打印在胶片上,然后作为目标场景使用。

当利用5%的采样率时,用SPOD完成无图像物体检测和每个场景的空间光调制的平均时间仅为0.016秒。这比先执行场景重建(0.05秒)和进一步检测物体(0.018秒)要快得多。对于测试数据集中包含的所有物体类别,SPOD显示了82.2%的平均检测精度。

Peng补充说:"目前,SPOD不能检测每一个可能的物体类别,因为用于训练模型的现有物体检测数据集只包含80个类别。然而,当面临一个特定的任务时,可以对预训练的模型进行微调,以实现对新目标类别的无图像多物体检测,用于行人、车辆或船只检测等应用。"

此外,科学家们计划将无图像感知技术扩展到其他类型的探测器和计算采集系统,以获得无重构感知技术。

参考资料:Okamura, S., et al. (2023) Ultrafast measurement of vector spatial modes by using two-dimensional linear optical sampling. Optics Letters. doi.org/10.1364/OL.490009.

 

相关产品

图片 名称 分类 制造商 参数 描述
  • GMAX3265 CMOS图像传感器 CMOS图像传感器 GMAX3265 CMOS图像传感器 CMOS图像传感器 Gpixel Inc.

    分辨率: 65MP - 9344(H)×7000(V) 光学尺寸: 2.3" 像素尺寸: 3.2μm×3.2μm

    GMAX3265是一款6500万分辨率的全局快门CMOS图像传感器,具有高帧率、低噪声和优异的快门效率,适用于工业检测、机器视觉等领域。

  • GSENSE6060BSI CMOS图像传感器 GSENSE6060BSI CMOS图像传感器 Gpixel Inc.

    分辨率: 6144×6144 感光面积: 61.44mm×61.44mm 像素尺寸: 10μm×10μm

    GSENSE6060BSI是一款3700万像素分辨率、大靶面、科学级、背照式CMOS图像传感器。该芯片采用10μm像素尺寸,像素矩阵可进行双面读出,最高帧率为26fps。芯片采用背照式加工工艺,其峰值量子效率高达95%,且感光谱段可拓展至X光和紫外谱段。芯片在HG模式下读出噪声仅为2.3e-,在HDR模式下动态范围高达90dB。芯片采用氮化铝(ALN)PGA陶瓷封装,其导热系数是传统氧化铝陶瓷封装的10倍,在深度制冷时也可保证感光面的平整度。

  • GMAX4416 CMOS图像传感器 CMOS图像传感器 GMAX4416 CMOS图像传感器 CMOS图像传感器 Gpixel Inc.

    分辨率: 16MP-4096(H)x4096(V) 光学尺寸: 1.6" 像素尺寸: 4.4μmx4.4μm

    GMAX4416是一款16MP全局快门CMOS图像传感器,具有高分辨率、高动态范围和近红外增强特性,广泛应用于航空测绘、运动捕捉和AOI检测。

  • GMAX3413 CMOS图像传感器 CMOS图像传感器 GMAX3413 CMOS图像传感器 CMOS图像传感器 Gpixel Inc.

    分辨率: 5900(H)×2160(V) 光学尺寸: 4/3" 像素尺寸: 3.4μm×3.4μm

    GMAX3413是一款宽视场、近红外增强全局快门CMOS图像传感器,适用于智能交通和机器人视觉应用。

  • 高性能AIMO CCD传感器 CCD图像传感器 高性能AIMO CCD传感器 CCD图像传感器 Teledyne e2v

    像素格式: 2048×512 像素尺寸: 13.5μm×13.5μm 图像面积: 27.6×6.9mm

    CCD42-10是一款高性能AIMO CCD传感器,具有全帧架构和先进的反转模式操作,适用于最苛刻的应用场景,如光谱学。

立即咨询

加载中....

全球十万光电产品数据库为您匹配满意的产品

  • 专业选型
  • 正规认证
  • 品质保障