GPU去噪器,具有非常高的静态图像和视频性能

图像/视频去噪广泛应用于许多相机应用中,特别是对于低光照明的任务。 我们已经开发了几个GPU加速的去噪内核,这些内核运行在Windows/Linux/ARM上现有的NVIDIA硬件上。 我们在图像和视频处理方面都取得了非常高的性能.

GPU Denoiser库功能

  • 输入格式:每通道8/10/12/14/16位cpu或GPU内存输入数据阵列
  • 输出格式:CPU或GPU内存中的24/48位输出数据阵列
  • 具有16/32位精度的去噪
  • 没有AI的高速去噪
  • 去噪算法
    • 小波去噪器(raw和rgb)Cdf5/3和CDF9/7与硬,软,Garrote阈值
    • 双边去噪器
    • NLM去噪器
  • 与用于机器视觉摄像机的FastVCR软件兼容
  • 定时和性能测量
  • OS Windows-10/11, Linux Ubuntu and L4T (Jetson NX, Xavier, Orin)
  • 与NVIDIA Gpu的兼容性 (Jetson, GeForce, Quadro), cc >=5.0, CUDA-12.6
gpu去噪器

GPU去噪器的基准

图像分辨率: 4112×2176 (8.9 MPix), 每通道16位, RGB/RGGB

测试描述:gpu内存中的所有数据,时序只包括GPU计算

二维小波变换: CDF 9/7
DWT分辨率数量:最多7
YCBCR的DWT阈值:80;150;150

NLM去噪器参数: 模糊窗口3&次;3和更多, 搜索窗口3&次;3和更多,强度1-3000
该算法可以使用内部4:4:4或4:2:0子采样
NLM还可以为4:2:0和4:4:4子采样模式的Y和Cb/Cr通道提供独立的去噪参数

用于测试的NLM去噪器参数:模糊窗口3×3,搜索窗口5×5,强度500
用于测试的双边去噪器参数:直径3,sigma Color5,sigmaSpace500

软件: OS Windows-10/11, CUDA-12.6
硬件: NVIDIA GeForce RTX 4090

  • 生DWT去噪剂 - 1.8 ms (4.9 GPix/s)
  • DWT去噪器 (YCbCr, 4:4:4) - 3.05 ms (2.9 GPix/s)
  • NLM去噪器 (RGB) - 0.19 ms (40 GPix/s)
  • NLM去噪器 (YCbCr, 4:2:0) - 0.20 ms (40 GPix/s)
  • NLM去噪器 (YCbCr, 4:4:4) - 0.37 ms (21 GPix/s)
  • 双边去噪器 (RGB) - 0.13 ms (61 GPix/s)

上面的结果显示了超快的性能,并且比我们最好的MG debayer算法的处理时间快得多,对于该GPU上的相同图像,处理时间约为0.6 ms (13 GPix/s)。 我们的去噪器曾经比这个去马赛克算法慢得多.

我们已经开发了这个软件作为我们的GPU图像和视频处理SDK的一部分. 现在,我们的客户可以在他们的应用程序中使用这些GPU加速的去噪器作为图像处理管道的一部分.

测试

要测试我们的GPU去噪器,请下载FastVCR软件,该软件不仅可以实时与机器视觉相机配合使用,还可以与SSD的RAW或PGM图像配合使用。 这是评估图像质量和性能的真正测试.

这是下载windows-10/11试用软件的直接链接: FastVCR 软件.

它适用于CUDA-12.6,因此请在测试前安装最新的NVIDIA驱动程序.

基于GPU的去噪路线图

  • 加速双边去噪 - 完成了
  • FFmpeg GPU上的YUV去噪滤波器 - 进行中
  • 原始去噪噪声轮廓校准和实现 - 进行中
  • Gpu上的时间去噪器 - 进行中

联络表格

此表格收集您的姓名和电子邮件. 你可在此查阅我们如何保护及管理你的个人资料的私隐政策.