英伟达 CV-CUDA图像处理加速库A版已开源发布
Alpha 版本,正式向全球开发者开源。用户可在 GitHub 下载和试用。
英伟达 CV-CUDA图像处理加速库A版已开源发布
随着短视频App,和VR/AR随着技术的发展,视频和图像逐渐成为全球互联网流量的主要组成部分。包括我们通常接触到的许多视频图像AI和计算机视觉(CV)算法已经处理并增强了。然而,随着社交媒体和视频共享服务的快速增长,作为一个角色AI基于图像算法的视频图像处理部分成为计算过程中不可忽视的成本和瓶颈。回顾一些图像处理的常见例子,以便更好地理解CV-CUDA应用领域。
(1)AI模糊算法图像背景
视频会议、美图修图等场景一般采用图像背景模糊。在这些场景中,我们通常希望AI算法可以模糊主体外的背景部分,保护用户隐私,美化图像等。图像背景模糊过程大致可以分为三个过程:预处理,DNN网络和后处理过程。预处理过程通常包括图像Resize,Padding,Image2Tensor等行为;DNN有些常见的网络segmentationnetwork,例如Unet等等;后处理过程,一般包括Tensor2Mask,Crop,Resize,Denoise等行为。
在传统的图像处理过程中,于传统的图像处理过程中CPU操作导致整个图像背景模糊过程中前后处理部分消耗90%的工作时间,成为整个算法流水线的瓶颈。如果能正确使用前后处理GPU加快,这将大大提高整体计算性能。
将前后处理部分放在GPU之后,就可以对整个pipeline进行端到端GPU加快。经过测试,在一个单个GPU在上面,与传统的图像处理方法相比,整个pipeline移植到GPU之后,可以得到20倍以上的吞吐率增加。这无疑会大大节约核算成本。