《计算机视觉度量深入解析》—第1章1.1节图像传感器技术

简介:

本节书摘来自异步社区《计算机视觉度量深入解析》一书中的第1章1.1节图像传感器技术,作者【美】Scott Krig(斯科特·克里格),更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章 图像的获取和表示
计算机视觉度量深入解析
计算机视觉以图像为出发点。本章对一定范围的主题进行介绍,包括获取、处理和表示图像(计算成像、二维成像和三维深度成像方法),传感器处理,对立体图像和单目多视角立体图像的景深(depth-field)处理以及表面重构。本章选择性地介绍了一些重要主题,并给出了参考文献以供感兴趣的读者进一步研究。那些在二维成像和三维成像方面具有良好背景的读者也会通过阅读本章获益。

1.1 图像传感器技术
本节对图像传感器技术进行了基本概述,对于理解图像如何构成,以及开发为优化计算机视觉的图像质量所采用的有效图像传感器处理技术策略而言,它是一个基础。

典型图像传感器的核心是CCD单元(charge-coupled device,电荷耦合器件)或标准CMOS单元(complementary meta-oxide semiconductor,互补金属氧化物半导体)。CCD和CMOS传感器具有类似的特性,它们被广泛应用于商业摄像机上。不过,现代多数传感器均使用CMOS单元,这主要是出于制造方面的考虑。传感器和光学器件常常整合在一起用于制造晶片级摄像机,这种摄像机被用在类似于生物学或显微镜学等领域,如图1-1所示。


f5223e702d0dc6a4c0f353ee290aea6619a3d07f

图像传感器是为满足不同应用的特殊目标而设计的,它提供了不同级别的灵敏度和质量。想要熟悉各种传感器,可查阅其厂商信息。例如,为了在硅基模和动态响应(用于实现光强度和颜色检测)之间有一个最好的折中,对一个特定的半导体制造过程,需优化每个光电二极管传感器单位的大小和组成成分。

对计算机视觉而言,采样理论的效果具有重要意义,如目标场景的像素范围就会用到Nyquist频率。传感器分辨率和光学器件能一起为每个像素提供足够的分辨率,以便对感兴趣特征进行成像,因此有这样的结论:兴趣特征的采样(或成像)频率应该是重要像素(对感兴趣的特征而言)中最小像素大小的两倍。当然,对成像精度而言,两倍的过采样仅仅是一个最低目标,在实际应用中,并不容易决定单像素宽度的特征。

对于给定的应用,要取得最好的结果,需校准摄像机系统,以便在不同光照和距离条件下确定像素位深度(bit depth)的传感器噪声以及动态范围。为了能处理传感器对任何颜色通道所产生的噪声和非线性响应,并且检测和校正像素坏点、处理几何失真的建模,需发展合适的传感器处理方法。如果使用测试模式来设计一个简单标定方法,这种方法在灰度、颜色、特征像素大小等方面具有由细到粗的渐变,就会看到结果。第2章讨论了一系列可用于传感器图像处理的方法,但首先还是从传感器材料开始讨论吧。

1.1.1 传感器材料
硅制图像传感器应用最广,当然也会使用其他材料,比如在工业和军事应用中会用镓(Ga)来覆盖比硅更长的红外波长。不同的摄像机,其图像传感器的分辨率会有所不同。从单像素光电晶体管摄像机(它通过一维直线扫描阵列用于工业应用),到普通摄像机上的二维长方形阵列(所有到球形整列的路径均用于高分辨率成像),都有可能用到。(本章最后会介绍传感器配置和摄像机配置)。

普通成像传感器采用CCD、CMOS、BSI和Foveon方法进行制造(本章最后会稍微讨论一下)。硅制图像传感器具有一个非线性的光谱响应曲线,这会很好地感知光谱的近红外部分,但对蓝色、紫色和近紫外部分就感知得不好(如图1-2所示)。


a62e4ecca6464b4fb196e3ce8d2106979d08661f

注意,当读入原始数据,并将该数据离散化成数字像素时,会导致硅光谱响应。传感器制造商在这个区域做了设计补偿,然而,当根据应用标定摄像机系统并设计传感器处理方法时,应该考虑传感器的颜色响应。

1.1.2 传感器光电二极管元件
图像传感器的关键在于光电二极管的大小或元件的大小。使用小光电二极管的传感器元件所捕获的光子数量没有使用大的光电二极管多。如果元件尺寸小于可捕获的可见光波长(如长度为400纳米的蓝光),那么为了校正图像颜色,在传感器设计中必须克服其他问题。传感器厂商花费大量精力来设计优化元件大小,以确保所有的颜色能同等成像(如图1-3所示)。在极端的情况下,由于缺乏累积的光子和传感器读出噪声,小的传感器可能对噪声更加敏感。如果二极发光管传感器元件太大,那么硅材料的颗粒大小和费用会增加,这没有任何优势可言。一般商业传感器设备具有的传感器元件大小至少为1平方微米,每个生产厂商会不同,但为了满足某些特殊的需求会有一些折中。


14915dd8a162f41b7fd8c98032ed6d78234565f9

1.1.3 传感器配置:马赛克、Faveon和BSI
图1-4显示了多光谱传感器设计的不同片内配置,包括马赛克和堆叠方法。在马赛克方法中,颜色过滤器被装在每个元件的马赛克模式上。Faveon[1]传感器堆叠方法依赖于颜色波长深度渗透到半导体材料的物理成分,其中每种颜色对硅材料进行不同程度的渗透,从而对各自的颜色进行成像。整个元件大小可适用于所有颜色,所以不需要为每种颜色分别配置元件。


b786355160e3ad7d1533d05261069af89df2093a

反向照明(back-side illuminated,BSI)传感器结构具有更大的元件区域,并且每个元件要聚集更多的光子,因而在晶粒上重新布置了传感器接线。请参考Aptina[410]关于前端和后端晶粒电路排列比较的白皮书。

传感器元件的布置也影响到颜色响应。例如,图1-5显示了基本颜色(R、G、B)传感器以及白色传感器的不同排列,其中白色传感器(W)有一个非常清晰或非彩色的颜色滤波器。传感器的排列考虑到了一定范围的像素处理,如在传感器对一个像素信息的处理过程中,会组合在邻近元件的不同配置中所选取的像素,这些像素信息会优化颜色响应或空间颜色分辨率。实际上,某些应用仅仅使用原始的传感器数据并执行普通的处理过程来增强分辨率或者构造其他颜色混合物。


d3ebcfd34138b84db76e7dbf56bfeb09a0f928ea

整个传感器的大小也决定了镜头的大小。一般来说,镜头越大通过的光越多,因此,对摄影应用而言,较大的传感器能更好地适用于数字摄像机。另外,元件在颗粒上排列的纵横比(aspect ratio)决定了像素的几何形状,如,4:3和3:2的纵横比分别用于数字摄像机和35毫米的胶片。传感器配置的细节值得读者去理解,这样才能够设计出最好的传感器处理过程和图像预处理程序。

1.1.4 动态范围和噪声
当前,最先进的传感器每个颜色单元能提供至少8个比特位,通常是12~14个比特位。传感器元件需要花费空间和时间来聚集光子,所以较小的元件必须经过精心设计,以避免产生一些问题。噪声可能来自于所用的光学元件、颜色滤波器、传感器元件、增益和A/D转换器、后期处理过程或者压缩方法等。传感器的读出噪声也会影响到实际的分辨率,因为每个像素单元从传感器中读出再传到A/D转换器中,从而组成数字形式的行和列,以便用于像素转换。越好的传感器会产生越少的噪声,同时会得到更高效的比特分辨率。Ibenthal [409]的工作是降噪方面的好文献。

另外,传感器光子吸收对每种颜色会有所不同,对蓝色有可能有些问题,即对于较小的传感器成像而言这是最难的一种颜色。在某些情况下,生产商会试图在传感器中为每种颜色内建一个简单的伽马曲线修正方法,但这种方法并不值得提倡。在对彩色有需求的应用中,可以考虑色度设备模型和颜色管理(在第2章会再次讨论到这个主题),甚至让传感器的每种颜色通道具有非线性特征并建立一系列简单的校正查找表(Lookup Table, LUT)转换(适用于深度感知的噪声过滤方法在第2章还会介绍)。

1.1.5 传感器处理
传感器处理用于从传感器阵列中去马赛克并聚集像素,也用于校正感知瑕疵。在这一节我们会讨论传感器处理基础。

通常在每个成像系统中都有一个专有的传感器处理器,包括一个快速HW传感器接口、优化的超长指令集(very long instruction word,VLIW)、单指令多数据流(single instruction multiple data, SIMD)指令以及具有固定功能的硬件模块,这些功能是为了解决大规模并行像素处理所造成的工作负载。通常,传感器处理过程透明且自动化,并由成像系统的生产厂商设置,来自传感器的所有图像均以同样的方式处理。也存在用于提供原始数据的其他方式,这些数据允许针对应用来定制传感器处理过程,就像数字摄影那样。

1.1.6 去马赛克
根据不同的传感器元件配置(如图1-5所示),可利用各种去马赛克算法将原始传感器数据生成最终的RGB像素。Losson &Yang[406]还有Li等人[407]分别给出了两篇非常好的综述文献,这些文献介绍了各种方法以及所面临的挑战等。

去马赛克的一个主要挑战之一是像素插值,其作用是将邻近单元的颜色通道组合成单个像素。在给定传感器元件排列的几何形状以及单元排列的纵横比的条件下,这是一个重要的问题。一个与之相关的问题是颜色单元的加权问题,如在每个RGB像素中每种颜色应该占多少比例。因为在马赛克传感器中,空间元件分辨率大于最终组合的RGB像素分辨率,某些应用需要原始传感器数据,以便尽可能利用所有的精度和分辨率,或者有些处理要么需要增强有效的像素分辨率,要么需要更好地实现空间精确的颜色处理和去马赛克处理。

1.1.7 坏像素的校正
像LCD显示器一样,传感器也可能会有坏像素。通过在摄像机模块或驱动程序中提供需要校正的坏像素坐标,供应商可以在工厂校正传感器,并为已知的缺陷提供一个传感器缺陷图。在某些情况下,自适应的缺陷校正方法[408]会用在传感器上,以便监控邻近像素点来发现缺陷,然后校正一定范围内的缺陷类型,比如单像素缺陷、列或行缺陷以及类似2×2或3×3的块状缺陷。为了实时寻找瑕疵,摄像机驱动也可提供自适应的缺陷分析,在摄像机的启动菜单中可能会提供一个特殊的补偿控制。

1.1.8 颜色和照明校正
有必要进行颜色校正以便平衡总的颜色精确度和白平衡。如图1-2所示,硅传感器上对红色和绿色这两种颜色通常很敏感,但是对蓝色却不敏感,因此,理解和标定传感器是得到最精确颜色的基本工作。

大多数图像传感器的处理器包含了用于光晕校正的几何处理器,这在图像的边缘表现为光照更暗,如第7章的图7-6所示。校正基于几何扭曲函数,可考虑可编程的光照功能来增加朝向边缘的光照,这需要在出厂前进行标定,以便与光学的光晕模式相匹配。文献[490]介绍了光晕的图像扭曲方法。

1.1.9 几何校正
镜头可能会有几何相差或朝边缘发生扭曲,产生径向失真的图像,与上述讨论的光晕有关的问题将在第7章(如图7-6所示)讨论。为了解决镜头畸变,大多数成像系统具有专用的传感器处理器,它有一个硬件加速的数字扭曲元件,类似于GPU上的纹理采样器。在工厂就会针对光学器件的几何校正进行校准并编程。更多的介绍可参考文献[490]对图像扭曲方法的讨论。

相关文章
|
14天前
|
JSON 前端开发 JavaScript
【JavaScript技术专栏】JavaScript异步编程:Promise、async/await解析
【4月更文挑战第30天】JavaScript中的异步编程通过Promise和async/await来解决回调地狱问题。Promise代表可能完成或拒绝的异步操作,有pending、fulfilled和rejected三种状态。它支持链式调用和Promise.all()、Promise.race()等方法。async/await是ES8引入的语法糖,允许异步代码以同步风格编写,提高可读性和可维护性。两者结合使用能更高效地处理非阻塞操作。
|
17天前
|
Cloud Native Linux 开发者
【Docker】Docker:解析容器化技术的利器与在Linux中的关键作用
【Docker】Docker:解析容器化技术的利器与在Linux中的关键作用
|
1天前
|
安全 程序员 网络安全
解析编程中的技术迷题:常见挑战与应对策略
解析编程中的技术迷题:常见挑战与应对策略
5 1
|
1天前
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
|
2天前
|
机器学习/深度学习 人工智能 算法
构建高效AI系统:深度学习优化技术解析
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中,如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略,如自适应学习率调整、梯度累积技巧以及正则化方法,并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析,还结合实例说明如何在实际项目中应用这些优化技术。
|
4天前
|
负载均衡 关系型数据库 MySQL
MySQL读写分离技术深度解析
在高并发、大数据量的互联网应用环境中,数据库作为数据存储的核心组件,其性能直接影响着整个系统的运行效率。MySQL作为最常用的开源关系型数据库之一,虽然功能强大,但在处理大量并发读写请求时,单点服务器的性能瓶颈逐渐显现。为了解决这一问题,MySQL读写分离技术应运而生,成为提升数据库性能、实现负载均衡的有效手段。
|
5天前
|
编解码 监控 算法
计算机视觉(CV)技术的优势和挑战
计算机视觉(CV)技术的优势和挑战
10 2
|
5天前
|
存储 SQL 自然语言处理
RAG技术全解析:打造下一代智能问答系统
一、RAG简介 大型语言模型(LLM)已经取得了显著的成功,尽管它们仍然面临重大的限制,特别是在特定领域或知识密集型任务中,尤其是在处理超出其训练数据或需要当前信息的查询时,常会产生“幻觉”现象。为了克服这些挑战,检索增强生成(RAG)通过从外部知识库检索相关文档chunk并进行语义相似度计算,增强了LLM的功能。通过引用外部知识,RAG有效地减少了生成事实不正确内容的问题。RAG目前是基于LLM系统中最受欢迎的架构,有许多产品基于RAG构建,使RAG成为推动聊天机器人发展和增强LLM在现实世界应用适用性的关键技术。 二、RAG架构 2.1 RAG实现过程 RAG在问答系统中的一个典型
39 2
|
7天前
|
机器学习/深度学习 算法 物联网
LISA微调技术解析:比LoRA更低的显存更快的速度
LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。
|
11天前
|
机器学习/深度学习 监控 自动驾驶
计算机视觉技术及其应用:开启智能视觉新时代
【5月更文挑战第3天】计算机视觉技术融合图像处理、模式识别和人工智能,旨在让计算机理解和解析图像信息。关键包括图像预处理、特征提取、深度学习和目标检测。广泛应用在安防监控、自动驾驶、医疗影像分析、人脸识别及智能家居等领域,引领智能视觉新时代。随着技术发展,未来将带来更多便捷。

推荐镜像

更多