备案控制台

开发者社区

开发者社区云计算文章正文

论文阅读：Prominent Object Detection and Recognition: A Saliency-based Pipeline

2017-04-28 997

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 论文阅读：Prominent Object Detection and Recognition: A Saliency-based Pipeline 如上图所示，本文旨在解决一个问题：给定一张图像，我们最应该关注哪些区域？怎么将其分割出来？这是一个什么东东？这三个子问题为一体。

论文阅读：Prominent Object Detection and Recognition: A Saliency-based Pipeline

如上图所示，本文旨在解决一个问题：给定一张图像，我们最应该关注哪些区域？怎么将其分割出来？这是一个什么东东？这三个子问题为一体。

Problem formulation: Given an image, determine the most influential item in the scene in terms of region of interest, pixel-level extent (segmentation), and object type.

作者提出的框架为：

可以发现，上述流程图就是各个需要完成任务的级联和组合。

网络的训练也是各个级别依次完成的。没啥好说的。

有些实验结果看起来还是挺烂的：

有的看起来还可以，但是也不怎么好：

关键词：

阅读object

object recognition

wangxiaocvpr

目录

相关文章

AiCharm

|

11月前

|

机器学习/深度学习算法数据可视化

深度学习论文阅读目标检测篇（一）：R-CNN《Rich feature hierarchies for accurate object detection and semantic...》

过去几年，在经典数据集PASCAL上，物体检测的效果已经达到一个稳定水平。效果最好的方法是融合了多种低维图像特征和高维上下文环境的复杂集成系统。在这篇论文里，我们提出了一种简单并且可扩展的检测算法，可以在VOC2012最好结果的基础上将mAP值提高30%以上——达到了53.3%。

AiCharm

121 0 0

深度学习论文阅读目标检测篇（一）：R-CNN《Rich feature hierarchies for accurate object detection and semantic...》

AiCharm

|

11月前

|

机器学习/深度学习编解码并行计算

深度学习论文阅读目标检测篇（七）中文版：YOLOv4《Optimal Speed and Accuracy of Object Detection》

大多数基于 CNN 的目标检测器基本上都仅适用于推荐系统。例如：通过城市摄像头寻找免费停车位，它由精确的慢速模型完成，而汽车碰撞警报需要由快速、低精度模型完成。改善实时目标检测器的精度，使其能够不仅可以用于提示生成推荐系统，也可以用于独立的流程管理和减少人力投入。传统 GPU 使得目标检测可以以实惠的价格运行。最准确的现代神经网络不是实时运行的，需要大量的训练的 GPU 与大的 mini bacth size。我们通过创建一个 CNN 来解决这样的问题，在传统的 GPU 上进行实时操作，而对于这些训练只需要一个传统的 GPU。

AiCharm

190 0 0

AiCharm

|

11月前

|

机器学习/深度学习编解码并行计算

深度学习论文阅读目标检测篇（七）中英对照版：YOLOv4《Optimal Speed and Accuracy of Object Detection》

有大量的技巧可以提高卷积神经网络（CNN）的精度。需要在大数据集下对这种技巧的组合进行实际测试，并需要对结果进行理论论证。某些技巧仅在某些模型上使用和专门针对某些问题，或只针对小规模的数据集；而一些技巧，如批处理归一化、残差连接等，适用于大多数的模型、任务和数据集。我们假设这种通用的技巧包括加权残差连接（Weighted-Residual-Connection，WRC）

AiCharm

220 0 0

AiCharm

|

11月前

|

机器学习/深度学习传感器编解码

深度学习论文阅读目标检测篇（四）中文版：YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》

我们的统一架构非常快。我们的基础YOLO模型以45帧/秒的速度实时处理图像。FastYOLO是YOLO的一个较小版本，每秒能处理惊人的155帧图像，同时实现其它实时检测器两倍的mAP。与最先进的检测系统相比，YOLO虽然存在较多的定位错误，但很少将背景预测成假阳性（译者注：其它先进的目标检测算法将背景预测成目标的概率较大）。最后，YOLO能学习到目标非常通用的表示。当从自然图像到艺术品等其它领域泛化时，它都优于其它检测方法，包括DPM和R-CNN。

AiCharm

218 0 0

AiCharm

|

11月前

|

机器学习/深度学习编解码算法

深度学习论文阅读目标检测篇（四）中英文对照版：YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》

我们提出了 YOLO，一种新的目标检测方法。以前的目标检测工作重复利用分类器来完成检测任务。相反，我们将目标检测框架看作回归问题，从空间上分割边界框和相关的类别概率。单个神经网络在一次评估中直接从整个图像上预测边界框和类别概率。由于整个检测流水线是单一网络，因此可以直接对检测性能进行端到端的优化。

AiCharm

150 0 0

AiCharm

|

11月前

|

机器学习/深度学习算法数据挖掘

深度学习论文阅读目标检测篇（三）：Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

最先进的目标检测网络依靠region proposal算法来推理检测目标的位置。SPPnet[1]和Fast R-CNN[2]等类似的研究已经减少了这些检测网络的运行时间，使得region proposal计算成为一个瓶颈。在这项工作中，我们引入了一个region proposal网络（RPN），该网络与检测网络共享整个图像的卷积特征，从而使近乎零成本的region proposal成为可能。

AiCharm

257 0 0

LiBiGo

|

11月前

|

机器学习/深度学习人工智能数据可视化

【文章阅读】Frustratingly Simple Few-Shot Object Detection

从几个例子中检测稀有物体是一个新出现的问题。先前的研究表明，元学习是一种很有前途的方法。但是，微调技术几乎没有引起人们的注意。我们发现，仅对稀有类现有检测器的最后一层进行微调对于少镜头目标检测任务是至关重要的。在当前的基准测试中，这种简单的方法比元学习方法高出大约2~20个百分点，有时甚至会使以前的方法的准确率翻一番。

LiBiGo

129 0 0

MiyueFE

|

JavaScript

Vue 2 阅读理解（十五）之响应式系统（一）Object.defineProperty

Vue 2 阅读理解（十五）之响应式系统（一）Object.defineProperty

MiyueFE

146 0 0

秃头小苏

|

传感器自动驾驶算法

论文阅读：RRPN：RADAR REGION PROPOSAL NETWORK FOR OBJECT DETECTION IN AUTONOMOUS VEHICLES

论文阅读：RRPN：RADAR REGION PROPOSAL NETWORK FOR OBJECT DETECTION IN AUTONOMOUS VEHICLES

秃头小苏

278 1 1

论文阅读：RRPN：RADAR REGION PROPOSAL NETWORK FOR OBJECT DETECTION IN AUTONOMOUS VEHICLES

秃头小苏

|

传感器自动驾驶算法

论文阅读：Object Classiﬁcation Using CNN-Based Fusion of Vision and LIDAR in Autonomous Vehicle

论文阅读：Object Classiﬁcation Using CNN-Based Fusion of Vision and LIDAR in Autonomous Vehicle

秃头小苏

102 0 0

论文阅读：Object Classiﬁcation Using CNN-Based Fusion of Vision and LIDAR in Autonomous Vehicle

热门文章

最新文章

云原生最佳实践系列 7：基于 OSS Object FC 实现非结构化文件实时处理

【深入探究Qt内部架构】QObject、事件循环与Q_OBJECT宏的协同作用（一）

【深入探究Qt内部架构】QObject、事件循环与Q_OBJECT宏的协同作用（二）

Qt之Q_OBJECT 宏的神奇之旅（二）

Qt之Q_OBJECT 宏的神奇之旅（一）

介绍一个 webp 格式转 png 格式的软件：XNConvert

MyBatis的动态SQL之OGNL（Object-Graph Navigation Language）表达式以及各种标签的用法

js 字符串String转对象Object

hql投影查询之—— [Ljava.lang.Object; cannot be cast to cn.bdqn.guanMingSys.entity.Notice

Object.defineProperty（js的问题）

Python中的类（Class）和对象（Object）

JS中Map对象与object的区别

多案例理解Object的wait,notify,notifyAll与Thread的sleep,yield,join等方法

如何使用编码方式获取一个 Business Object 的所有 Attachment 数据

编程笔记 html5&css&js 073 JavaScript Object数据类型

在Flink实时任务中，POJO（Plain Old Java Object）对象的模式演进可能会引起不兼容的问题

cannot open shared object file: No such file or directory

Object.assign() - JavaScript

如何使用 ABAP 编程的方式，给 Business Object 创建 attachment

理解 Proxy 和 Object.defineProperty：提升你的 JavaScript 技能(下)

相关电子书

更多

Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition

Multi-Task Multi-Network Joint-Learning of Deep Residual Networks and Cycle-Consistency Generative Adversarial Networks for Robust Speech Recognition

Fast Learning for Non-Parallel Many-to-Many Voice Conversion with Residual Star Generative Adversarial Networks

下一篇

阿里云oss简介和使用流程