欢迎光临JDL人脸检测/识别研究组
Paper Reading
主页

 

PPT模版

2009年之前的报告内容请点此处


   

094

   

马志国

报告时间

2010.02.26

文章信息

Victor Lempitsky, Pushmeet Kohli, Carsten Rother, and Toby Sharp.Image Segmentation with A Bounding Box Prior, ICCV 2009

资料下载

文章     PPT    

文章摘要

◆用户提供的矩形边框,在现有的交互式图像分割框架中,被认为是一种简单和流行的交互方式。但这些框架仅利用提供的边框将边框外的部分排除在外,以此作为能量最小化的初始化。本文中,我们讨论如何进一步利用边框提供的拓扑先验,确保分割结果与边框保持足够的紧致性。

◆拓扑先验被表示为全局能量最小化框架中的严格约束,推导为整数规划问题。通过线性松驰和pinpointing的图割算法,可以近似求解上述的整数规划问题。

◆公共的数据集上的定性及定量的实验展示了新的先验的有效性。

简单评述

 


 

CVPR 2009 Paper Review

序号

日期

讲解人

01

2009-08-28

洪晓鹏(PPT) 马志国(PPT)

02

2009-09-04

陈 静(PPT)

03
2009-09-11
李安南(PPT) 谢术富(PPT)
04
2009-09-18
李 哲(PPT) 阚美娜(PPT)
05
2009-09-25
项 翔(PPT) 路 亮(PPT)
06
2009-10-16
翟德明(PPT) 都大龙(PPT)
07
2009-10-23
杨 涛(PPT)
08
2009-10-30

洪晓鹏(PPT) 蒋长征(PPT)任昊宇(PPT

09
2009-11-06

王 丹(PPT)

10
2009-11-13

缑 丹(PPT)

11
2009-11-27

都大龙(PPT) 池  晨(PPT)

12
2009-12-04
韩 琥(Video PPT)
13
2009-12-11
吉娜烨(PPT)

 

   

093

   

翟德明

报告时间

2009.7.24

文章信息

Fei Wang, Xin Wang and Tao Li, "Beyond the Graphs: Semi-parametric Semi-supervised Discriminant Analysis", CVPR 2009

资料下载

文章     PPT    

文章摘要

n  线性判别分析(LDA)是一种流行的特征提取方法,在计算机视觉和模式识别领域中激发了相当多研究者的兴趣。LDA的投影向量通常是通过最大化数据集的类间散度同时最小化类内散度来获得的。然而,在实际中,通常缺乏足够多的有标注数据,这就使得对我们所估计的投影方向不准确。

n  为了解决上面的限制,在这篇文章中,我们提出了一种新的半监督判别分析方法。与传统的基于图的方法不同,我们所提出的方法将有标注数据和未标注数据之间的几何分布信息通过半参数化的形式加入进来。

n  具体的,最终所获得的判别投影包含两部分:判别的部分(在有标注数据上利用传统LDA或是KDA);保持几何结构的部分(在所有样本点上通过 KPCA学习得到)。因此,我们命名我们的算法版参数化的半监督判别分析(SSDA)。在人脸识别和图像任务上的实验结果表明了我们方法的有效性。

简单评述

 

问题汇总

 

 

   

092

   

翟艺涛

报告时间

2009.7.10

文章信息

Shuicheng Yan and Huan Wang, "Semi-supervised Learning by Sparse Representation", SDM 2009

资料下载

文章     PPT    

文章摘要

n  本文中,我们提出了一种基于L1 Graph的半监督学习框架。L1 Graph 受启发与每个样本可以通过训练数据的稀疏线性加和进行重建。通过一个求解L1优化问题,可以得到稀疏重建的系数,然后利用这些系数作为L1 Graph的边的权重。

n  传统的构造图的方法包含两个独立的步骤:确定边是否邻接;计算边的权重。L1 Graph将这两个步骤合并进行,而且构造L1 Graph的过程是与参数无关的。

n  受启发与稀疏表示在人脸识别领域的成功应用,我们提出了基于L1-Graph的半监督学习框架。在半监督人脸识别与图像分类上的大量实验证明了我们的L1-Graph框架的优越性。

简单评述

 

问题汇总

 

 

   

091

   

王丹

报告时间

2009.6.24

文章信息

Zhuowen Tu and Song-Chun Zhu, "Image segmentation by data driven Markov chain Monte Carlo", PAMI 2002

资料下载

文章     PPT    

文章摘要

n  本文提出了一种Bayesian统计框架下,数据驱动的马尔科夫链蒙特卡罗(DDMCMCData-driven Markov Chain Monte Carlo)范式用以图像分割。本文在图像分割上的贡献分四个方面。

n  首先,设计了一种有效、平衡的Markov动态链以研究复杂的解空间,并因此求得不依赖初始分割的近似全局最优解。

n  第二,提出了一个数学定理和K-adventurers算法以从Markov序列计算多重distinct解。因此,它结合了图像分割的内在歧义性。

n  第三,利用聚类、边缘检测等数据驱动(自底向上)技术计算重要性概率,从而驱动Markov链动态变化,比传统的方法有极大的速度提升。

n  第四,DDMCMC范式为很多已提出的分割算法的应用提供了统一的框架,边缘检测、聚类、区域生长等在该框架下或用以实现Markov链动态变化,或用以计算重要性概率,各有所用。因此,DDMCMC范式在一定的规则下,结合并推广了这些分割方法。

n  DDMCMC范式采用了7个参数和非参数图像模型对各种区域的灰度和彩色建模。我们在灰度和彩色图像上对DDMCMC进行实验,并在文章中报告了一些结果。

简单评述

 

问题汇总

 

 

   

090

   

蒋长征

报告时间

2009.6.19

文章信息

Ming Yang, Zhimin Fan, Jialue Fan and Ying Wu, "Tracking Non-stationary Visual Appearances by Data-driven Adaptation", TIP 2009

资料下载

文章     PPT    

文章摘要

n  在视觉跟踪中,在对目标没有任何先验时,表观通常是唯一可获取的线索。但是,总体上,表观通常是不稳定的,从而会破坏原本定义的视觉度量并导致跟踪失败。

n  一个很自然的解决方案就是使观测模型适应不稳定的表观。然而,这个方案因为其内在的病态本质会产生适应性漂移,除非能加上好的数据驱动约束。

n  不同于大多数现存的适应性方案,我们强化了三种新的约束:

n  1)反例数据

n  2)自底向上的成对的数据约束

n  3)适应性的动态约束

n  本文将一般的适应性问题实质化为一种子空间的适应性问题,提出了一种闭合的解决方案和一种可行的迭代算法。

n  大量实验证明这种方案可以很大程度上缓和适应性的漂移,在大量不稳定表观的应用场景中获得了更好的跟踪结果。

简单评述

 

问题汇总

 

 

   

089

   

缑丹

报告时间

2009.6.12

文章信息

Pawan Sinha, Benjamin Balas, Yuri Ostrovsky, Richard Russell, "Face Recognition by Humans: Nineteen Results All Computer Vision Researchers Should Know About", Proceedings of the IEEE 2006

资料下载

文章     PPT    

文章摘要

n  计算机视觉一个重要的目标是要制造出一个自动的人脸识别系统,使得它的性能可以与人类的能力媲美,甚至超越人类。

n  为了达到这个目标,对于计算机视觉的研究者们而言,了解那些通过对人类识别能力进行实验分析所得到的关键结论非常重要。这些结论揭示了人类视觉系统的出色性能所依赖的机制,并为人工系统超越人类的能力提供了基础条件。

n  在这篇文章中,我们给出了我们所认为最基本的19个结论,以及它们对设计智能系统的影响。

n  我们对每一个结论都进行了简短的陈述,并提供了适当的提示,以便人们对任意一个结论进行进一步的研究。

简单评述

 

问题汇总

 

 

   

088

   

杨涛

报告时间

2009.6.5

文章信息

Dashan Gao, Nuno Vasconcelos, "Decision-Theoretic Saliency: Computational Principles,Biological Plausibility, and Implications for Neurophysiology and Psychophysics", Neural Computation 2009

资料下载

文章     PPT    

文章摘要

n  视觉场景中给定位置处的视觉特征显著性定义成这些特征的判别能力。将显著性检测看成一个判别过程。

n  对于自底向上的显著性,判别能力根据信息理论定义。最优显著性检测器从一类视觉刺激导出,这些视觉刺激符合已知自然图像的统计特性。

n  结果显示,在检测器由线性滤波器驱动的假设下,最优检测器跟标准的V1(初级视皮层)结构一致。并且这种检测器能反应心理物理学的基本性质:刺激跳出,显著性非对称,韦伯定律。

简单评述

 

问题汇总

 

 

   

087

   

任昊宇

报告时间

2009.5.22

文章信息

Christian Wojek, Stefan Walk and Bernt Schiele, "Multi-Cue Onboard Pedestrian Detection", CVPR 2009

资料下载

文章     PPT    

文章摘要

n  本文在使用扫描窗口策略的情况下,系统性地评测了不同特征与不同分类器的组合的人体检测系统的性能;

n  引入动作信息会显著提升人体检测系统的性能,同时不同类型特征组合也会带来一定程度的性能提升;

n  我们在4个不同的数据集上做了大量实验,实验表明特征-分类器组合的选择对于检测性能至关重要.

简单评述

 

问题汇总

 

 

   

086

   

路亮

报告时间

2009.5.8

文章信息

David Cristinacce, Tim Cootes, "Automatic feature localization with constrained local models", PR 2008

资料下载

文章     PPT    

文章摘要

n  我们提出了一种高效鲁棒的特征点定位方法。通过训练集我们可以构建一个每个特征点表观及其相应位置的联合模型。

n  本文中采用的表观模型与Cootes提出的AAM方法类似,不同之处在于,本文的方法中表观模型用于生成特征模板,而非直接去近似原图像中的像素。

n  通过实验证明了本文的Constrained Local Model (CLM)方法比AAM更为鲁棒和精确,同时证明了该方法在tracking时的性能提升。

简单评述

 

问题汇总

 

 

   

085

   

阚美娜

报告时间

2009.4.24

文章信息

Xudong Jiang, Bappaditya Mandal, and Alex Kot,"Eigenfeature Regularization and Extraction in Face Recognition", PAMI 2008

资料下载

文章     PPT    

文章摘要

n  本文提出了一种从人脸图像中提取和正则化本征特征的子空间方法。

n  类内散度矩阵的特征空间被分解为三个子空间:主要由面部变化张成的可靠的子空间,由噪声和有限样本导致的不稳定子空间,以及零空间。

n  基于特征谱模型,分别在这三个子空间中对本征特征进行不同的正则化,从而减轻了不稳定、过拟合、推广能力差的问题。也使得判别估计在整个空间进行。特征提取和降维只是在最后一个阶段进行,而这是判别估计之后的。这些工作使得人脸图像的判别性的、稳定的低维特征表示更加容易了。

n  实验在FERETORLARGT数据集上比较了提出的方法和其他流行的子空间方法,表明我们的方法一致的优于其他方法。

简单评述

 

问题汇总

 

 

   

084

   

索津莉

报告时间

2009.4.16

文章信息

Nikos Komodakis, Georgios Tziritas, "Image Completion Using Efficient Belief Propagation via Priority Scheduling and Dynamic Pruning", TIP 2007

资料下载

文章     PPT    

文章摘要

n  本文提出一个基于样例的图像编辑框架,将图像补齐,纹理合成和inpainting统一进行处理。

n  为了避免图像编辑结果整理视觉效果不一致的现象,文中将图像编辑形式化为一个离散的全局优化问题。优化目标函数对应于离散马尔可夫随机场(MRF)的能量。

n  为了有效地优化该马尔可夫随机场,作者将传统的信念传播(BP)算法进行了两点改进:基于优先级的消息调度和动态标号约减。这两点改进极大地缩短了传统的BP算法中的计算时间。

n  该算法对多种输入图像的处理结果都证明了该框架对于图像补齐,纹理合成以及inpainting的有效性。

简单评述

 

问题汇总

 

 

   

083

   

谢术富

报告时间

2009.4.9

文章信息

Dacheng Tao, Xuelong Li, Xindong Wu, and Stephen J.Maybank, "Geometric Mean for Subspace Selection", PAMI 2009

资料下载

文章     PPT    

文章摘要

n  子空间选择方法是模式分类和数据可视化的有力工具.一种最重要的子空间方法是Fisher线性判别分析(FLDA)中的线性降维.它已经被成功应用到许多领域中,如生物学,生物信息学和多媒体信息管理.

n  然而,FLDA中的线性降维存在一个严重的缺点:对于c类的分类任务,如果投影子空间的维数严格地低于c-1,那么,投影将易于合并那些在原始空间中距离比较近的类别.如果各类样本采样自具有同方差的高斯分布, FLDA中的线性降维将最大化不同类别之间KL散度的平均值.

n  基于这一点,本文研究了基于几何均值的子空间选择.本文分析了三条准则: 1) 最大化KL散度的平均值. 2) 最大化归一化KL散度的平均值. 3) 1)2)的组合.

n  基于合成数据UCI机器学习库和手写字体的初步实验结果表明, 3条准则是一种潜在的判别子空间选择方法.FLDA以及它的几种典型性的扩展相比, 它能够较大程度上解决类可分问题.

简单评述

 

问题汇总

 

 

   

082

   

王瑞平

报告时间

2009.4.2

文章信息

Dong Xu, and Shih-Fu Chang, "Video Event Recognition Using Kernel Methods with Multilevel Temporal Alignment", PAMI 2008

资料下载

文章     PPT    

文章摘要

n  本文系统研究新闻视频序列中的事件识别问题。作者采用了基于核学习的判别式方法(SVM),在该方法中视频片段的相似性度量发挥了很大作用。

n  首先,将一个视频片段表示为一组无序描述子,这些描述子通过视频片段中的每一帧提取得到。然后,采用EMD距离融合两段视频各帧之间的相似度。

n  注意到,一个视频片段通常由对应于事件演化进程的多个子片断构成,作者进一步建立多层时序层级。针对每一级,作者利用带整数约束的EMD距离(Integer-value-constrained EMD),将来自不同子片断的信息进行融合,从而显式地对齐这些子片断。通过融合不同层级的信息,作者提出了“时序对齐层级匹配”(TAPM)方法来度量视频片段的相似性。

n  作者在TRECVID 2005数据库上进行了深入的实验,该数据库包含6800多段视频。实验结果表明:(1) 本文提出的层级匹配方法(TAPM)明显优于单层的EMD匹配(SLEMD)(2) SLEMD方法也远远优于传统的基于单关键帧/多关键帧的方法。

n  此外,作者进行了深入的实验来考察算法的不同方面,包括:SLEMD方法中权重的选择,算法对时序聚类方法的敏感度,时序对齐策略的效果,以及可能的算法加速方案。对实验结果的深入分析进一步表明了通过多层子片断对齐来描述视频事件的直观性。

简单评述

 

问题汇总

 

 

   

081

   

李安南

报告时间

2009.3.19

文章信息

Simon J.D. Prince, James H. Elder, Jonathan Warrell and Fatima M. Felisberti, "Tied Factor Analysis for Face Recognition across Large Pose Differences", PAMI 2008

资料下载

文章     PPT    

文章摘要

n  当注册图像和测试图像的姿态不一致的时候,人脸识别算法变得不可靠,这是因为对于典型的特征向量由于姿态导致的变化大于由身份不同带来的变化。

n  我们提出一种可以将理想中的“身份”空间一对多的映射到观察到数据空间的产生式模型。在“身份”空间中个体并不随姿态变化而变化。在高斯噪声条件下,特征向量可以认为是由“身份”变量通过“姿态可选"的线性变换投影所得到的。我们称这一模型为“联结的”因子分析。线性变换(因子)的选择依赖于姿态,但对于某个特定的人所载荷(loadings)(身份信息)是不变的(联结的)

n  我们使用期望最大化(EM)算法从训练数据中估计线性变换和噪声的参数。我们提出一种允许获取可能的匹配的完整的后验的概率距离度量。

n  我们引入了一种新的特征提取过程并使用FERET,XM2VTSPIE数据库验证识别性能。识别性能和目前的方法相比显得很""

简单评述

 

问题汇总

 

 

   

080

   

韩琥

报告时间

2009.3.5

文章信息

Hyunjung Kate Shim, Jiebo Luo, and Tsuhan Chen, "A Subspace Model-Based Approach to Face Relighting Under Unknown Lighting and Poses", TIP 2008

资料下载

文章     PPT    

文章摘要

n  我们提出了一种在最少输入图像可以为一幅图像的条件下,对人脸图像进行relighting的新方法,该方法能同时估计出光照,姿态和反射函数。基于这些估计结果,我们可以合成任意指定光照下的人脸图像。

n  不同于传统的直接使用人脸形状模型或依赖于人脸形状模型的方法,我们的方法既没有对人脸的三维形状做假设,也没有试图恢复人脸的三维形状。而是在PIEExtYaleB人脸库上,训练了一个依赖于姿态和每个像素的反射函数的子空间模型。

n  利用这个子空间模型,我们可以估计任意人脸图像的光照,姿态和反射函数。该方法具有处理非朗伯反射,胡须以及重现面部阴影的优点,从而保证了该方法的实用性。

n  大量的实验表明,与目前具有代表性的relighting方法相比,在图像主观和客观质量评价方面,我们的方法都能得到更好的结果,并且不需要恢复人脸的三维形状。

简单评述

 

问题汇总

 

 

   

079

   

王琳

报告时间

2009.2.26

文章信息

Siying Liu, Guo Dong, Chye Hwang Yan, Sim Heng Ong, "Video Segmentation: Propagation, Validation and Aggregation of a Preceding Graph", CVPR 2008

资料下载

文章     PPT    

文章摘要

n  视频分割是一种帧内图像的聚类方法,这种方法可以利用时域上的帧间一致性信息来改善分割效果。

n  传统的视频分割方法只是简单地将像素点的运动看成MRF-MAP工作框架下的一个先验信息。对每帧图像来说,像素聚类不能高效的完成,帧间的相关性信息没能充分的利用起来。

n  在本文中,我们利用了帧间的时空局部一致性信息,从前一帧分割图像中来传播可信度大的聚类结果。对前一帧已经标定的图,我们把它传播到当前帧,并且通过相似性措施来验证这个分割结果,所有没有标定的子图都会在空间上做一次最后的聚合从而来得到我们最终的分割结果。

n  实验结果表明我们的方法对时空分割是非常高效的,它充分利用时间上的相关性信息,产生了令人满意的聚类结果。

简单评述

 

问题汇总

 

 

   

078

   

郑伟

报告时间

2009.2.19

文章信息

Matthew B. Blaschko and Christoph H. Lampert, "Learning to Localize Objects with Structured Output Regression", ECCV 2008

资料下载

文章     PPT    

文章摘要

n  窗口扫描分类器是物体检测方法中最成功、应用最广泛的技术。但是训练的过程都不是针对一个检测任务进行的。首先,利用正例和反例训练一个两类分类器,然后这个分类器被顺序的应用在测试图片的多个区域。

n  我们提出一种把物体检测看作是预测结构化数据的问题(a problem of predicting structured data):我们不是用两类分类器来建模这个问题,而是预测物体边界框在图像中的位置。本文利用了一个联合核的框架允许我们把训练的过程形式化成一个广义的SVM,并且可以高效的求解。

n  我们进一步利用brand-and-bound策略同时提高训练和检测的效率。PASCAL VOCTUD数据库上的测试显示结构化的训练过程改进了两类训练过程的性能,并且超过了以前报告的最好的结果。

简单评述

 

问题汇总

 

 

   

077

   

马志国

报告时间

2009.2.12

文章信息

Ying Nian Wu, ZhangZhang Si, Haifeng Gong, and Song-Chun Zhu, "Active Basis for Modelling, Learning and Recognizing Deformable Templates", IJCV,to appear

资料下载

文章     PPT    

文章摘要

n  本文提出一种主动基模型、共同勾画算法、局部求和及局部求极值的计算架构用于表示、学习、识别可变形模板。

n  在我们的产生式模型中,可变形模板由主动基的形式表示,主动基是一系列特定位置和方向的Gabor小波基。这些小波基可以在位置和方向上进行扰动,通过线性组合表示观察图像。

n  主动基模型中的基元位置和方向从训练图像中利用共同勾画算法学习到。算法从拥有稠密的位置和方向的Gabor小波字典中顺序地选择主动基的基元。当一个基元被选中,这个基元为所有训练图像共享,同时基元会被扰动用来编码(勾画)每个训练图像中的基元附近的边缘片断。

n  图像中可变形模板的识别通过交替的求和图及最值图计算框架实现。最值图的计算将主动基变形来匹配图像数据,求和图的计算则使用变形后的主动基的对数似然对模板匹配进行打分。

简单评述

 

问题汇总

 

 

   

076

   

翟德明

报告时间

2009.1.8

文章信息

Stella X. Yu and Jianbo Shi, "Segmentation Given Partial Grouping Constraints", PAMI2004

资料下载

文章     PPT    

文章摘要

n  图像分割问题可以视为图像中数据点的聚类问题。在这篇文章中,我们要解决在已知部分聚类约束作为先验知识的情况下的数据聚类问题。这种有倾向性的聚类可以形式化为一种有约束的最优化问题,其中数据的结构特性定义了聚类方式,而部分聚类约束线索定义了聚类方式的可行性。

n  我们在有标号的数据点上加入平滑性(smoothness)和公平性(fairness)约束,目的是使稀疏的部分聚类信息更有效的传递到未标注数据上。实际采用NCut的准则函数,我们的形式化描述就变成一种带有约束的特征值求解问题。

n  根据Rayleigh-Ritz理论及投影矩阵的性质,通过特征分解,我们找到无约束连续域上的全局最优解。根据这个最优值,可以有效的求得离散标注问题中的近似全局最优解。

n  我们把提出的方法应用到实际的图像分割问题中,在这里部分聚类的约束先验通常可以来源一种粗糙的空域注意力图(spatial attentional map),这种注意力图能够确定具有共同的显著性特征的位置或者期望的物体位置。文章证明了我们的方法能够把图像结构和先验知识融合到单一的聚类过程中,还证明了在没有明确的目标知识的情况下,目标也可以从背景中被分割出来。

简单评述

 

问题汇总

 

 

下表为空表,作为示例用(勿删除)

   

000

   

 

报告时间

 

文章信息

 

资料下载

  文章    PPT

文章摘要

原文摘要的准确中文 翻译,由讲者负责完成

 

 

 

 

简单评述

讲者完成

 

 

 

问题汇总
主持人完成