52CV-WACV-Papers

官网链接：https://wacv2023.thecvf.com/home

会议日期：2023年1月3日-1月7日

历年综述论文分类汇总戳这里↘️CV-Surveys施工中~~~~~~~~~~

2023 年论文分类汇总戳这里

↘️CVPR-2023-Papers ↘️WACV-2023-Papers

2022 年论文分类汇总戳这里

↘️CVPR-2022-Papers ↘️WACV-2022-Papers ↘️ECCV-2022-Papers

2021年论文分类汇总戳这里

↘️ICCV-2021-Papers ↘️CVPR-2021-Papers

2020 年论文分类汇总戳这里

↘️CVPR-2020-Papers ↘️ECCV-2020-Papers

❗❗❗🌟🌟🌟WACV 2023收录论文已全部公布，下载可在【我爱计算机视觉】后台回复“paper”，即可收到。共计 638 篇。

🐶	🐭	🐹	🐯
65.Open Set Recognition(开集识别)	66.Scene Flow Estimation(场景流估计)	67.Sketches(草图识别)
61.geo-localization(城市地理定位)	62.Dense Prediction(密集预测)	63.Place Recognition(位置识别)	64.Visual Odometry(视觉里程计)
57.Federated Learning(联邦学习)	58.HOI(人物交互)	59.Meta learning(元学习)	60.Image-to-Image Translation(图像-图像翻译)
53.Gaze Estimation(视线估计)	54.Optical Flow(光流)	55.Clustering(聚类)	56.Vision-Language(视觉语言)
49.Neural Radiance(渲染)	50.Contrastive Learning(对比学习)	51.SGG(场景图生成)	52.Human Motion Prediction(人类运动预测)
45.Class-Incremental Learning(类增量学习)	46.Metric Learning(度量学习)	47.Data Augmentation(数据增强)	48.Light Fields(光场)
41.Action Generation(动作生成)	42.Landmark Detection(关键点检测)	43.Active Learning(主动学习)	44.Multi-Task Learning(多任务学习)
37.OT(目标跟踪)	38.Sound(音频处理)	39.Style Transfer(风格迁移)	40.AD(异常检测)
33.View Synthesis(视图合成)	34.SLAM\Robots	35.VQA(视觉问答)	36.Soft Biometrics(软生物技术)
29.Image Classification(图像分类)	30.RL(强化学习)	31.Deepfake Detection(假象检测)	32.Continual Learning(持续学习)
25.Image Captioning(图像字幕)	26.Dataset(数据集)	27.Person ReID(人员重识别)	28.OPE(物体姿态估计)
21.PC(点云)	22.HAR(人体动作识别与检测)	23.AD(智能驾驶)	24.Image Retrieval(图像检索)
17.OCR(文本检测)	18.NAS(神经架构搜索)	19.MC\KD\Pruning(模型压缩\知识蒸馏\剪枝)	20.Transformer
13.Image Segmentation(图像分割)	14.SSL(半监督学习)	15.Image Synthesis(图像合成)	16.SR(超分辨率)
9.RS\Satellite Image(遥感\卫星图像)	10.AL(对抗学习)	11.Face(人脸)	12.FSL or DA\G(小样本学习 or 域适应\泛化)
5.OD(目标检测)	6.Video(视频相关)	7.Pose(人体姿态)	8.Image Processing(图像处理)
1.其它	2.Medical Image(医学影像)	3.3D(三维视觉)	4.GAN(生成对抗网络)

67.Sketches(草图识别)

WHFL: Wavelet-Domain High Frequency Loss for Sketch-to-Image Translation

66.Scene Flow Estimation(场景流估计)

M-FUSE: Multi-frame Fusion for Scene Flow Estimation
⭐code

65.Open Set Recognition(开集识别)

Ancestor Search: Generalized Open Set Recognition via Hyperbolic Side Information Learning

64.Visual Odometry(视觉里程计)

Pixel-Wise Prediction Based Visual Odometry via Uncertainty Estimation

63.Place Recognition(位置识别)

62.Dense Prediction(密集预测)

Dense Prediction With Attentive Feature Aggregation

61.geo-localization(城市地理定位)

TransVLAD: Multi-Scale Attention-Based Global Descriptors for Visual Geo-Localization
⭐code

60.Image-to-Image Translation(图像-图像翻译)

Panoptic-Aware Image-to-Image Translation
图像翻译
- RIFT: Disentangled Unsupervised Image Translation via Restricted Information Flow
域到域翻译
- Learning Style Subspaces for Controllable Unpaired Domain Translation
  ⭐code

59.Meta learning(元学习)

Meta-OLE: Meta-learned Orthogonal Low-Rank Embedding

58.Human Object Interaction(人物交互)

57.Federated Learning(联邦学习)

56.Vision-Language(视觉语言)

55.Clustering(聚类)

Self-Supervised Clustering based on Manifold Learning and Graph Convolutional Networks
⭐code

54.Optical Flow(光流)

53.Gaze Estimation(视线估计)

Searching Efficient Neural Architecture with Multi-resolution Fusion Transformer for Appearance-based Gaze Estimation
iris localization(虹膜定位)
- Segmentation-free Direct Iris Localization Networks
视线跟随
- Patch-level Gaze Distribution Prediction for Gaze Following
视线重定向
- Fine Gaze Redirection Learning with Gaze Hardness-aware Transformation
  ⭐code
- CUDA-GHR: Controllable Unsupervised Domain Adaptation for Gaze and Head Redirection
  ⭐code

52.Human Motion Prediction(人类运动预测)

51.Scene Graph Generation(场景图生成)

50.Contrastive Learning(对比学习)

49.Neural Radiance(渲染)

48.Light Fields(光场)

47.Data Augmentation(数据增强)

Rethinking Rotation in Self-Supervised Contrastive Learning: Adaptive Positive or Negative Data Augmentation
⭐code

46.Metric Learning(度量学习)

InDiReCT: Language-Guided Zero-Shot Deep Metric Learning for Images
⭐code

45.Class-Incremental Learning(类增量学习)

44.Multi-Task Learning(多任务学习)

Cross-task Attention Mechanism for Dense Multi-task Learning
⭐code

43.Active Learning(主动学习)

Randomness is the Root of All Evil:More Reliable Evaluation of Deep Active Learning
🏠project

42.Landmark Detection(关键点检测)

CoKe: Contrastive Learning for Robust Keypoint Detection

41.Action Generation(动作生成)

全身运动合成
- DSAG: A Scalable Deep Framework for Action-Conditioned Multi-Actor Full Body Motion Synthesis

40.Anomaly Detection(异常检测)

39.Style Transfer(风格迁移)

38.Sound(音频处理)

AudioViewer: Learning to Visualize Sounds
🏠project
Audio Visual Event Localization视听事件定位
- AVE-CLIP: AudioCLIP-based Multi-window Temporal Transformer for Audio Visual Event Localization
音频去噪
- BirdSoundsDenoising: Deep Visual Audio Denoising for Bird Sounds
视听分割
- Unsupervised Audio-Visual Lecture Segmentation
  🏠project
生源定位
- Hear The Flow: Optical Flow-Based Self-Supervised Visual Sound Source Localization
  ⭐code
- Exploiting Visual Context Semantics for Sound Source Localization
语音识别
- Audio-Visual Efficient Conformer for Robust Speech Recognition
  ⭐code
音频分离
- SeCo: Separating Unknown Musical Visual Sounds with Consistency Guidance

37.Object Tracking(目标跟踪)

36.Soft Biometrics(软生物技术)

手指静脉识别
- Analysis of Master Vein Attacks on Finger Vein Recognition Systems
隐形眼镜虹膜PAD算法的错误分类
- Misclassifications of Contact Lens Iris PAD Algorithms: Is it Gender Bias or Environmental Conditions
生物信息识别
- Can Shadows Reveal Biometric Information?
虹膜
- DeformIrisNet: An Identity-Preserving Model of Iris Texture Deformation
  ⭐code

35.VQA(视觉问答)

34.SLAM\Robots

33.View Synthesis(视图合成)

32.Continual Learning(持续学习)

31.Deepfake Detection(假象检测)

30.Reinforcement Learning(强化学习)

Switching to Discriminative Image Captioning by Relieving a Bottleneck of Reinforcement Learning
⭐code

29.Image Classification(图像分类)

28.Pose Estimation(姿态估计)

27.Person ReID(人员重识别)

26.Dataset\Benchmark(数据集\基准)

25.Image Captioning(图像字幕)

人体图像分析
- Split To Learn: Gradient Split for Multi-Task Human Image Analysis
图像字幕
- Expert-defined Keywords Improve Interpretability of Retinal Image Captioning
  ⭐code
视频字幕
- Lightweight Video Denoising Using Aggregated Shifted Window Attention
  ⭐code

24.Image Retrieval(图像检索)

23.Autonomous Driving(智能驾驶)

22.Human Action Recognition(人体动作识别与检测)

21.Point Cloud(点云)

20.Transformer

19.Model Compression\Knowledge Distillation\Pruning(模型压缩\知识蒸馏\剪枝)

18.NAS(神经架构搜索)

17.OCR(文本检测)

16.Super-Resolution(超分辨率)

15.Image Synthesis(图像合成)

One-Shot Synthesis of Images and Segmentation Masks
⭐code
Style-Guided Inference of Transformer for High-resolution Image Synthesis
Evaluating Generative Networks Using Gaussian Mixtures of Image Features
More Control for Free! Image Synthesis with Semantic Diffusion Guidance
图像生成
- Adaptively-Realistic Image Generation from Stroke and Sketch with Diffusion Model
  ⭐code🏠project
- Spatially Multi-Conditional Image Generation
  ⭐code
文本-图像合成
- Arbitrary Style Guidance for Enhanced Diffusion-Based Text-to-Image Generation
  ⭐code
文字引导的图像操作
- Interactive Image Manipulation with Complex Text Instructions

14.Un\Self\Semi-Supervised Learning(无\自\半监督学习)

13.Image Segmentation(图像分割)

12.One\Few-Shot Learning or Domain Adaptation\Generalization\Shift(单\小样本学习 or 域适应\泛化\偏移)

11.Face(人脸)

My Face My Choice: Privacy Enhancing Deepfakes for Social Media Anonymization
Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification Using Model Ensembles
⭐code
读唇术
- Towards MOOCs for Lip Reading: Using Synthetic Talking Heads to Train Humans in Lipreading at Scale
3D人脸
- Controllable 3D Generative Adversarial Face Model via Disentangling Shape and Appearance
  🏠project
- 3DMM-RF: Convolutional Radiance Fields for 3D Face Modeling
人脸识别
- DigiFace-1M: 1 Million Digital Face Images for Face Recognition
  ⭐code
- CAST: Conditional Attribute Subsampling Toolkit for Fine-Grained Evaluation
  ⭐code
- CYBORG: Blending Human Saliency Into the Loss Improves Deep Learning-Based Synthetic Face Detection
- Unifying Margin-Based Softmax Losses in Face Recognition
- Harnessing Unrecognizable Faces for Improving Face Recognition
- QMagFace: Simple and Accurate Quality-Aware Face Recognition
  ⭐code
- A Quality Aware Sample-to-Sample Comparison for Face Recognition
人脸修复/恢复
- Nested Deformable Multi-head Attention for Facial Image Inpainting
  ⭐code
- AT-DDPM: Restoring Faces degraded by Atmospheric Turbulence using Denoising Diffusion Probabilistic Models
人脸交换
- FaceOff: A Video-to-Video Face Swapping System
- FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping
- FastSwap: A Lightweight One-Stage Framework for Real-Time Face Swapping
  ⭐code
人脸表情识别
- Uncertainty-aware Label Distribution Learning for Facial Expression Recognition
  ⭐code
- 微表情识别
  - RNAS-MER: A Refined Neural Architecture Search With Hybrid Spatiotemporal Operations for Micro-Expression Recognition
人脸重现
- Audio-Visual Face Reenactment
  🏠project
人脸命名
- Weakly Supervised Face Naming with Symmetry-Enhanced Contrastive Loss
人脸重建
- ReEnFP: Detail-Preserving Face Reconstruction by Encoding Facial Priors
人脸合成
- Scaling Neural Face Synthesis to High FPS and Low Latency by Neural Caching
- CG-NeRF: Conditional Generative Neural Radiance Fields for 3D-aware Image Synthesis
Deepfake
- Proactive Deepfake Defence via Identity Watermarking
Facial Action Unit Detection
- FAN-Trans: Online Knowledge Distillation for Facial Action Unit Detection
人脸质量评估
- IFQA: Interpretable Face Quality Assessment
  ⭐code
活体检测
Domain Invariant Vision Transformer Learning for Face Anti-Spoofing
基于表情的脸部皱纹合成
- Mesh-Tension Driven Expression-Based Wrinkles for Synthetic Faces
文字和图像引导的3D头像生成
- Text and Image Guided 3D Avatar Generation and Manipulation
说话人脸
- Towards Generating Ultra-High Resolution Talking-Face Videos with Lip synchronization
唇语阅读
- Towards MOOCs for Lipreading: Using Synthetic Talking Heads to Train Humans in Lipreading at Scale

10.Adversarial Learning(对抗学习)

9.Remote Sensing\Satellite Image(遥感\卫星图像)

8.Image Processing(图像处理)

7.Human Pose(人体姿态)

6.Video(视频相关)

A Deep Neural Framework to Detect Individual Advertisement (Ad) from Videos
TCAM: Temporal Class Activation Maps for Object Localization in Weakly-Labeled Unconstrained Videos
⭐code
Recipe2Video: Synthesizing Personalized Videos from Recipe Texts
视频增强
- Fast and Accurate: Video Enhancement Using Sparse Depth
视频理解
- Event-Specific Audio-Visual Fusion Layers:A Simple and New Perspective on Video Understanding
- ViewCLR: Learning Self-supervised Video Representation for Unseen Viewpoints
- 通用事件边界检测
  - Motion Aware Self-Supervision for Generic Event Boundary Detection
    ⭐code
视频摘要
- Contrastive Losses Are Natural Criteria for Unsupervised Video Summarization
  ⭐code
- Progressive Video Summarization via Multimodal Self-Supervised Learning
多人检测
- Two-level Data Augmentation for Calibrated Multi-view Detection
  ⭐code
场景识别
- MovieCLIP: Visual Scene Recognition in Movies
  🏠project
Video Grounding
- Language-free Training for Zero-shot Video Grounding
视频异常检测(VAD)
- DyAnNet: A Scene Dynamicity Guided Self-Trained Video Anomaly Detection Network
- Cross-Domain Video Anomaly Detection without Target Domain Adaptation
- Bi-Directional Frame Interpolation for Unsupervised Video Anomaly Detection
- Towards Interpretable Video Anomaly Detection
- Normality Guided Multiple Instance Learning for Weakly Supervised Video Anomaly Detection
图像视频编解码
- Universal Deep Image Compression via Content-Adaptive Optimization with Adapters
  ⭐code
- A neural video codec with spatial rate-distortion control
- Boosting Neural Video Codecs by Exploiting Hierarchical Redundancy
- Neural Distributed Image Compression with Cross-Attention Feature Alignment
  ⭐code
- Lossy Image Compression with Quantized Hierarchical VAEs
视频人像合成
- Dynamic Neural Portraits
视频帧插值
- Splatting-based Synthesis for Video Frame Interpolation
  🏠project
- FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation
  🏠project
- Enhanced Bi-directional Motion Estimation for Video Frame Interpolation
  ⭐code
视频运动重定位
- Cross-Identity Video Motion Retargeting With Joint Transformation and Synthesis
  ⭐code
视频运动放大
- Lightweight Network For Video Motion Magnification
  ⭐code
视频稳定
- GlobalFlowNet: Video Stabilization using Deep Distilled Global Motion Estimates
  ⭐code
- Sim2RealVS: A New Benchmark for Video Stabilization with a Strong Baseline
视频分类
- MASTAF: A Model-Agnostic Spatio-Temporal Attention Fusion Network for Few-shot Video Classification
  🏠project
- Visually explaining 3D-CNN predictions for video classification with an adaptive occlusion sensitivity analysis
  ⭐code
视频分割
- LiveSeg: Unsupervised Multimodal Temporal Segmentation of Long Livestream Videos
视频伪造检测
- Watch Those Words:Video Falsification Detection Using Word-Conditioned Facial Motion
视频跟踪
- PreViTS: Contrastive Pretraining with Video Tracking Supervision

Name	Name	Last commit message	Last commit date
Latest commit 52CV Update README.md Jan 16, 2023 fd8fffc · Jan 16, 2023 History 91 Commits
README.md	README.md	Update README.md	Jan 16, 2023

52CV/WACV-2023-Papers

Folders and files

Latest commit

History

Repository files navigation

52CV-WACV-Papers

历年综述论文分类汇总戳这里↘️CV-Surveys施工中~~~~~~~~~~

2023 年论文分类汇总戳这里

2022 年论文分类汇总戳这里

2021年论文分类汇总戳这里

2020 年论文分类汇总戳这里

❗❗❗🌟🌟🌟WACV 2023收录论文已全部公布，下载可在【我爱计算机视觉】后台回复“paper”，即可收到。共计 638 篇。

目录

67.Sketches(草图识别)

66.Scene Flow Estimation(场景流估计)

65.Open Set Recognition(开集识别)

64.Visual Odometry(视觉里程计)

63.Place Recognition(位置识别)

62.Dense Prediction(密集预测)

61.geo-localization(城市地理定位)

60.Image-to-Image Translation(图像-图像翻译)

59.Meta learning(元学习)

58.Human Object Interaction(人物交互)

57.Federated Learning(联邦学习)

56.Vision-Language(视觉语言)

55.Clustering(聚类)

54.Optical Flow(光流)

53.Gaze Estimation(视线估计)

52.Human Motion Prediction(人类运动预测)

51.Scene Graph Generation(场景图生成)

50.Contrastive Learning(对比学习)

49.Neural Radiance(渲染)

48.Light Fields(光场)

47.Data Augmentation(数据增强)

46.Metric Learning(度量学习)

45.Class-Incremental Learning(类增量学习)

44.Multi-Task Learning(多任务学习)

43.Active Learning(主动学习)

42.Landmark Detection(关键点检测)

41.Action Generation(动作生成)

40.Anomaly Detection(异常检测)

39.Style Transfer(风格迁移)

38.Sound(音频处理)

37.Object Tracking(目标跟踪)

36.Soft Biometrics(软生物技术)

35.VQA(视觉问答)

34.SLAM\Robots

33.View Synthesis(视图合成)

32.Continual Learning(持续学习)

31.Deepfake Detection(假象检测)

30.Reinforcement Learning(强化学习)

29.Image Classification(图像分类)

28.Pose Estimation(姿态估计)

27.Person ReID(人员重识别)

26.Dataset\Benchmark(数据集\基准)

25.Image Captioning(图像字幕)

24.Image Retrieval(图像检索)

23.Autonomous Driving(智能驾驶)

22.Human Action Recognition(人体动作识别与检测)

21.Point Cloud(点云)

20.Transformer

19.Model Compression\Knowledge Distillation\Pruning(模型压缩\知识蒸馏\剪枝)

18.NAS(神经架构搜索)

17.OCR(文本检测)

16.Super-Resolution(超分辨率)

15.Image Synthesis(图像合成)

14.Un\Self\Semi-Supervised Learning(无\自\半监督学习)

13.Image Segmentation(图像分割)

12.One\Few-Shot Learning or Domain Adaptation\Generalization\Shift(单\小样本学习 or 域适应\泛化\偏移)

11.Face(人脸)

10.Adversarial Learning(对抗学习)

9.Remote Sensing\Satellite Image(遥感\卫星图像)

8.Image Processing(图像处理)

7.Human Pose(人体姿态)

6.Video(视频相关)

5.Object Detection(目标检测)

4.GAN(生成对抗网络)

3.3D(三维视觉)

2.Medical Image(医学影像)

1.其它

Packages