Publications · Jing Zhang

arXiv

UHR-Micro: Diagnosing and Mitigating the Resolution Illusion in Earth Observation VLMs

S Ni, T Wang, J Zhang#, H Chen, H Guo, N Zhang, B Du

arXiv, 2026

arXiv

Seirenes: Adversarial Self-play with Evolving Distractions for LLM Reasoning

C Zhang, H Qiu, Q Zhang, Y Xu, X Gao, J Zhang#

arXiv, 2026

arXiv

DocScope: Benchmarking Verifiable Reasoning for Trustworthy Long-document Understanding

X Feng, J Zhou, Z Huang, K Wang, S Ye, J Hu, Z Chen, Y Luo, J Zhang#

arXiv, 2026

ICML

Any2Any: Unified Arbitrary Modality Translation for Remote Sensing

H Chen, J Zhang#, H Wang, S Wang, P Huang, J Li, H Guo, D Wang

ICML, 2026

ICML

Text Before Vision: Staged Knowledge Injection Matters for Agentic RLVR in Ultra-high-resolution Remote Sensing Understanding

F Wang, M Chen, Y Li, Y Yang, Y Zhou, D Wang, Y Zhang, H Wang, H Zhao, H Sun, L Lan, J Song, Y Wang, J Zhang, W Zhang, B Du

ICML, 2026

ICML

Degradation-aware Metric Prompting for Hyperspectral Image Restoration

B Wang, D Wang, H Guo, Y Fu, J Zhang#

ICML, 2026

arXiv

SAMe: A Semantic Anatomy Mapping Engine for Robotic Ultrasound

J Zhang, D Chen, W Jiang, Z Lou, J Liu, X Cui, Q Zhao, B Du, CF Dietrich

arXiv, 2026

ACL

Omni-I2C: A Holistic Benchmark for High-fidelity Image-to-code Generation

J Zhou, C Zhang, X Feng, Q Zhang, H Qiu, L He, D Ye, X Gao, J Zhang#

ACL, 2026

IJCV

Event-based Simultaneous Localization and Mapping: A Comprehensive Survey

K Huang, S Zhang, J Zhang#, D Tao

IJCV, 2026

arXiv

Universal Pansharpening Foundation Model

H Wang, J Zhang#, H Guo, D Wang, J Ma, B Du, L Zhang

arXiv, 2026

arXiv

Seeing Clearly without Training: Mitigating Hallucinations in Multimodal LLMs for Remote Sensing

Y Liu, J Zhang#, D Wang, X Tian, H Guo, B Du

arXiv, 2026

CVPR

Heuristic-inspired Reasoning Priors Facilitate Data-efficient Referring Object Detection

X Zhang, Z Chen, J Zhang, D Tao

CVPR, 2026

CVPR

GeoBridge: A Semantic-anchored Multi-view Foundation Model Bridging Images and Text for Geo-localization

Z Song, J Zhang#, D Wang, Z Zhou, W Liu, H Guo, E Wang, B Du

CVPR, 2026

CVPR

UniGeoSeg: Towards Unified Open-world Segmentation for Geospatial Scenes

S Ni, D Wang, H Chen, H Guo, N Zhang, J Zhang#

CVPR, 2026

CVPR

SARMAE: Masked Autoencoder for SAR Representation Learning

D Liu, D Wang, H Wang, H Chen, W Jiang, Y Cheng, H Guo, W Cui, J Zhang

CVPR, 2026

CVPR

Perceptual-evidence Anchored Reinforced Learning for Multimodal Reasoning

C Zhang, H Qiu, Q Zhang, Y Xu, Z Zeng, S Yang, P Shi, L Ma, J Zhang#

CVPR, 2026

CVPRHighlight

Residual Diffusion Bridge Model for Image Restoration

H Wang, J Zhang#, H Chen, H Guo, D Wang, J Ma, B Du

CVPR, 2026

CVPR

DeepSketcher: Internalizing Visual Manipulation for Multimodal Reasoning

C Zhang, H Qiu, Q Zhang, Z Zeng, L Ma, J Zhang#

CVPR Findings, 2026

arXiv

GeoEyes: On-demand Visual Focusing for Evidence-grounded Understanding of Ultra-high-resolution Remote Sensing Imagery

F Wang, M Chen, Y Li, Y Yang, Y Zhang, L Lan, X Yang, H Sun, Y Wang, D Wang, J Song, J Zhang, B Du

arXiv, 2026

arXiv

VLRS-Bench: A Vision-language Reasoning Benchmark for Remote Sensing

Z Luo, D Wang, H Guo, J Zhang, B Du

arXiv, 2026

arXiv

JOintGS: Joint Optimization of Cameras, Bodies and 3D Gaussians for In-the-wild Monocular Reconstruction

Z Lou, J Fan, S Ma, Y Yang, J Zhang#

arXiv, 2026

ICLR

AnesSuite: A Comprehensive Benchmark and Dataset Suite for Anesthesiology Reasoning in LLMs

X Feng, W Jiang, Z Wang, Y Luo, P Xu, B Yu, H Jin, J Zhang#

ICLR, 2026

TPAMI

CrossEarth: Geospatial Vision Foundation Model for Domain Generalizable Remote Sensing Semantic Segmentation

Z Gong, Z Wei, D Wang, X Hu, X Ma, H Chen, Y Jia, Y Deng, Z Ji, X Zhu, X Yang, N Yokoya, J Zhang, B Du, J Yan, L Zhang

IEEE TPAMI, 2025

arXiv

GeoZero: Incentivizing Reasoning from Scratch on Geospatial Scenes

D Wang, S Liu, W Jiang, F Wang, Y Liu, X Qin, Z Luo, C Zhou, H Guo, J Zhang, B Du, D Tao, L Zhang

arXiv, 2025

AAAIOral

S5: Scalable Semi-supervised Semantic Segmentation in Remote Sensing

L Lv, D Wang, J Zhang#, L Zhang

AAAI, 2025

NeurIPS

RoMA: Scaling up Mamba-based Foundation Models for Remote Sensing

F Wang, Y Wang, M Chen, H Zhao, Y Sun, S Wang, H Wang, D Wang, L Lan, W Yang, J Zhang#

NeurIPS, 2025

NeurIPSSpotlight

GeoLLaVA-8K: Scaling Remote-sensing Multimodal Large Language Models to 8K Resolution

F Wang, M Chen, Y Li, D Wang, H Wang, Z Guo, Z Wang, B Shan, L Lan, Y Wang, H Wang, W Yang, B Du, J Zhang

NeurIPS, 2025

NeurIPS

DGSolver: Diffusion Generalist Solver with Universal Posterior Sampling for Image Restoration

H Wang, J Zhang#, H Guo, D Wang, J Ma, B Du

NeurIPS, 2025

arXiv

REX-RAG: Reasoning Exploration with Policy Correction in Retrieval-augmented Generation

W Jiang, X Feng, Z Wang, Y Luo, P Xu, Z Chen, B Du, J Zhang#

arXiv, 2025

ICCV

Synergistic Prompting for Robust Visual Recognition with Missing Modalities

Z Zhang, L Dai, Q Lin, Y Diao, G Jin, Y Guo, J Zhang, X Hao

ICCV, 2025

ICCV

Rethink Sparse Signals for Pose-guided Text-to-image Generation

W Xuan, J Zhang#, J Liu, B Du, D Tao

ICCV, 2025

ICCV

Harnessing Massive Satellite Imagery with Efficient Masked Image Modeling

F Wang, H Wang, D Wang, Z Guo, Z Zhong, L Lan, W Yang, J Zhang#

ICCV, 2025

TPAMI

High-quality Pseudo-labeling for Point Cloud Segmentation with Scene-level Annotation

L Duan, S Zhao, X Weng, J Zhang, GS Xia

IEEE TPAMI, 2025

📄

arXiv

OmniEarth-Bench: Towards Holistic Evaluation of Earth's Six Spheres and Cross-spheres Interactions with Multimodal Observational Earth Data

F Wang, M Chen, X He, YF Zhang, Y Li, F Liu, Z Guo, Z Hu, J Wang, J Xu, Z Li, J Gong, D Wang, F Ling, B Fei, W Li, L Lan, W Yang, J Zhang, W Zhang, L Bai

arXiv, 2025

arXiv

LogicOCR: Do Your Large Multimodal Models Excel at Logical Reasoning on Text-rich Images?

M Ye, H He, Q Zhong, J Zhang#, J Liu, B Du

arXiv, 2025

arXiv

Advances in Radiance Field for Dynamic Scene: From Neural Field to Gaussian Field

J Fan, X Zeng, J Zhang, M Gong, Y Yang, D Tao

arXiv, 2025

ACL

Dynamic Parallel Tree Search for Efficient LLM Reasoning

Y Ding, W Jiang, S Liu, Y Jing, J Guo, Y Wang, J Zhang, Z Wang, Z Liu

ACL, 2025

ACL

MapNav: A Novel Memory Representation via Annotated Semantic Maps for VLM-based Vision-and-language Navigation

L Zhang, X Hao, Q Xu, Q Zhang, X Zhang, P Wang, J Zhang, Z Wang

ACL, 2025

arXiv

TiMo: Spatiotemporal Foundation Model for Satellite Image Time Series

X Qin, D Wang, J Zhang#, F Wang, X Su, B Du, L Zhang

arXiv, 2025

ICML

SafeMap: Robust HD Map Construction from Incomplete Observations

X Hao, L Liu, Y Diao, R Yin, P Wang, J Zhang, L Kong, S Zhao

ICML, 2025

IJCAI

Human-imperceptible, Machine-recognizable Images

F Hao, F He, Y Wang, F Wu, J Zhang, J Cheng, D Tao

IJCAI, 2025

📄

IJCAI

DDPA-3DVG: Vision-language Dual-decoupling and Progressive Alignment for 3D Visual Grounding

H Gu, J Fan, L Zheng, J Zhang, Y Yang

IJCAI, 2025

📄

IJCAI

BEVTrack: A Simple and Strong Baseline for 3D Single Object Tracking in Bird's-Eye View

Y Yang, Y Deng, M Pan, ZJ Zha, J Zhang#

IJCAI, 2025

📄

IJCAI

Open-vocabulary Fine-grained Hand Action Detection

T Zhe, M Han, X Hao, Y Luo, Z He, X Cai, J Zhang

IJCAI, 2025

TPAMI

Unified Domain Adaptive Semantic Segmentation

Z Zhang, G Wu, J Zhang, X Zhu, D Tao, T Chai

IEEE TPAMI, 2025

TPAMI

HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model

D Wang, M Hu, Y Jin, Y Miao, J Yang, Y Xu, X Qin, J Ma, L Sun, C Li, C Fu, H Chen, C Han, N Yokoya, J Zhang, M Xu, L Liu, L Zhang, C Wu, B Du, D Tao, L Zhang

IEEE TPAMI, 2025

arXiv

InstructVEdit: A Holistic Approach for Instructional Video Editing

C Zhang, C Feng, F Yan, Q Zhang, M Zhang, Y Zhong, J Zhang#, L Ma

arXiv, 2025

CVPRHighlight

XLRS-Bench: Could Your Multimodal LLMs Understand Extremely Large Ultra-high-resolution Remote Sensing Imagery?

F Wang, H Wang, M Chen, D Wang, Y Wang, Z Guo, Q Ma, L Lan, W Yang, J Zhang, Z Liu, M Sun

CVPR, 2025

📄

CVPR

SAIST: Segment Any Infrared Small Target Model Guided by Contrastive Language-image Pretraining

M Zhang, X Li, F Gao, J Guo, X Gao, J Zhang

CVPR, 2025

IJCV

General Class-balanced Multicentric Dynamic Prototype Pseudo-labeling for Source-free Domain Adaptation

S Qu, G Chen, J Zhang, Z Li, W He, D Tao

IJCV, 2024

📄

AAAI

UAWTrack: Universal 3D Single Object Tracking in Adverse Weather

Y Yang, H Gu, Y Deng, Z Dong, Z He, J Zhang#

AAAI, 2024

📄

AAAI

Semi-supervised Infrared Small Target Detection with Thermodynamic-inspired Uneven Perturbation and Confidence Adaptation

M Zhang, W Shang, F Gao, Q Zhang, FQ Lu, J Zhang

AAAI, 2024

📄

AAAI

MOCID: Motion Context and Displacement Information Learning for Moving Infrared Small Target Detection

M Zhang, Y Ouyang, F Gao, J Guo, Q Zhang, J Zhang

AAAI, 2024

TPAMI

Hi-SAM: Marrying Segment Anything Model for Hierarchical Text Segmentation

M Ye, J Zhang, J Liu, C Liu, B Yin, C Liu, B Du, D Tao

IEEE TPAMI, 2024

NeurIPS

Is Your HD Map Constructor Reliable under Sensor Corruptions?

X Hao, M Wei, Y Yang, H Zhao, H Zhang, Y Zhou, Q Wang, W Li, L Kong, J Zhang

NeurIPS, 2024

NeurIPS

GoMatching: A Simple Baseline for Video Text Spotting via Long and Short Term Matching

H He, M Ye, J Zhang#, J Liu, D Tao

NeurIPS, 2024

📄

IJCV

Learning General and Specific Embedding with Transformer for Few-shot Object Detection

X Zhang, Z Chen, J Zhang#, T Liu, D Tao

IJCV, 2024

ACMMM

HandRefiner: Refining Malformed Hands in Generated Images by Diffusion-based Conditional Inpainting

W Lu, Y Xu, J Zhang#, C Wang, D Tao

ACM MM, 2024

ACMMM

Multi-granularity Hand Action Detection

T Zhe, J Zhang, Y Li, Y Luo, H Hu, D Tao

ACM MM, 2024

📄

ACMMM

SAR-SLAM: Self-attentive Rendering-based SLAM with Neural Point Cloud Encoding

X Lv, Z He, Y Yang, J Nie, J Zhang

ACM MM, 2024

ACMMM

Unleashing the Power of Generic Segmentation Model: A Simple Baseline for Infrared Small Target Detection

M Zhang, C Zhang, Q Zhang, Y Li, X Gao, J Zhang

ACM MM, 2024

ECCV

IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection

M Zhang, Y Wang, J Guo, Y Li, X Gao, J Zhang

ECCV, 2024

ECCV

MapDistill: Boosting Efficient Camera-based HD Map Construction via Camera-LiDAR Fusion Model Distillation

X Hao, R Li, H Zhang, D Li, R Yin, S Jung, SI Park, BI Yoo, H Zhao, J Zhang

ECCV, 2024

IJCV

ESceme: Vision-and-language Navigation with Episodic Scene Memory

Q Zheng, D Liu, C Wang, J Zhang#, D Wang, D Tao

IJCV, 2024

arXiv

PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions

S Ma, J Zhang, Q Cao, D Tao

arXiv, 2024

TPAMI

A Survey on Self-supervised Learning: Algorithms, Applications, and Future Trends

J Gui, T Chen, J Zhang, Q Cao, Z Sun, H Luo, D Tao

IEEE TPAMI, 2024

📄

TIP

Expanding and Refining Hybrid Compressors for Efficient Object Re-identification

Y Xie, H Wu, J Zhu, H Zeng, J Zhang

IEEE TIP, 2024

IJCAI

LeMeViT: Efficient Vision Transformer with Learnable Meta Tokens for Remote Sensing Image Interpretation

W Jiang, J Zhang, D Wang, Q Zhang, Z Wang, B Du

IJCAI, 2024

CVPR

UniMix: Towards Domain Adaptive and Generalizable LiDAR Semantic Segmentation in Adverse Weather

H Zhao, J Zhang*, Z Chen, S Zhao, D Tao

CVPR, 2024

CVPR

A Semi-supervised Nighttime Dehazing Baseline with Spatial-frequency Aware and Realistic Brightness Constraint

X Cong, J Gui, J Zhang, J Hou, H Shen

CVPR, 2024

📄

Workshop

From Pixels to Preservation: The Power of Large Vision Models in Heritage Content Understanding

J Zhang

SUMAC @ ACM Multimedia, 2024

TPAMI

Pruning Self-attentions into Convolutional Layers in Single Path

H He, J Liu, Z Pan, J Cai, J Zhang, D Tao, B Zhuang

IEEE TPAMI, 2023

arXiv

APTv2: Benchmarking Animal Pose Estimation and Tracking with a Large-scale Dataset and Beyond

Y Yang, Y Deng, Y Xu, J Zhang#

arXiv, 2023

arXiv

SurgicalPart-SAM: Part-to-whole Collaborative Prompting for Surgical Instrument Segmentation

W Yue, J Zhang#, K Hu, Q Wu, Z Ge, Y Xia, J Luo, Z Wang

arXiv, 2023

TPAMI

Vision Transformer with Quadrangle Attention

Q Zhang, J Zhang*#, Y Xu, D Tao

IEEE TPAMI, 2023

AAAI

Decomposing Semantic Shifts for Composed Image Retrieval

X Yang, D Liu, H Zhang, Y Luo, C Wang, J Zhang

AAAI, 2023

📄

AAAI

IRPruneDet: Efficient Infrared Small Target Detection via Wavelet Structure-regularized Soft Channel Pruning

M Zhang, H Yang, J Guo, Y Li, X Gao, J Zhang#

AAAI, 2023

AAAI

SurgicalSAM: Efficient Class Promptable Surgical Instrument Segmentation

W Yue, J Zhang, K Hu, Y Xia, J Luo, Z Wang

AAAI, 2023

AAAI

SimDistill: Simulated Multi-modal Distillation for BEV 3D Object Detection

H Zhao, Q Zhang, S Zhao, Z Chen, J Zhang, D Tao

AAAI, 2023

IJCV

Grounded Affordance from Exocentric View

H Luo, W Zhai, J Zhang, Y Cao, D Tao

IJCV, 2023

TPAMI

ViTPose++: Vision Transformer for Generic Body Pose Estimation

Y Xu, J Zhang*#, Q Zhang, D Tao

IEEE TPAMI, 2023

📄

TPAMI

On Exploring Multiplicity of Primitives and Attributes for Texture Recognition in the Wild

W Zhai, Y Cao, J Zhang, H Xie, D Tao, ZJ Zha

IEEE TPAMI, 2023

NeurIPS

SAMRS: Scaling-up Remote Sensing Segmentation Dataset with Segment Anything Model

D Wang, J Zhang, B Du, M Xu, L Liu, D Tao, L Zhang

NeurIPS, 2023

TPAMI

End-to-end One-shot Human Parsing

H He, J Zhang*, B Zhuang, J Cai, D Tao

IEEE TPAMI, 2023

ACMMM

GraMMaR: Ground-aware Motion Model for 3D Human Motion Reconstruction

S Ma, Q Cao, H Yi, J Zhang, D Tao

ACM MM, 2023

ACMMM

AniPixel: Towards Animatable Pixel-aligned Human Avatar

J Fan, J Zhang, Z Hou, D Tao

ACM MM, 2023

TPAMI

Unifying Flow, Stereo and Depth Estimation

H Xu, J Zhang, J Cai, H Rezatofighi, F Yu, D Tao, A Geiger

IEEE TPAMI, 2023

📄

ICCV

Domain Specified Optimization for Deployment Authorization

H Wang, H Chi, W Yang, Z Lin, M Geng, L Lan, J Zhang, D Tao

ICCV, 2023

ICCV

ESSAformer: Efficient Transformer for Hyperspectral Image Super-resolution

M Zhang, C Zhang, Q Zhang, J Guo, X Gao, J Zhang

ICCV, 2023

ICCV

Sensitivity-aware Visual Parameter-efficient Fine-tuning

H He, J Cai, J Zhang, D Tao, B Zhuang

ICCV, 2023

📄

IJCV

Deep Corner

S Zhao, M Gong, H Zhao, J Zhang, D Tao

IJCV, 2023

IJCV

Transformer-based Context Condensation for Boosting Feature Pyramids in Object Detection

Z Chen, J Zhang, Y Xu, D Tao

IJCV, 2023

TIP

Learning to Purification for Unsupervised Person Re-identification

L Lan, X Teng, J Zhang, X Zhang, D Tao

IEEE TIP, 2023

arXiv

Scalable Mask Annotation for Video Text Spotting

H He, J Zhang, M Xu, J Liu, B Du, D Tao

arXiv, 2023

📄

IJCV

VNAS: Variational Neural Architecture Search

B Ma, J Zhang, Y Xia, D Tao

IJCV, 2023

IJCAI

OSP2B: One-stage Point-to-box Network for 3D Siamese Tracking

J Nie, Z He, Y Yang, Z Bao, M Gao, J Zhang

IJCAI, 2023

TIP

DCN-T: Dual Context Network with Transformer for Hyperspectral Image Classification

D Wang, J Zhang, B Du, L Zhang, D Tao

IEEE TIP, 2023

arXiv

Deep Image Matting: A Comprehensive Survey

J Li, J Zhang, D Tao

arXiv, 2023

IJCV

Rethinking Portrait Matting with Privacy Preserving

S Ma, J Li, J Zhang#, H Zhang, D Tao

IJCV, 2023

arXiv

Deep Learning for Camera Calibration and Beyond: A Survey

K Liao, L Nie, S Huang, C Lin, J Zhang, Y Zhao, M Gabbouj, D Tao

arXiv, 2023

📄

CVPR

Leverage Interactive Affinity for Affordance Learning

H Luo, W Zhai, J Zhang, Y Cao, D Tao

CVPR, 2023

CVPR

DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting

M Ye, J Zhang*, S Zhao, J Liu, T Liu, B Du, D Tao

CVPR, 2023

CVPR

CLAMP: Prompt-based Contrastive Learning for Connecting Language and Animal Pose

X Zhang, W Wang, Z Chen, Y Xu, J Zhang, D Tao

CVPR, 2023

CVPR

Referring Image Matting

J Li, J Zhang, D Tao

CVPR, 2023

CVPR

Dynamic Focus-aware Positional Queries for Semantic Segmentation

H He, J Cai, Z Pan, J Liu, J Zhang, D Tao, B Zhuang

CVPR, 2023

📄

TPAMI

IC9600: A Benchmark Dataset for Automatic Image Complexity Assessment

T Feng, Y Zhai, J Yang, J Liang, DP Fan, J Zhang, L Shao, D Tao

IEEE TPAMI, 2022

AAAI

GLT-T: Global-local Transformer Voting for 3D Single Object Tracking in Point Clouds

J Nie, Z He, Y Yang, M Gao, J Zhang

AAAI, 2022

AAAI

Learning to Learn Better for Video Object Segmentation

M Lan, J Zhang, L Zhang, D Tao

AAAI, 2022

AAAI

DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer

M Ye, J Zhang, S Zhao, J Liu, B Du, D Tao

AAAI, 2022

NeurIPSSpotlight

APT-36K: A Large-scale Benchmark for Animal Pose Estimation and Tracking

Y Yang, J Yang, Y Xu, J Zhang#, L Lan, D Tao

NeurIPS, 2022

📄

NeurIPS

Exploring Figure-ground Assignment Mechanism in Perceptual Organization

W Zhai, Y Cao, J Zhang, ZJ Zha

NeurIPS, 2022

NeurIPSSpotlight

Watermarking for Out-of-distribution Detection

Q Wang, F Liu, Y Zhang, J Zhang, C Gong, T Liu, B Han

NeurIPS, 2022

NeurIPS

ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Y Xu, J Zhang*, Q Zhang, D Tao

NeurIPS, 2022

IJCV

Information-theoretic Odometry Learning

S Zhang, J Zhang#, D Tao

IJCV, 2022

ECCV

MeshMAE: Masked Autoencoders for 3D Mesh Data Analysis

Y Liang, S Zhao, B Yu, J Zhang, F He

ECCV, 2022

ECCV

JPerceiver: Joint Perception Network for Depth, Pose and Layout Estimation in Driving Scenes

H Zhao, J Zhang#, S Zhang, D Tao

ECCV, 2022

ECCV

FakeCLR: Exploring Contrastive Learning for Solving Latent Discontinuity in Data-efficient GANs

Z Li, C Wang, H Zheng, J Zhang, B Li

ECCV, 2022

ECCV

ReAct: Temporal Action Detection with Relational Queries

D Shi, Y Zhong, Q Cao, J Zhang, L Ma, J Li, D Tao

ECCV, 2022

ECCV

Towards Scale-aware, Robust, and Generalizable Unsupervised Monocular Depth Estimation by Integrating IMU Motion Dynamics

S Zhang, J Zhang, D Tao

ECCV, 2022

ECCV

VSA: Learning Varied-size Window Attention in Vision Transformers

Q Zhang, Y Xu, J Zhang, D Tao

ECCV, 2022

ECCV

BMD: A General Class-balanced Multicentric Dynamic Prototype Strategy for Source-free Domain Adaptation

S Qu, G Chen, J Zhang, Z Li, W He, D Tao

ECCV, 2022

ECCV

Towards Data-efficient Detection Transformers

W Wang, J Zhang*, Y Cao, Y Shen, D Tao

ECCV, 2022

ECCV

PolyphonicFormer: Unified Query Learning for Depth-aware Video Panoptic Segmentation

H Yuan, X Li, Y Yang, G Cheng, J Zhang, Y Tong, L Zhang, D Tao

ECCV, 2022

ECCV

RegionCL: Exploring Contrastive Region Pairs for Self-supervised Representation Learning

Y Xu, Q Zhang, J Zhang, D Tao

ECCV, 2022

📄

ACMMM

GT-MUST: Gated Try-on by Learning the Mannequin-specific Transformation

N Wang, J Zhang, L Zhang, D Tao

ACM MM, 2022

📄

ACMMM

Exploring Feature Compensation and Cross-level Correlation for Infrared Small Target Detection

M Zhang, K Yue, J Zhang, Y Li, X Gao

ACM MM, 2022

📄

ACMMM

RKformer: Runge-kutta Transformer with Random-connection Attention for Infrared Small Target Detection

M Zhang, H Bai, J Zhang#, R Zhang, C Wang, J Guo, X Gao

ACM MM, 2022

IJCV

One-shot Object Affordance Detection in the Wild

W Zhai, H Luo, J Zhang, Y Cao, D Tao

IJCV, 2022

arXiv

Toward real-world single image deraining: A new benchmark and beyond

W Li, Q Zhang, J Zhang, Z Huang, X Tian, D Tao

arXiv, 2022

TIP

DUT: Learning video stabilization by simply watching unstable videos

Y Xu, J Zhang, SJ Maybank, D Tao

IEEE TIP, 2022

📄

IJCAI

SAR-to-Optical Image Translation via Neural Partial Differential Equations

M Zhang, C He, J Zhang, Y Yang, X Peng, J Guo

IJCAI, 2022

arXiv

A Comprehensive Survey on Data-efficient GANs in Image Generation

Z Li, B Xia, J Zhang, C Wang, B Li

arXiv, 2022

IJCV

I3CL: Intra-and Inter-instance Collaborative Learning for Arbitrary-shaped Scene Text Detection

B Du, J Ye, J Zhang, J Liu, D Tao

IJCV, 2022

CVPR

DearKD: Data-efficient Early Knowledge Distillation for Vision Transformers

X Chen, Q Cao, Y Zhong, J Zhang, S Gao, D Tao

CVPR, 2022

📄

CVPR

ISNet: Shape Matters for Infrared Small Target Detection

M Zhang, R Zhang, Y Yang, H Bai, J Zhang#, J Guo

CVPR, 2022

CVPR

RU-Net: Regularized Unrolling Network for Scene Graph Generation

X Lin, C Ding, J Zhang, Y Zhan, D Tao

CVPR, 2022

CVPR

Learning Affordance Grounding from Exocentric Images

H Luo, W Zhai, J Zhang#, Y Cao, D Tao

CVPR, 2022

CVPR

FIBA: Frequency-injection based Backdoor Attack in Medical Image Analysis

Y Feng, B Ma, J Zhang, S Zhao, Y Xia, D Tao

CVPR, 2022

CVPROral

Recurrent Glimpse-based Decoder for Detection with Transformer

Z Chen, J Zhang, D Tao

CVPR, 2022

CVPROral

GMFlow: Learning Optical Flow via Global Matching

H Xu, J Zhang, J Cai, H Rezatofighi, D Tao

CVPR, 2022

IJCV

ViTAEv2: Vision Transformer Advanced by Exploring Inductive Bias for Image Recognition and Beyond

Q Zhang, Y Xu, J Zhang, D Tao

IJCV, 2022

📄

ICLR

FP-DETR: Detection Transformer Advanced by Fully Pre-training

W Wang, Y Cao, J Zhang, D Tao

ICLR, 2022

📄

TIP

Robust Object Detection via Adversarial Novel Style Exploration

W Wang, J Zhang*, W Zhai, Y Cao, D Tao

IEEE TIP, 2021

AAAI

SASA: Semantics-augmented Set Abstraction for Point-based 3D Object Detection

C Chen, Z Chen, J Zhang, D Tao

AAAI, 2021

AAAI

Visual Semantics Allow for Textual Reasoning Better in Scene Text Recognition

Y He, C Chen, J Zhang, J Liu, F He, C Wang, B Du

AAAI, 2021

AAAI

Siamese Network with Interactive Transformer for Video Object Segmentation

M Lan, J Zhang, F He, L Zhang

AAAI, 2021

IJCV

Wide-angle Image Rectification: A Survey

J Fan, J Zhang, SJ Maybank, D Tao

IJCV, 2021

📄

IJCV

CODON: On orchestrating cross-domain attentions for depth super-resolution

Y Yang, Q Cao, J Zhang#, D Tao

IJCV, 2021

IJCV

Bridging Composite and Real: Towards End-to-end Deep Image Matting

J Li, J Zhang*, SJ Maybank, D Tao

IJCV, 2021

NeurIPS

AP-10K: A Benchmark for Animal Pose Estimation in the Wild

H Yu, Y Xu, J Zhang#, W Zhao, Z Guan, D Tao

NeurIPS, 2021

NeurIPS

ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias

Y Xu, Q Zhang, J Zhang, D Tao

NeurIPS, 2021

IJCV

Towards High Performance Human Keypoint Detection

J Zhang, Z Chen, D Tao

IJCV, 2021

IJCAI

Deep Automatic Natural Image Matting

J Li, J Zhang, D Tao

IJCAI, 2021

IJCAI

One-shot Affordance Detection

H Luo, W Zhai, J Zhang#, Y Cao, D Tao

IJCAI, 2021

IJCAI

A Comprehensive Survey on Image Dehazing Based on Deep Learning

J Gui, X Cong, Y Cao, W Ren, J Zhang, J Zhang, D Tao

IJCAI, 2021

ICCV

Out-of-boundary View Synthesis Towards Full-frame Video Stabilization

Y Xu, J Zhang, D Tao

ICCV, 2021

ACMMM

Exploring Sequence Feature Alignment for Domain Adaptive Detection Transformers

W Wang, Y Cao, J Zhang#, F He, ZJ Zha, Y Wen, D Tao

ACM MM, 2021

ACMMM

DSP: Dual Soft-paste for Unsupervised Domain Adaptive Semantic Segmentation

L Gao, J Zhang, L Zhang, D Tao

ACM MM, 2021

ACMMM

Privacy-preserving Portrait Matting

J Li, S Ma, J Zhang, D Tao

ACM MM, 2021

AAAI

Progressive One-shot Human Parsing

H He, J Zhang, B Thuraisingham, D Tao

AAAI, 2020

TIP

SIR: Self-supervised image rectification via seeing the same scene from multiple different lenses

J Fan, J Zhang, D Tao

IEEE TIP, 2020

📄

NeurIPS

Auto Learning Attention

B Ma, J Zhang*, Y Xia, D Tao

NeurIPS, 2020

ACMMM

Nighttime Dehazing with a Synthetic Benchmark

J Zhang, Y Cao, ZJ Zha, D Tao

ACM MM, 2020

📄

IJCV

Recursive Context Routing for Object Detection

Z Chen, J Zhang#, D Tao

IJCV, 2020

📄

CVPROral

Deep Degradation Prior for Low-quality Image Classification

Y Wang, Y Cao, ZJ Zha, J Zhang, Z Xiong

CVPR, 2020

📄

NeurIPS

Learn, Imagine and Create: Text-to-image Generation from Prior Knowledge

T Qiao, J Zhang*, D Xu, D Tao

NeurIPS, 2019

NeurIPS

Category Anchor-guided Unsupervised Domain Adaptation for Semantic Segmentation

Q Zhang, J Zhang*, W Liu, D Tao

NeurIPS, 2019

AAAIOral

Grapy-ML: Graph Pyramid Mutual Learning for Cross-dataset Human Parsing

H He, J Zhang*, Q Zhang, D Tao

AAAI, 2019

ACMMM

Progressive Retinex: Mutually Reinforced Illumination-noise Perception Network for Low-light Image Enhancement

Y Wang, Y Cao, ZJ Zha, J Zhang, Z Xiong, W Zhang, F Wu

ACM MM, 2019

📄

ICCV

Deep Multiple-attribute-perceived Network for Real-world Texture Recognition

W Zhai, Y Cao, J Zhang, ZJ Zha

ICCV, 2019

AAAI

Multi-level Deep Cascade Trees for Conversion Rate Prediction in Recommendation System

H Wen, J Zhang*, Q Lin, K Yang, P Huang

AAAI, 2019

CVPR

MirrorGAN: Learning Text-to-image Generation by Redescription

T Qiao, J Zhang#, D Xu, D Tao

CVPR, 2019

TIP

FAMED-Net: A Fast and Accurate Multi-scale End-to-end Dehazing Network

J Zhang, D Tao

IEEE TIP, 2019

ACMMM

Fully Point-wise Convolutional Neural Network for Modeling Statistical Regularities in Natural Images

J Zhang, Y Cao, Y Wang, C Wen, CW Chen

ACM MM, 2018

📄

CVPR

Fast Haze Removal for Nighttime Image Using Maximum Reflectance Prior

J Zhang, Y Cao, S Fang, Y Kang, CW Chen

CVPR, 2017