Ahmed Anwar

arXiv · 2026

The Gentle Collapse: Distributional Metrics for Continual Learning

Ahmed Anwar, Andreas Wagner, Federico Raue, Tobias Christian Nauen, Andreas Dengel

Accuracy alone hides how models forget in continual learning. We introduce six softmax-derived metrics covering rank, confidence, and distributional divergence that expose class-level forgetting patterns invisible to accuracy. Using these as loss weights or replay sampling criteria reduces forgetting by up to 7.7 pp on TinyImageNet over uniform experience replay.

→ project page ↗ pdf

TMLR · 2026

TextTeacher: What Can Language Teach About Images?

Tobias Christian Nauen, Stanislav Frolov, Brian Bernhard Moser, Federico Raue, Ahmed Anwar, Andreas Dengel

We use a frozen text encoder on image captions as a lightweight training-time auxiliary objective for image classifiers. The text components are dropped at inference, leaving a fast, unimodal vision model. Accuracy on ImageNet improves by up to +2.7 p.p. and downstream transfer by +1.0 p.p. on average, outperforming vision knowledge distillation at a fraction of the compute.

→ project page ↗ pdf ↗ code ↗ Precomputed Embeddings

Ahmed Anwar.

Co-authored Publications: 2

The Gentle Collapse: Distributional Metrics for Continual Learning

TextTeacher: What Can Language Teach About Images?