Astrobobo · Content Engine

Search

1 result for "int4"

ai · arxiv/cs.LG · 8 min

INT4 Quantization Fails After FP32 Convergence in Predictable Phases

Post-training quantization assumes converged models are ready to compress, but INT4 quantization collapses in a three-phase pattern tied to weight updates, not learning rate decay.

Apr 17, 2026 Read →