, Vanessa Bahr / KI / iX

Spekulative Decoding-Verfahren beschleunigen die Tokenvorhersage. Multi-Token Prediction nutzt schnelle kleine Modelle und trennt Vorhersage von Verifikation.