Google hat mit TurboQuant eine bahnbrechende Komprimierungstechnik entwickelt, die den Speicherhunger großer Sprachmodelle drastisch reduziert. Statt 32 Bit benötigt das Verfahren nur noch etwa 3 Bit pro Wert – bei gleichbleibender Qualität. Das Ergebnis: bis zu 6× weniger Speicherbedarf und bis zu 8× schnellere Verarbeitung. Der Artikel erklärt die technischen Hintergründe, warum diese extreme Kompression funktioniert, und zeigt, welche Rolle Kompressionsalgorithmen in der Zukunft der KI spielen werden.

