Entwicklungsgeschichte

Die Grundidee der Lauflängenkodierung ist die, anstelle der unkodierten Daten so genannte Runs zu speichern. Ein Run ist eine Abfolge von identischen Zeichen, die Länge der jeweiligen Sequenz wird in einem Run Counter gespeichert. Den Inhalt der Abfolge bezeichnet man auch als Run Value. Aus den Originaldaten aaaabbaaaccccccggggggff wird dann beispielsweise 4a2b3a6c6g2f, wobei 4, 2, 3, 6, 6, 2 die Run Counter sind und a, b, a, c, g, f die Run Values. Idealerweise lässt sich mit dieser einfachen Form der Lauflängenkodierung eine 256 Zeichen lange Abfolge mit 2 Zeichen darstellen, wenn man von einem 1-Byte-Counter ausgeht. Allerdings kann sich im ungünstigsten Fall mit diesem Verfahren das Datenvolumen auch verdoppeln. Dies passiert beispielsweise bei folgender Datensequenz: abghdfgs - daraus wird nach der Kodierung 1a1b1g1h1d1f1g1s.

Heute existieren neben der Urform der RLE verschiedene Varianten, denen allen die selbe Idee zu Grunde liegt, mit Hilfe derer aber eine, im Gegensatz zur prinzipiellen Form, höhere Wahrscheinlichkeit der tatsächlichen Datenreduktion gegeben ist. Man unterscheidet allgemein zwischen primitiven Versionen und solchen mit Steuerzeichen, auf die im Kapitel Varianten näher eingegangen wird.