Tipp: Regular Expressions
Reguläre Ausdrücke
Um den Einsatz
von z. B. sed effizienter zu gestalten, bedarf es der Kenntnisse über ‘Reguläre
Ausdrücke’.
Hintergründe
Viele Linux-Kommandos kennen bei Filterfunktionen nicht nur einzelne Sonderzeichen, sondern auch sogenannte ‘Reguläre Ausdrücke’ (‘Regular Expressions’), auch als ‘RegEx’ oder ‘RegExp’ abgekürzt. Ein regulärer Ausdruck ist sozusagen ein Platzhalter, der (durchaus komplexe) Gruppen von Zeichenketten repräsentiert.
Zwar gibt es verschiedene Implementierungen der RegEx, doch sind die meisten kompatibel mit den ‘Perl Compatible Regular Expressions’ (PCRE). Auch das ‘Portable Operating System Interface’ (POSIX) definiert reguläre Ausdrücke; es ist den PCRE sehr ähnlich, unterscheidet aber etwa einfache und erweiterte RegEx. Welche Art der regulären Ausdrücke und in welchem Umfang sie ein Programm unterstützt, beschreibt dessen Dokumentation.
Tipp: Regular Expressions mit sed
Spezialfall Regulärer Ausdruck?
Bisher haben wir in sed lediglich einfache Zeichenketten genutzt.
Genau genommen ist eine Zeichenkette auch nichts anderes als ein
Regulärer Ausdruck: Die Zeichenkette ist eine ‘Verkettung’ der
einzelnen Buchstaben, Ziffern und Zeichen, aus denen sie besteht. Damit
sind Reguläre Ausdrücke kein Sonderfall und ohne zusätzliche Optionen
in sed nutzbar.
Folgender Dateiinhalt dient uns nun in der Datei zitronen.txt als
Ausgangspunkt für unsere Experimente:
Auto-Fahrer fahren Zitronen!
Bier-Brauer brauen Autos.
Zitronen-Falter falten Biere?
Mit einer einfachen Ersetzung lässt sich hier zumindest ein Teil richtigstellen.
Tipp: Regular Expressions mit sed 2
In diesem letzten Teil der Serie lernen wir weitere
Funktionen von sed kennen.
Als Beispiel dient uns dieses Mal eine Konfigurationsdatei des
DHCP-Servers. Sie ist unter dem Namen dhcpd.conf gespeichert und
enthält die eine oder andere Unstimmigkeit.
option domain-name-servers 172.16.1.1;
subnet 172.16.1.0 netmask 255.255.255.0 {
range 172.1.1.10 172.1.1.254;
option broadcast-address 172.1.1.255;
option routers 172.16.1.1;
option time-servers 172.16.1.1;
option lease-time 86400;
}
Im Artikel lassen wir sed den geänderten Dateiinhalt ausgeben, gehen
aber davon aus, dass die Änderungen ebenfalls in die Datei geschrieben
werden und damit beim nächsten Aufruf vorhanden sind. Dieses Verhalten
erreichen wir mit der Kommandozeilenoption -i, die wir
bereits im ersten Teil der Serie kennengelernt haben.