Next
Previous
Contents
Die Bezeichnung Howto ist eine Zusammenschreibung von how to, was Sie mit
"so mache ich..." übersetzen können. Das Linux German Howto
beschreibt also wie man deutschsprachige Eigenheiten unter Linux
aktiviert. Gesprochen wird es als Dschörman Hautu. Im Folgenden schreibe
ich lieber vom Deutschen Sowirdsgemacht für Linux. Schon bin ich Punk.
Was sind denn nun deutsche Eigenheiten? Ledertrachten, Weisswürste, Bier
und gebügelte Unterwäsche, so wie es jedem ausländischen Besucher im
Bierzelt auf der CeBIT vorgemacht wird? Hm, das wären wohl eher
Anpassungen, die man an sich selbst vornimmt. Aber keine Furcht, Linux
lässt sich auch, dem amerikanischen Einfluss sei dank, ganz leger in Jeans
beim Pizzaessen und einem Schluck Afri-Cola bedienen (für Imis: Afri-Cola
wird in Köln gebraut). Auf das Thema gebügelte Unterwäsche kann ich an
dieser Stelle, dem amerikanischen Einfluss sei ebenfalls gedankt, nicht
weiter eingehen. Denn obwohl es hier schon spät ist, sind dort die Kinder
ja noch wach. Sagt zumindest der Sowirdsgemacht-Projektleiter. Aber genug
gescherzt, sonst entfernen wir uns zu weit vom Vorurteil der unfreundlichen
Deutschen.
Linux wird von einer weltweiten Gemeinde von Hackern im Internet
entwickelt, deren kleinster gemeinsamer Nenner für die Verständigung
Englisch ist. Dagegen müssen Anwender üblicherweise in ihrer Muttersprache
und mit nationalen Eigenheiten arbeiten: zum Beispiel Zeichen, Zeitzonen
oder Zahlenformaten. Erfreulicherweise hat Linux eine so weite Verbreitung
erfahren, dass die nationalen Märkte längst Ziele für die
Linux-Distributionen geworden sind. D.h. die regionalen Anpassungen der
Anwendungen und des Systems stecken in Linux weitgehend drin. In
diesem Zusammenhang möchte man das KDE-Projekt erwähnen, welches auf dem
Gebiet der Internationalisierung hinsichtlich Anzahl der Sprachen und
Vollständigkeit der Anpassungen hohe Maßstäbe gesetzt hat. Dieser
Entwicklung trägt auch das Deutsche Sowirdsgemacht Rechnung, indem der
Schwerpunkt ab sofort mehr auf der Beschreibung von Grundlagen liegt.
Urheberrechte, Lizenz und Haftungsausschluss
© Winfried Trümper <me@wt.xpilot.org> 1994-2001. Alle Rechte
vorbehalten.
Vertrieb und Benutzung dieses Dokuments sind unter den folgenden
Bedingungen gestattet: Der Name des Autors darf nicht zur Vermarktung
von Produkten verwendet werden, die auf diesem Dokument beruhen, und
geänderte Versionen dieses Dokuments müssen klar als solche erkennbar sein.
Text, Abbildungen und Programme in diesem Dokument wurden mit grosser
Sorgfalt erarbeitet. Trotzdem sind Fehler nicht ganz
auszuschliessen. Angesichts der Komplexität und der Schnelllebigkeit
heutiger Computer-Systeme kann der Autor weder die Richtigkeit noch die
Anwendbarkeit der gelieferten Informationen garantieren. Kurz: Benutzung
auf eigene Gefahr.
Verfügbarkeit
Linux Sowirdsgemacht-Beschreibungen füllen die Lücke zwischen Büchern und
kurzen Liesmich-Dateien. Sie haben den Anspruch, einen Sachverhalt
ausführlich zu erklären. Eigens zu diesen Zweck wurde
vom Linux-Dokumentations-Projekt (LDP) eine umfangreiche Infrastruktur aus
Autoren, Schreibwerkzeugen und Distributions-Kanälen geschaffen. Das
vorliegende Sowirdsgemacht ist offizieller Teil des (LDP) und somit wie
alle anderen Dokumente des LPD erhältlich. Entweder auf
dessen Webseiten oder im Verzeichnis
/usr/share/doc/howto/ auf der eigenen Festplatte. Daneben sind gedruckte
gedruckten Zusammenstellungen verschiedener Verlage über die Buchhandlungen
erhältlich.
Die neueste Version des Deutschen Sowirdsgemacht ist ausserdem über meine
hauseigene Seite erhältlich.
Korrekturen und Verbesserungsvorschläge können per E-Mail an mich
geschickt werden: me@wt.xpilot.org. Angebote für mehr Schleichwerbung
in der Einleitungen nehme ich dort ebenfalls entgegen.
Offene Punkte
- Korrekturlesen lassen. :)
- Danksagungen auf den neusten Stand bringen und wieder hinzufügen
- Quelltext in das neue docbook-Format konvertieren.
Benutzergruppen
In vielen Städten haben sich Linux-Anwender zu sogenannten Linux
User Groups (LUGs) zusammengetan. Diese Benutzergruppen sind offen
für jeden und halten regelmäßige Sitzungen ab. Sie sind der
ideale Treffpunkt für all diejenigen, die sich nicht nur im "Cyberspace"
mit anderen Linuxern austauschen wollen. Eine übersicht befindet sich
beispielsweise auf den
deutschen Linux-Portalseiten.
Speziell für Frauen
Hm, ich habe bisher nur die
KDE-Frauen gefunden. Gibt es noch mehr?
Vereine
Neben den lokalen LUGs gibt es auch noch die folgenden Vereine:
Der
Linux-Verband richtet
sich in erster Linie an Firmen-Mitglieder. Die Aktivitäten sind beachtlich
und konzentrieren sich im Moment auf die Aufklärung über die Schädlichkeit
von Software-Patenten.
Die
German Unix User Group zielt
nach Jahren der Neuorientierung derzeit wieder auf
Unix-Systemadministratoren.
Kongresse
Derzeit gibt es drei grosse überregionale Veranstaltungen zu Linux in
Deutschland: den
LinuxTag, den
Linux-Kongress und die
LinuxWorld Expo. Darüber
hinaus gibt es zahlreiche lokale Veranstaltungen, die in den Kalendern der
Portal-Seiten zu finden sind.
Diskussionsforen
Erste Anlaufstelle für deutschsprachige Anwender ist die "Newsgroup"
de.comp.os.unix.linux.infos. Dort sind weitergehende Informationen zu Linux
und über die Benutzung der zugehörigen "Newsgroups" zusammengetragen. Eine
gute Idee ist die Benutzung der web-basierten Archive, in denen man zu
Stichworten eine Menge Antworten findet:
Google-Suche: de.comp.os.linux.* oder
Oft gestellte Fragen der Deutschen Linux-Diskussionsgruppen.
Internet Relay Chat (IRC)
Der IRC-Kanal #LinuxGER bietet eine Hotline zu Linux in deutscher
Sprache. Über
dessen hauseigene Web-Seite kann man mehr über die Welt des IRC lernen.
Deutschsprachige Portalseiten zu Linux
Hier ist eine kleine Auswahl von Seiten, die schon länger existieren und
auch regelmässig gepflegt werden:
Linux in Österreich
Linux in der Schweiz
Linux.de
Pro Linux
Deutsches Linux Howto Projekt (DLHP)
Das
Deutsche Linux Howto Projekt (DLHP) Projekt beschäftigt sich mit der
übersetzung der originalen englischsprachigen Linux Sowirdsgemacht ins
Deutsche. Auf den Webseiten des Projekts kann man eine Liste aller
übersetzten Sowirdsgemacht und nähere Informationen zum Projekt abrufen.
Rechner sind Geräte, die auf der Grundlage von digitalen Zahlen arbeiten.
Menschen sind Wesen, die mit Zahlen und auch mit Namen arbeiten. Setzt man
einen Menschen vor einen Rechner und verkauft dem Menschen den Rechner als
Universalgerät, dann muss der Rechner neben den Zahlen auch mit Namen
umgehen können. Dies wird mit einem Kunstgriff erreicht: Das Alfabet wird
durchnummeriert, d.h. Buchstaben werden Zahlen zugeordnet, mit denen der
Rechner wiederum umgehen kann. Beispiel: Der Buchstabe A hat die Nummer
65. Zeichentabelle oder Zeichensatz wird diese Zuordnung genannt. Sie
listet neben den Buchstaben auch noch Symbole und Sonderzeichen auf. Der
Zeichensatz ist eine rein logische Definition; erst die Schriftart bestimmt
die Darstellung des Zeichensatzes auf dem Bildschirm.
Damit Dokumente zwischen Computern austauschbar sind, muss der verwendete
Zeichensatz standardisiert sein. Ein früher Standard war US-ASCII, eine
sehr kleine, aus 127 Zeichen bestehende Zuordnung, bei der jedes Zeichen
genau 7 Bits Speicherplatz belegte. Ein Bit mehr pro Zeichen benötigt der
Zeichensatz ISO-8859-1, mit dem sich die meisten mitteleuropäischen Sprachen
darstellen lassen. Allerdings legen beide Zeichensätze das lateinische
Alfabet zugrunde, sind also für Anwender ausserhalb von Europa oder Amerika
nur begrenzt nützlich. So entstanden in den verschiedenen Regionen der Welt
Zeichensätze, die wegen unterschiedlicher Zeichen mit derselben Nummer
nicht miteinander verträglich sind.
Tabelle 1: Ausschnit des Zeichensatzes ISO-8859-1
" quotedbl ' apostrophe ` grave ~ asciitilde
^ asciicircum _ underscore ! exclam ? question
# numbersign $ dollar % percent & ampersand
| bar @ at + plus - minus
* asterisk / slash \ backslash . period
, comma : colon ; semicolon < less
= equal > greater ( parenleft ) parenright
[ bracketleft ] bracketright { braceleft } braceright
¡ exclamdown ¢ cent £ sterling ¤ currency
¥ yen ¦ brokenbar § section " diaeresis
© copyright ª ordfeminine < guillemotleft
¬ notsign hyphen ® registered
¯ macron ° degree ± plusminus ² twosuperior
³ threesuperior ´ acute µ mu
¶ paragraph · periodcentered ¸ cedilla
¹ onesuperior º masculine > guillemotright
¼ onequarter ½ onehalf ¾ threequarters
¿ questiondown À Agrave Á Aacute  Acircumflex
à Atilde ä Adiaeresis ° Aring Æ AE
Ç Ccedilla È Egrave É Eacute Ê Ecircumflex
Ë Ediaeresis Ì Igrave Í Iacute Î Icircumflex
Ï Idiaeresis Ð ETH Ñ Ntilde Ò Ograve
Ó Oacute Ô Ocircumflex Õ Otilde ö Odiaeresis
× multiply Ø Ooblique Ù Ugrave Ú Uacute
Û Ucircumflex ü Udiaeresis Ý Yacute Þ THORN
ß ssharp à agrave á aacute â acircumflex
ã atilde ä adiaeresis å aring æ ae
ç ccedilla è egrave é eacute ê ecircumflex
ë ediaeresis ì igrave í iacute î icircumflex
ï idiaeresis ð eth ñ ntild ò ograve
ó oacute ô ocircumflex õ otilde ö odiaeresis
÷ division ø oslash ù ugrave ú uacute
û ucircumflex ü udiaeresis ý yacute þ thorn
ÿ ydiaeresis
Die derzeitige Lösung ist der internationale Unicode-Zeichensatz (identisch
zu ISO-10646). Unicode steht für unique code und bezeichnet eindeutige
Nummern von derzeit über 90.000 definierten Zeichen in einer einzigen
Zuordnungstabelle. Der Prozess der Standardisierung ist weit
fortgeschritten, aber noch nicht abgeschlossen. Schätzungen gehen davon
aus, dass niemals mehr als ca. 2.1 Millionen (21 Bit) Zeichen definiert
sein werden. Um eine ausreichende Reserve vorzuhalten, wurden die
Unicode-Tabelle mit 32 Bit pro Zeichen ausgelegt, was zur Nummerierung von
mehr als 4 Millarden Zeichen ausreicht. Unicode bricht also mit einer
geläufigen Annahme: 8 Bit (ein Byte) pro Zeichen. Die vier Byte scheinen
grosszügig dimensioniert und werfen Fragen des Speicherverbrauchs auf: Mit
unserem mitteleuropäischen Zeichensatz ISO-8859-1 belegt jedes Zeichen acht
Bit auf den Speichermedien (RAM, CD-ROM, Festplatte). Ohne spezielle
Massnahmen belegen in Unicode dieselbem Zeichen 32 Bit, d.h. alle
Speichermedien müssten für die Verwendung von Unicode vier mal so gross
ausgelegt werden. Das erschien nicht durchführbar, weshalb zur effektiveren
Speicherung verschiedene Unicode Bit Transformationen (UTF) eingeführt
wurden: UTF-8, UTF-16 und UTF-32. Letztere Transformation ändert nichts,
spart deswegen auch nichts und belegt somit in verschwenderischer Manier
für jedes Zeichen konstant 32 Bit im Speicher. Erstere Transformationen
(UTF-8) belegt zwischen acht und 48 Bits, je nach Standort des Zeichens in
der Tabelle. Oft benötigte Zeichen (US-ASCII) stehen vorne in der Tabelle
und belegen nur acht Bits, die deutschen Umlaute stehen mehr zur Mitte hin
und belegen 16 Bits. Ein kleiner Nachteil von UTF-8 ist die
rechenzeitintensive Transformation der Daten. Die Transformation UTF-16
liegt irgendwo zwischen dem Speicherplatzverbrauch von UTF-32 und dem
Rechenzeitverbrauch von UTF-8.
Weitere Informationen zu Unicode sind direkt beim
Unicode-Consortium
und in der
UTF-8 and Unicode FAQ for Unix/Linux (engl.) zu finden.
Das Euro-Symbol
Das ISO Währungs-Kürzel für den Euro ist EUR, wie man es von den
Überweisungs-Formularen der Banken schon kennt. Die Schreibweise EUR 10,23
für 10 Euro und 23 Cent ist gleichberechtigt mit der Verwendung des
speziellen Währungs-Symbols ¤ (E mit zusätzlichem Mittelstrich). Falls das
Euro-Symbol eher wie ein mechanischer Wecker aussieht, dann verwenden Sie
noch die alten Schriftarten. In diesem Fall sollten Sie Ihre
Linux-Distribution aktualisieren, denn ein Austausch aller denkbaren
Schriftarten geht weit über die Möglichkeiten dieses Sowirdsgemacht
hinaus. (Schriftarten waren schon immer ein Problem unter Linux, was das
Euro-Symbol nur bestätigt.) Ob sich eine Aktualisierung angesichts des
robusteren ISO-Kürzels EUR überhaupt lohnt, müssen Sie selbst entscheiden.
Definiert wird das Euro-Symbol vom Zeichensatz ISO-8859-15. Es liegt in der
Tabelle bei den anderen Währungs-Symbolen zwischen Pfund und Yen. Über die
Tastatur können Sie es wie aufgedruckt mit AltGr-E eingeben. Die
Tastenkombination AltGr-C gibt das bekannte Cent-Symbol.
Alle dem Autor bekannten Distributionen stellen die deutsche
Tastaturbelegung selbstständig bei der Installation ein. Ist man mit dem
Resultat nicht zufrieden, so lassen sich mit den Kommandozeilen-Werkzeugen
loadkeys (Text-Konsolen) und xmodmap (X11) andere Belegungen
einstellen. Eine genauere Beschreibung der Werkzeuge geht über den Anspruch
dieses Dokuments hinaus.
Bei dieser Gelegenheit soll ein wenig Licht in die Konzepte der
Tastaturbelegung gebracht werden, um unter Unix/Linux in Zukunft weniger
Probleme mit den Tastenbelegungen zu haben. Die Betätigung einer Taste
sendet eine Kennzahl. Andere Tastaturen geben andere Kennzahlen. Ähnlich zu
den weiter oben beschriebenen Zeichensätzen, kommen auch bei der Tastatur
Zuordnungstabellen zum Einsatz, die den Kennzahlen Symbole zuordnen. Die
Zuordnungstabellen heissen Tastaturbelegungen. Eine Tastaturbelegung
definiert unter Umständen nicht direkt die auszugebenden Zeichen, sondern
machen einen Zwischenschritt über symbolische Namen. Beispiel: Unter X11
sendet eine Taste die Kennzahl 22. Die Tastaturbelegung definiert für diese
Kennzahl (Terminus "keycode") das Symbol BackSpace, womit die Taste zum
Löschen des linken Zeichens auf der PC-Tastatur gemeint
ist. X11-Anwendungen reagieren direkt auf dieses Tasten-Symbol. Für
Anwendungen, die in einem Textdialog-Fenster (xterm, ssh) ablaufen, wird
das Symbol widerum in eine Steuersequenz übersetzt, z.B. Steuerung-? oder
Escape-[3 .
Kompositionen
Gebräuchliche Tastaturen verfügen über ca. 110 Tasten. Um damit den
kompletten Zeichensatz ISO-8859-1 eingeben zu können, müsste man die Tasten
mit bis zu vier Zeichen belegen. Benötigt man nur selten den Zugriff auf
den kompletten Zeichensatz, dann ist die Vierfach-Belegung ein zu hoher
Lernaufwand. In diesem Fall bietet sich die Kompositions-Taste an. Diese
Taste verursacht selbst keine Ausgabe auf dem Bildschirm, sondern
komponiert die beiden nachfolgend eingegebenen Zeichen zu einem. Mit
anderen Worten: Die Zeichen werden übereinander gedruckt. Beispiel: Die
Tastenfolge <Compose> <~> <a> ergibt ein ã.
Unter Linux ist meist eine der Tasten rechts von der Leertaste mit der
Kompositions-Funktion belegt. (Hinweis für Xmodmap-Bastler: Das
XFree-Tasten-Symbol der Kompositions-Taste ist Multi_key.)
Ständige Komposition
Bestimmte Tasten können als ständig komponierend konfiguriert werden. Die
Betätigung solcher Tasten führt zunächst zu keiner Ausgabe auf dem
Bildschirm, sondern das betreffende Symbol wird über das nächste
Zeichen gedruckt, das eingetippt wird.
Die Funktion wird im Englischen manchmal mit "dead keys" bezeichnet, was
eine Fehlbezeichnung ist, denn tote Tasten verursachen überhaupt keine
Funktion.
Das Bootprompt
Beim Starten des Computers wird der Linux-Kernel von einem sogenannten
Boot-Loader in den Arbeitspeicher geladen. Über den Boot-Loader kann man
dem Kernel Parameter übergeben - vorausgesetzt, man kennt die amerikanische
Tastenbelegung. Die folgenden Abschnitte beschreiben die Möglichkeiten
zur Konfiguration der Tastenbelegung für die Boot-Loader von Linux.
Lilo
Seit der Version 2.0 hat die ehrenwerte Dame die Fähigkeit zur Verwendung
alternativer Tastenbelegungen. Dem Source-Code liegt das Perl-Skript
keytab-lilo.pl bei, mit der man eine der Tastaturbelegungen
für die Textkonsolen in für Lilo geeignetes Format überführt. Beispiel:
man möchte die Tastenbelegung de-latin1-nodeadkeys.map
schon auf dem Lilo-Prompt geladen wissen. Dazu ist folgender Befehl
auszuführen:
./keytab-lilo.pl de-latin1-nodeadkeys > /boot/de-latin1-nodeadkeys.ktl
Um dises Belegung zu aktivieren muß man in der Konfigurationsdatei
/etc/lilo.conf folgenden Eintrag vornehmen und danach das Kommando lilo
ausführen. Die Details können sich allerdings von Distribution zu
Distribution unterscheiden, weshalb man bitte die mitgelieferten Handbücher
konsultiere.
keytable = /boot/de-latin1-nodeadkeys.klt
Die Erde ist in Zeitzonen eingeteilt, innerhalb derer die Tageszeit von der
natürlichen Zeit (höchster Sonnenstand = Mittag) abweichen kann. Die
Tageszeit der Zeitzone kann sogar springen, wie beispielsweise bei der
Umstellung zwischen Sommer und Winterzeit. Bei den Zeitzonen handelt es
sich also um politische Festlegungen. Für kleine Länder kann man die
Zeitzone über die Hauptstadt auswählen, also Europe/Berlin, Europe/Vienna
oder Europe/Zurich. Hinter diesem Alias-Namen verbirgt sich die
tatsächliche Zeitzone, nämlich in unserem Fall die Mitteleuropäische Zeit
(Central European Time, CET) bzw. die Mitteleuropäische Sommerzeit
(Central European Summer Time, CEST).
Das früher gebräuchliche MET sollte unter keinen Umständen
weiterverwendet werden. Von Markus Kuhn stammt folgende Information zu
diesem Thema: Die Datei MET existiert nur zwecks
Rückwärtskompatibilität. Die Autoren der Zeitzonentabellen
(Olson/Eggert/et al.) wollen eigentlich, daß deutsche Anwender statt
MET die Datei Europe/Berlin verwenden. Dann stimmen sogar die
historischen Sommerzeiten vor 1945, die Linux auch alle
kennt. Außerdem wird dann in der neuesten Version der
Zeitzonentabelle "Mitteleuropäische Zeit (MEZ)" endlich korrekt ins
Englische mit "Central European Time (CET)" übersetzt, denn "MET" ist
ein übersetzungsfehler (siehe z.B. Langenscheid Englisch). Ich habe
deswegen sogar beim Physikalisch-Technischen Bundesamt nachgefragt,
die für die deutsche Zeit verantwortlich sind.
Der gemeinsame Bezugspunkt für alle Zeitzonen ist die Universalzeit
(Universal Time, UTC), früher auch Greenwich Mean Time (GMT) genannt. Unter
Linux lässt man die CMOS-Uhr auf der Hauptplatine üblicherweise mit UTC
laufen. Der Linux-Kernel übernimmt den Wert der CMOS-Uhr beim Systemstart
und errechnet daraus die Sekunden seit dem 1. Januar 1970, 0 Uhr (Unix
Epoch Time). Intern arbeitet der Linux-Kernel nur mit dieser Sekunden-Zahl,
die üblicherweise auch in UTC läuft. Soll dem Anwender ein Datum oder eine
Zeit angezeigt werden, dann wird aus der Systemzeit unter Berücksichtigung
der Zeitzone und der Lokalisierung (siehe oben) eine Zeichenfolge
konstruiert.
Zusammenfassend kann man sagen, dass es unter Linux 3 Zeiten gibt: Die der
auf dem Motherboard installierten CMOS-Uhr, die Systemzeit des
Linux-Kernels und die dem Anwender von verschiedenen Uhren angezeigte
Zeit. Die Kommandozeilen-Werkzeuge hwclock ("hardware clock") und date
übersetzen zwischen diesen Uhrzeiten. Folgende Strichzeichnung
verbildlicht die Zusammenhänge:
hwclock -u -w date -u -s
CMOS-Uhr <-------------- Linux <--------------
(UTC) Systemzeit Anwender-Uhr
--------------> (Epoch) -------------->
hwclock -u -s date, xclock
Zwar liest der Kernel schon beim Booten die CMOS-Uhr aus und interpretiert
sie als UTC. Aber um systematische Fehler der CMOS-Uhr zu korrigieren, wird
die Uhrzeit von einem der Systemstart-Skripte im Verzeichnis /etc/init.d/
ein weiteres Mal gelesen. Übernimmt man die Linux-Systemzeit mit dem Kommando
netdate von einem Zeit-Server, dann muss man die CMOS-Uhr mit dem Kommando
hwclock nachziehen.
Die systemweit gewählte Zeitzone kann mit der Umgebungsvariable TZ
individuell überschrieben werden. Beispiele:
export TZ=Asia/Hong_Kong; xclock &
export TZ=UTC; xclock &
Internationalisierung und Lokalisierung
Internationalisierung und Lokalisierung sind auch im Englischen lange
Wörter, weshalb sie mit i18n und i10n abgekürzt werden. Die Zahlen geben
an, wieviele Buchstaben in der englischen Schreibweise ausgelassen wurden.
Mit i18n wird die Veränderung eines Programms zur Unterstützung mehrerer
Sprachen bezeichnet. Bei diesem Prozess wird normalerweise der angezeigte
Text (Menüs, Meldungen, usw.) vom Programmcode getrennt. Auf diese Weise
können sich mehrere Übersetzungen denselben sprachenunabhängigen
Programmcodes teilen. Ins Deutsche übersetzte Programmeldungen können über
die Umgebungsvariable LANG ausgewählt bzw. aktiviert werden. Beispiel:
#LANG=de_AT # in österreich
#LANG=de_CH # in der deutschsprachigen Schweiz
LANG=de_DE # in Deutschland
export LANG
Das Resultat ist nicht immer zufriedenstellend. Beispielsweise sind nicht
alle Bibliotheken internationalisiert, so dass sich die Ausgabe-Texte mit
Englisch mischen. Die Entwicklung in den vergangenen Jahren
lässt sich an folgendem Beispiel ablesen:
# im Jahre 1997:
tar: Kann Archiv 'foo.tgz' nicht öffnen: Permission denied
# im Jahre 2001:
tar: foo.tgz: Cannot open: Keine Berechtigung
i10n bezeichnet die darüber hinaus gehende Feinarbeit der Anpassung an
nationalen Besonderheiten, wie Datums- und Zahlenformate oder das
kulturelle Umfeld. Eine deutsche Lokalisierung wird mittlerweile
automatisch mit der LANG-Umgebungsvariable aktiviert. So macht es am
meisten Sinn. Bei älteren Systemen kann mit der Umgebungsvariable LC_ALL
die Lokalisierung eingeschaltet werden. Beispiel:
LC_ALL=de
export LC_ALL
Die Einstellungen sollten von allen modernen Linux-Distributionen
automatisch vorgenommen werden. Exotischere Lokalisierungen sind zum
Beispiel von IBM erhältlich:
IBM developer works: universal locales
Ausnahmen von der Regel
Sowohl für die Textkonsole als auch für X11 existieren
Zeichensätze, die nicht alle Zeichen aus ISO-8859-1 enthalten. Dies
gilt erst recht für Unicode. Die fehlenden Zeichen (z.B. Umlaute) werden
als Leerzeichen oder gar nicht auf dem Bildschirm dargestellt. In diesem
Fall hilft natürlich die nachfolgend beschriebene Konfiguration der
Anwendungen nicht weiter, sondern es muß ein anderer
(vollständiger) Zeichensatz gewählt werden.
Anwendung Einstellung vorgenommen in/auf
-------------------------------------------------------------------
LaTex \usepackage{a4} im Dokument
gnuplot set encoding iso_8859_1 ~/.gnuplotrc
xfig Fig*inches: false Xresource
xfig -metric Kommandozeilenoption
lynx CHARACTER_SET:iso-8859-1 ~/.lynxrc und /etc/lynx.cfg
nn ~/.nn/init und /etc/nn/setup
set data-bits 8
set charset iso-8859-1
tin ~/.tin/headers
Mime-Version: 1.0
Content-Type: text/plain; charset=iso-8859-1
Content-Transfer-Encoding: 8bit
elm ~/.elm/elmrc und /usr/lib/elm/elm.rc
charset = iso-8859-1
displaycharset = iso-8859-1
textencoding = 8bit
pine character-set=ISO-8859-1 ~/.pinerc und /etc/pine.conf
less LESSCHARSET=latin1 Umgebungsvariable
joe -asis ~/.joerc und /etc/joe/joerc
dosemu ~/.dosrc und /etc/dosemu.conf
keyboard { layout de-latin1 keybint on rawkeyboard on }
X { updatefreq 8 title `DOS in a BOX' icon_name `xdos' keycode }
kermit ~/.mykermrc und /etc/kermit.ini
set terminal bytesize 8
set command bytesize 8
set file bytesize 8
set language german
set file character-set latin1-iso
set transfer character-set latin1-iso
set terminal character-set latin1-iso
Texte
Das Papierformat DIN A4
In Amerika wird hauptsächlich das Papierformat US-Letter verwendet, welches
ein wenig breiter und niedriger ist als das in Europa gebräuchliche DIN A4.
Oft muss man Anwendungen ausdrücklich auf DIN A4 einstellen. Beispiele:
Anwendung Einstellung vorgenommen in/auf
-------------------------------------------------------------------
LaTex \usepackage{a4} im Dokument
xdvi XDvi.paper: a4 X-Resource
ghostview Ghostview.pageMedia: A4 X-Resource
ghostscript -sPAPERSIZE=a4 Kommandozeile
dvips Konfigurationsdatei .dvipsrc
@ a4size 210mm 297mm
@+ %%PaperSize: a4
ImageMagick -page A4 Kommandozeile
Austausch von Texten mit anderen Systemen
Die Textformate von DOS/Windows-basierten System, Apple-Computern und UNIX
unterscheiden sich in zwei Punkten: Zeichensatz und Zeilenenden. Linux
macht am Ende einer Textzeile nur einen Zeilenvorschub, Äpfel machen nur
einen Wagenvorlauf und DOS-basierte Systeme machen beides.
Die Programme fromdos , todos und frommac , tomac
wandeln ausschließlich die Zeilenenden um, die Zeichen selbst werden
nicht angepaßt. Gleiches gilt für die Optionen `conv=auto',
bzw. `conv=text' des mount-Kommandos bezogen auf das MS-DOS
Dateisystem.
Will man auch die Zeichensätze von Texten konvertieren, dann hilft das
Kommandozeilen-Werkezeug recode weiter. Durch die Definition von Aliasen
kann man sich das Leben etwas einfacher machen:
alias unix2dos='recode lat1.ibmpc'
alias dos2unix='recode ibmpc.lat1'
alias unix2mac='recode lat1.mac'
alias mac2unix='recode mac.lat1'
Drucken
Die folgenden Überlegungen betreffen nur Text-Dateien. Grafiken oder die
Ausgabe von Textverarbeitungen werden als Punktmuster zum Drucker
geschickt und sind daher nicht betroffen.
Gängige Drucker-Modelle erwarten Texte im DOS-Format. Schickt man eine
Textdatei im Unix-Format zum Drucker, dann erhält man einen
Treppenstufen-Effekt, weil der Text am Ende der Zeile keinen Wagenrücklauf
aufweist. Beispiel: lpr /etc/nsswitch.conf. Entweder konvertiert man
Textdateien wie oben beschrieben in das DOS-Format oder man wandelt sie mit
Werkzeugen wie atp, mpage, a2ps, ascii2ps, encode oder gencode in das
PostScript-Format. Für PostScript installieren die modernen
Linux-Distributionen Drucker-Treiber.
Next
Previous
Contents
|