Hilfe zur Arbeit als Korrektor
1. Textübertragungen
Zwischenüberschriften, Absätze und Leerzeilen
Artikel zu verschiedenen Schlagworten werden durch eine Leerzeile getrennt
(= Return - Return). Absätze innerhalb eines Artikels werden mit nur einem Return
getrennt, ohne Leerzeichen am Beginn. Zwischenüberschriften sollten dem Original-Layout
möglichst ähnlich in den Textverlauf eingebunden werden. Eine besondere Kennzeichnung ist
erst beim Taggen vorgesehen. Manchmal gibt es Leerzeilen innerhalb eines Artikels, etwa vor
oder nach einer Tabelle. Sie können mit ^[Leerzeile]
gekennzeichnet werden.
In diesem Zusammenhang: Es hat sich eingebürgert, spezielle Hinweise oder Formatierungen,
die sich nicht im Text abbilden lassen, über ^[Hinweis]
einzubinden. Dadurch
lassen sich bei der Übertragung in das XML-Format (taggen) spezielle Stellen leichter finden.
Verschiedene Schriftarten
Zwischen Frakturschrift, lateinischen Buchstaben, Kursiven usw. wird in den Korrekturstufen
normal
und fein
nicht unterschieden.
Faksimile | Umsetzung |
---|---|
![]() |
Die Früchte von C. explodens Naud. schleudern [...] |
Sperrungen
Gesperrte Worte werden in den Korrekturschritten normal
und fein
wegen der Suchfunktionen
ungesperrt geschrieben.
Faksimile | Umsetzung |
---|---|
![]() |
im Vertrag von Hamburg |
Original-Schreibfehler
Fehlerhaft geschriebene Worte werden übernommen und in einer markierten Klammer
^[ ]
richtiggestellt. Ganz unten auf dieser Seite ist eine Liste
ungewöhnlicher, aber richtiger Worte.
Faksimile | Umsetzung |
---|---|
![]() |
Humburg ^[richtig: Hamburg] |
Bildunterschriften
Die Reste der zu Abbildungen gehörenden Worte innerhalb der ocr-ten
Textseiten müssen entfernt werden, damit der laufende Artikeltext nicht
unterbrochen wird. Um den Leser über die Existenz einer Abbildung zu
informieren, sollte am Ende des dazugehörigen Artikels oder des Abschnitts bzw. am Seitenende
in markierter Klammer ^[Abb.: Bilduntertext]
eingefügt werden. Das
häufig vorhandene "Fig." bitte mit dazuschreiben. Wenn es keinen
Bilduntertext gibt, genügt ^[Abb.]
.
Fußzeilen
Hinweiszeilen, wie z. B. bei dem Buchstaben C
im Meyers, werden am Ende
der Seite in markierten Klammern wiedergegeben.
^[Artikel, die unter C vermißt werden, sind unter K oder Z nachzuschlagen.]
Überflüssige Fußzeilen
Signaturen (Hilfszeilen für den Buchbinder) am Seitenfuß werden gestrichen.
Tabellen
Die Werte in den Tabellen sollten mit TAB-Zeichen getrennt sein.
Das TAB-Zeichen bekommt man über die Tabulator-Taste; es wird in Editoren zumeist als
Pfeil oder kleiner Winkel dargestellt.
Punktreihen und senkrechte Linien bzw. das, was beim OCR davon blieb, fallen weg.
Mehrspaltige Tabellen sollten zu einer langen Tabelle ohne Wiederholung der Spaltenbezeichner
umgestaltet werden.
Eventuell vorhandene Leerzeilen vor oder nach der Tabelle können mit
^[Leerzeile]
gekennzeichnet werden.
Faksimile | Umsetzung |
---|---|
![]() |
![]() |
Komplexe Formeln und Ähnliches
Schwer darstellbare Textteile werden mit Hilfe der ^[ ]
-Klammerung dargestellt.
Das Bild wird später beim Taggen eingefügt.
Faksimile | Umsetzung |
---|---|
![]() |
Hier ist aber die linke Seite ein vollständiges Quadrat, und man kann schreiben
|
Trennstriche am Seitenende
Faksimile | Umsetzung |
---|---|
![]() |
... Preußen, Oldenburg und Ham-^[folgende Seite] |
2. Behandlung einzelner Zeichen
Anführungszeichen
Die im Lexikon verwendeten Winkel-Anführungszeichen (beim Meyers » «, im Brockhaus « ») können auch im Schreibmaschinenstil (" ") wiedergegeben werden. Die richtigen Anführungszeichen werden zu einem späteren Zeitpunkt automatisch wieder hergestellt. Wer will, kann auch gleich die richtigen Zeichen einfügen, bei Windows mit der Tastenkombination Alt+0171 für « und Alt+0187 für »; Linuxbenutzer nehmen AltGr + y für « und AltGr + x für ».
Faksimile | Umsetzung |
---|---|
![]() |
"Hamburg" |
Hoch- und tiefgestellte Zeichen
Für Hoch- und Indexzeichen ist als vereinfachte Kennzeichnung ^{ } bzw. _{ } festgelgt.
So markierte Zeichen werden später automatisch in HTML-Code umgesetzt. Wer will, kann
in markierten Klammern auch gleich die HTML-Schreibweise verwenden.
Achtung: Jahreszahlen und Nachkommastellen wurden im Lexikon manchmal mit etwas kleineren Lettern gesetzt.
Im normal
und fein
-Text bleiben sie aber in normaler Größe.
Faksimile | Umsetzung | HTML | Darstellung |
---|---|---|---|
![]() |
(5^{3})^{2} |
(5<sup>3</sup>)<sup>2</sup> |
(53)2 |
![]() |
C12H22O11 ^[C_{12}H_{22}O_{11}] |
C12H22O11 ^[C<sub>12</sub> H<sub>22</sub> O<sub>11</sub>] |
C12H22O11 ^[C12H22O11] |
3. Hilfreiches
Typische Fehler der OCR
Durch den OCR-Vorgang entstehen häufige Verwechslungen bestimmter Buchstaben:
s <-> f; n <-> u; u -> U
Folgende Vertauschungen treten zumeist in Zahlen auf und führen ohne Richtigstellung zu
Fehlern bei der Suche nach Jahreszahlen:
O <-> 0; l, I <-> 1
Typisch ist auch dieser Fehler:
Friedrich III. -> Friedrich HL o. Ä.
Die Großbuchstaben I und J sind im Lexikon druckgleich und müssen alle manuell überprüft
werden. Als Anhaltspunkt kann man davon ausgehen, daß nach einem J ein Vokal folgt, nach einem
I ein Konsonant. In Zweifelsfällen ist es praktisch, das Wort als Stichwort im Lexikon zu
suchen: da ergibt sich als richtige Schreibweise z. B. Janus, aber Iambus.
Manchmal hat leider das OCR Worte recht eigenmächtig verändert (z. B. einer
statt eines
)
oder durch falsche Worte ersetzt (z. B. ein alkalischer Gott
statt
ein altitalischer Gott
).
Bitte bei der Korrektur besonderes Augenmerk auf diese Fehler legen!
Altmodische Worte
Vor 120 Jahren wurden zahlreiche Worte anders benutzt, als es uns heute richtig erscheint. Tatsächlich waren sie aber für die damalige Zeit korrekt und werden deshalb natürlich nicht verändert. Beispiele:
Andes (statt Anden) - Anwalte (Pl.) - Chiffer - diesseit - Dschangel - Epheu - etwanig - Fronte - Gewinst (= Gewinn) - Hygieine - Iambus - Iason - indigblau - Iota - jenseit - Kapitäl (= Kapitell) - Litteratur - Missionär - normännisch - Pachter (statt Pächter) - Porträte (Pl.) - Rhachitis - "der Rhône" - Sudân - Thal - Thee - Thon - Thräne - Thür - ursachlich - vervollkommen - Viscaya
Zum Zwecke der Betonung werden manchmal Worte ungewöhnlicherweise groß geschrieben: