Schnellsuche:

Hilfe zur Arbeit als Korrektor

1. Textübertragungen
Zwischenüberschriften, Absätze und Leerzeilen

Artikel zu verschiedenen Schlagworten werden durch eine Leerzeile getrennt (= Return - Return). Absätze innerhalb eines Artikels werden mit nur einem Return getrennt, ohne Leerzeichen am Beginn. Zwischenüberschriften sollten dem Original-Layout möglichst ähnlich in den Textverlauf eingebunden werden. Eine besondere Kennzeichnung ist erst beim Taggen vorgesehen. Manchmal gibt es Leerzeilen innerhalb eines Artikels, etwa vor oder nach einer Tabelle. Sie können mit ^[Leerzeile] gekennzeichnet werden.

In diesem Zusammenhang: Es hat sich eingebürgert, spezielle Hinweise oder Formatierungen, die sich nicht im Text abbilden lassen, über ^[Hinweis] einzubinden. Dadurch lassen sich bei der Übertragung in das XML-Format (taggen) spezielle Stellen leichter finden.

Verschiedene Schriftarten

Zwischen Frakturschrift, lateinischen Buchstaben, Kursiven usw. wird in den Korrekturstufen normal und fein nicht unterschieden.

FaksimileUmsetzung
Schriftarten Die Früchte von C. explodens Naud. schleudern [...]
Sperrungen

Gesperrte Worte werden in den Korrekturschritten normal und fein wegen der Suchfunktionen ungesperrt geschrieben.

FaksimileUmsetzung
Sperrungen im Vertrag von Hamburg
Original-Schreibfehler

Fehlerhaft geschriebene Worte werden übernommen und in einer markierten Klammer ^[ ] richtiggestellt. Ganz unten auf dieser Seite ist eine Liste ungewöhnlicher, aber richtiger Worte.

FaksimileUmsetzung
Fehler Humburg ^[richtig: Hamburg]
Bildunterschriften

Die Reste der zu Abbildungen gehörenden Worte innerhalb der ocr-ten Textseiten müssen entfernt werden, damit der laufende Artikeltext nicht unterbrochen wird. Um den Leser über die Existenz einer Abbildung zu informieren, sollte am Ende des dazugehörigen Artikels oder des Abschnitts bzw. am Seitenende in markierter Klammer ^[Abb.: Bilduntertext] eingefügt werden. Das häufig vorhandene "Fig." bitte mit dazuschreiben. Wenn es keinen Bilduntertext gibt, genügt ^[Abb.].

Fußzeilen

Hinweiszeilen, wie z. B. bei dem Buchstaben C im Meyers, werden am Ende der Seite in markierten Klammern wiedergegeben.
Fußzeile
^[Artikel, die unter C vermißt werden, sind unter K oder Z nachzuschlagen.]

Überflüssige Fußzeilen

Signaturen (Hilfszeilen für den Buchbinder) am Seitenfuß werden gestrichen.
Signatur

Tabellen

Die Werte in den Tabellen sollten mit TAB-Zeichen getrennt sein.
Das TAB-Zeichen bekommt man über die Tabulator-Taste; es wird in Editoren zumeist als Pfeil oder kleiner Winkel dargestellt.
Punktreihen und senkrechte Linien bzw. das, was beim OCR davon blieb, fallen weg.
Mehrspaltige Tabellen sollten zu einer langen Tabelle ohne Wiederholung der Spaltenbezeichner umgestaltet werden.
Eventuell vorhandene Leerzeilen vor oder nach der Tabelle können mit ^[Leerzeile] gekennzeichnet werden.

FaksimileUmsetzung
Originaltabelle Transformierte Tabelle
Komplexe Formeln und Ähnliches

Schwer darstellbare Textteile werden mit Hilfe der ^[ ]-Klammerung dargestellt. Das Bild wird später beim Taggen eingefügt.

FaksimileUmsetzung
Formel Hier ist aber die linke Seite ein vollständiges Quadrat, und man kann schreiben
^[img]
woraus durch Ausziehen der Quadratwurzel folgt
Trennstriche am Seitenende
FaksimileUmsetzung
Seitenende ... Preußen, Oldenburg und Ham-^[folgende Seite]
2. Behandlung einzelner Zeichen
Anführungszeichen

Die im Lexikon verwendeten Winkel-Anführungszeichen (beim Meyers » «, im Brockhaus « ») können auch im Schreibmaschinenstil (" ") wiedergegeben werden. Die richtigen Anführungszeichen werden zu einem späteren Zeitpunkt automatisch wieder hergestellt. Wer will, kann auch gleich die richtigen Zeichen einfügen, bei Windows mit der Tastenkombination Alt+0171 für « und Alt+0187 für »; Linuxbenutzer nehmen AltGr + y für « und AltGr + x für ».

FaksimileUmsetzung
Anführungszeichen "Hamburg"
Hoch- und tiefgestellte Zeichen

Für Hoch- und Indexzeichen ist als vereinfachte Kennzeichnung ^{ } bzw. _{ } festgelgt. So markierte Zeichen werden später automatisch in HTML-Code umgesetzt. Wer will, kann in markierten Klammern auch gleich die HTML-Schreibweise verwenden.
Achtung: Jahreszahlen und Nachkommastellen wurden im Lexikon manchmal mit etwas kleineren Lettern gesetzt. Im normal und fein-Text bleiben sie aber in normaler Größe.

FaksimileUmsetzungHTMLDarstellung
Exponent (5^{3})^{2} (5<sup>3</sup>)<sup>2</sup> (53)2
Chemische Formel C12H22O11 ^[C_{12}H_{22}O_{11}] C12H22O11 ^[C<sub>12</sub> H<sub>22</sub> O<sub>11</sub>] C12H22O11 ^[C12H22O11]
3. Hilfreiches
Typische Fehler der OCR

Durch den OCR-Vorgang entstehen häufige Verwechslungen bestimmter Buchstaben:
s <-> f; n <-> u; u -> U
Folgende Vertauschungen treten zumeist in Zahlen auf und führen ohne Richtigstellung zu Fehlern bei der Suche nach Jahreszahlen:
O <-> 0; l, I <-> 1
Typisch ist auch dieser Fehler:
Friedrich III. -> Friedrich HL o. Ä.
Die Großbuchstaben I und J sind im Lexikon druckgleich und müssen alle manuell überprüft werden. Als Anhaltspunkt kann man davon ausgehen, daß nach einem J ein Vokal folgt, nach einem I ein Konsonant. In Zweifelsfällen ist es praktisch, das Wort als Stichwort im Lexikon zu suchen: da ergibt sich als richtige Schreibweise z. B. Janus, aber Iambus.
Manchmal hat leider das OCR Worte recht eigenmächtig verändert (z. B. einer statt eines) oder durch falsche Worte ersetzt (z. B. ein alkalischer Gott statt ein altitalischer Gott).
Bitte bei der Korrektur besonderes Augenmerk auf diese Fehler legen!

Altmodische Worte

Vor 120 Jahren wurden zahlreiche Worte anders benutzt, als es uns heute richtig erscheint. Tatsächlich waren sie aber für die damalige Zeit korrekt und werden deshalb natürlich nicht verändert. Beispiele:

Andes (statt Anden) - Anwalte (Pl.) - Chiffer - diesseit - Dschangel - Epheu - etwanig - Fronte - Gewinst (= Gewinn) - Hygieine - Iambus - Iason - indigblau - Iota - jenseit - Kapitäl (= Kapitell) - Litteratur - Missionär - normännisch - Pachter (statt Pächter) - Porträte (Pl.) - Rhachitis - "der Rhône" - Sudân - Thal - Thee - Thon - Thräne - Thür - ursachlich - vervollkommen - Viscaya

Zum Zwecke der Betonung werden manchmal Worte ungewöhnlicherweise groß geschrieben:
Allgeist