Ich habe gerade mal in den RGG Artikel zu Zion reingelesen und war erstaunt über die zahlreichen Fehler; ich hoffe, dass das nicht durchgängig in der RGG so ist bzw. mit einem Update behoben werden kann.
Einige habe ich über Tippfehler melden gemeldet, wollte aber hier nochmal sammeln.
Das war bei einem Werk diesen Umfangs leider zu erwarten...
In diesem Bereich sollte dringend reagiert werden. Nicht auszudenken wie lange es beim Kittel dauern wird...
Das Lexikon zur Bibel ist vor 2 Jahren eingeführt worden und wird immer noch laufend verbessert, korrigiert, getaggt usw,
Ich vermute Faithlife Deutschland hat hier nicht ausreichend Personal.
God is most glorified in us, when we are most satisfied in Him. John Piper
Danke, den falschen Tooltip-Abkürzungen gehen wir nach.
Die Tippfehler haben wir anscheinend so geliefert bekommen. Die meldet ihr am besten mit der eingebauten Funktion im Kontextmenü (man muss dazu mit dem Internet verbunden sein).
Jahreszahlen-Tagging wäre eine Erwägung wert.
Ben Misja (Faithlife):Jahreszahlen-Tagging wäre eine Erwägung wert.
Da Logos das Zeitleisten-Tool besitzt wäre ein Jahreszahlen-Tagging ganz klar Gold wert!
Ben Misja (Faithlife): Die Tippfehler haben wir anscheinend so geliefert bekommen. Die meldet ihr am besten mit der eingebauten Funktion im Kontextmenü (man muss dazu mit dem Internet verbunden sein).
Ich habe gestern auch einen Artikel gelesen in dem mehr als die Hälfte der Umlaute fehlte (vereinzelt auch Umlaute, wo keine hingehören).Hätte ehrlicherweise vom Verlag besseres erwartet...
Im Mitarbeiterverzeichnis (das freilich nicht der Kern des Werks ist ) war teilweise statt der Raute als Trennzeichen ein ? zu sehen (aber eben nicht überall.)
Nichtsdestotrotz freue ich mich, dass FL diesen "dicken Fisch" an Land gezogen hat! (und bin zuversichtlich, dass die Fehler weniger werden - das ist ja der Vorteil ggü. Print)
Tobias Gerbothe:Hätte ehrlicherweise vom Verlag besseres erwartet...
Ich will hier den Verlag ein bisschen in Schutz nehmen, wir klären gerade noch, an welcher Stelle sich diese Fehler eingeschlichen haben und Ben äußert hier auch nur eine erste Vermutung. Da wir digital exportierbare Daten erhalten hatten sollte es eigentlich nicht an unserem Produktionsprozess liegen, aber komplett ausschließen will ich das auch nicht.
Und wie du schon sagst, glücklicherweise haben wir ja die Möglichkeit, hier die Fehler nach Veröffentlichung zu beheben.
Director, New Languages & Business Line Management
Es gibt in der RGG leider viele, viele Fehler, die vermutlich von einem schlechten OCR-Programm herrühren:
Leider kann ich hier - anders als bei anderen Ressourcen - auch keine Tippfehlermeldung wegschicken, das kleine aufpoppende Fenster reagiert weder auf "Senden" noch auf "abbrechen"
Fehler gefällig (Mal so als Beispiel:) Fehler sind unterstrichen.
Verklarungsfest. Die rom.-kath. Kirche und die Kirchen des byz. Ritus feiern am 6. 8. das V. (Mk9,29 par.). Seine Ursprunge liegen im Osten des 5./6. Jh. Seit dem 10. Jh. in der frankischen Liturgie bekannt, fuhrte es Papst → Calixtus III. 1457 allg. in die kath. Kirche ein. Im byz. Ritus eines der zwolf Hochfeste, hat es im jetzigen rom. Mefibuch (1970) als »Fest« → Gloria (Messe) und Te Deum H Ambrosianischer Lobgesang; Lesehore). Im lat. und byz. Ritus dominiert das eschatologische Thema: Die → Verklarung Jesu Christi ist Modell für die Erlösung des Menschen. Je nach Lesejahr verkundet das Evangelium drei synopt. Berichte des Geschehens; die beiden Lesungen (Dan 7, 9f. 13f. und 2Petr 1, 16–19) verweisen auf die Verklarung.
Und die RGG4 ist voll von solchen OCR-Fehlern.
Mal ehrlich, das geht gar nicht! So was kann man doch nicht zitieren....
Es wird Zeit die RGG4 mal fehlermäßig gründlich zu überarbeiten!
Noch was: Der Artikel "Versuchung" ist lexikalisch falsch unter dem Oberbegriff "Verstockung" zu finden. Hier stimmt die Überschriftenzuordnung nicht. Man könnte beim Suchen im Inhaltsverzeichnis meinen, dass "Versuchung" gar nicht in der RGG behandelt wird.
Thomas Ehlert:Fehler sind unterstrichen.
Du hast das "H" übersehen, dass wohl recht oft anstatt der öffnenden Klammer fehl-erkannt wurde...
Running Logos 9 latest (beta) version on Win 10
Ehrlicherweise nutze ich die RGG viel weniger als ich gedacht hätte oder es gern tun würde. Das liegt vermutlich am fehlenden/unvollständigen Tagging. Wenn ich sie mehr nutzte, würde ich auch mehr Fehler melden.
Danke für eure Meldungen. Den Unmut kann ich verstehen, wir sind auch nicht glücklich!
Die RGG wird derzeit aktualisiert, um etliche gemeldete Tippfehler zu beheben. Leider gibt es aber systematische Probleme mit der Textgrundlage, die zur Produktion herangezogen wurde - wir ihr schon sagt, haben wir da offenbar Rohdaten erhalten, die nicht ordentlich digitalisiert wurden. Wir prüfen deshalb gerade unsere Optionen, was eine umfassende Korrektur anhand besserer Daten angeht.
Die inhaltliche Arbeit zur Faktenbuch-Verknüpfung ist schon länger abgeschlossen. Der Auslieferung stehen allerdings noch einige Schritte im Weg. Die RGG ist das umfassendste Lexikon, das Faithlife in dieser Hinsicht jemals produziert hat. Das merken wir leider bei jedem Schritt.
Thomas Ehlert: Es gibt in der RGG leider viele, viele Fehler, die vermutlich von einem schlechten OCR-Programm herrühren: Leider kann ich hier - anders als bei anderen Ressourcen - auch keine Tippfehlermeldung wegschicken, das kleine aufpoppende Fenster reagiert weder auf "Senden" noch auf "abbrechen" Fehler gefällig (Mal so als Beispiel:) Fehler sind unterstrichen. Verklarungsfest. Die rom.-kath. Kirche und die Kirchen des byz. Ritus feiern am 6. 8. das V. (Mk9,29 par.). Seine Ursprunge liegen im Osten des 5./6. Jh. Seit dem 10. Jh. in der frankischen Liturgie bekannt, fuhrte es Papst → Calixtus III. 1457 allg. in die kath. Kirche ein. Im byz. Ritus eines der zwolf Hochfeste, hat es im jetzigen rom. Mefibuch (1970) als »Fest« → Gloria (Messe) und Te Deum H Ambrosianischer Lobgesang; Lesehore). Im lat. und byz. Ritus dominiert das eschatologische Thema: Die → Verklarung Jesu Christi ist Modell für die Erlösung des Menschen. Je nach Lesejahr verkundet das Evangelium drei synopt. Berichte des Geschehens; die beiden Lesungen (Dan 7, 9f. 13f. und 2Petr 1, 16–19) verweisen auf die Verklarung. Und die RGG4 ist voll von solchen OCR-Fehlern. Mal ehrlich, das geht gar nicht! So was kann man doch nicht zitieren.... Es wird Zeit die RGG4 mal fehlermäßig gründlich zu überarbeiten!
Ich habe die RGG3 als CD-ROM. Da sind mir diese Fehler nicht aufgefallen. Will heissen, der Fehler kann nicht vom OCR stammen. Da sie sicher RGG3 als Ausgangsbasis genommen haben für die 4.
Fabian: Ich habe die RGG3 als CD-ROM. Da sind mir diese Fehler nicht aufgefallen. Will heissen, der Fehler kann nicht vom OCR stammen. Da sie sicher RGG3 als Ausgangsbasis genommen haben für die 4.
Das kann ich mir kaum vorstellen. RGG4 ist ja nicht nur ein "korrigierter" Druck der RGG3.
Vorwort RGG4: Was heißt nun »völlig neu bearbeitet« im Blick auf die vierte Auflage? Völlig neu bearbeitet ist einmal die Aufstellung der Fachbereiche und der Stichwortliste, wobei das Aufspüren von Lücken und Überschneidungen durch sorgfältiges Vergleichen mit früheren Auflagen nur der Anfang war. Sodann mußten die Fächer- und Stichwortlisten an die neuen wissenschaftlichen Gegebenheiten angepaßt werden. Ebenfalls neu ist die über Europa hinausreichende internationale Perspektive bei der Beauftragung von Fachberatern und Autoren. Durch diese Erweiterung wurde die Vorbereitung auch für die Herausgeber zu einer Entdeckungsreise in wenig bekannte Gebiete. Diese Reise wurde länger als erwartet, und wir haben dabei unsere Reisegefährten, die Fachberater, die Autorinnen und Autoren, die Mitarbeiter und Mitarbeiterinnen der Redaktion und den Verleger, schätzen gelernt. Wir laden nun unsererseits die Leserinnen und Leser zu Entdeckungen in der Vielfalt der Artikel in der neuen RGG ein.
Was heißt nun »völlig neu bearbeitet« im Blick auf die vierte Auflage? Völlig neu bearbeitet ist einmal die Aufstellung der Fachbereiche und der Stichwortliste, wobei das Aufspüren von Lücken und Überschneidungen durch sorgfältiges Vergleichen mit früheren Auflagen nur der Anfang war. Sodann mußten die Fächer- und Stichwortlisten an die neuen wissenschaftlichen Gegebenheiten angepaßt werden. Ebenfalls neu ist die über Europa hinausreichende internationale Perspektive bei der Beauftragung von Fachberatern und Autoren. Durch diese Erweiterung wurde die Vorbereitung auch für die Herausgeber zu einer Entdeckungsreise in wenig bekannte Gebiete. Diese Reise wurde länger als erwartet, und wir haben dabei unsere Reisegefährten, die Fachberater, die Autorinnen und Autoren, die Mitarbeiter und Mitarbeiterinnen der Redaktion und den Verleger, schätzen gelernt. Wir laden nun unsererseits die Leserinnen und Leser zu Entdeckungen in der Vielfalt der Artikel in der neuen RGG ein.
Willst du mir wirklich sagen, die hätten den elektronischen Text aus RGG3 verworfen und dann für den elektronischen Text der RGG4 alles gedruckt und dann ein OCR gemacht? Aus meiner Sicht haben sie auf der Grundlage des elektronischen Textes der RGG3 Hinzufügungen gemacht. Aber schon elektronisch. Und nicht von OCR. Auch wenn die RGG4 schon älter ist. Computer hat es schon gegeben.Siehe RGG3. Ich bezog mich oben darauf, dass die Fehler per OCR gekommen seien. Das kann ich mir aber beim besten Willen nicht vorstellen. Eher ein LaTex zu Word Problem.
Also für mich sieht das total nach OCR-Fehlern aus, und zwar ehrlich gesagt danach, dass jemand "dumm" ein nur auf englisch eingestelltes OCR über den Text hat laufen lassen. Die Fehler mit der Nicht-Erkennung von Umlauten und ß sind mE nur so erklärbar.
Fabian: Willst du mir wirklich sagen, die hätten den elektronischen Text aus RGG3 verworfen und dann für den elektronischen Text der RGG4 alles gedruckt und dann ein OCR gemacht? Aus meiner Sicht haben sie auf der Grundlage des elektronischen Textes der RGG3 Hinzufügungen gemacht. Aber schon elektronisch. Und nicht von OCR. Auch wenn die RGG4 schon älter ist. Computer hat es schon gegeben.Siehe RGG3. Ich bezog mich oben darauf, dass die Fehler per OCR gekommen seien. Das kann ich mir aber beim besten Willen nicht vorstellen. Eher ein LaTex zu Word Problem.
Also zunächst (im Internet wichtig zu sagen ) ich will keinen Streit vom Zaun brechen: Ich spekuliere auch nur. Also nur zur Erklärung meines Gedankens: Die RGG3 ist aus den 1960ern also sicher nicht digital erstellt. Die RGG4 ist in den späten 90ern und 2000ern erschienen. Die RGG3 in der DigiBib ist von 2004. Ich kenne mich mit den Methoden der Zeit nicht so aus, kann sein, dass den Autoren der RGG4 Digitalisate der RGG3 zu Verfügung gestellt wurden. Ich vermute aber, dass da noch sehr viel mit Papier gearbeitet wurde.
Der Punkt, der mich eher wundert, ist, dass es ja eine digitale Ausgabe der RGG4 gibt. Die wird bei Brill gehostet (die auch die engl. Üs. haben.) Da sind die Fehler nicht drin. Kann natürlich sein, dass Brill das Digitalisat gemacht hat und nicht Mohr Siebeck...
Thomas Ehlert: (Mk9,29 par.)
(Mk9,29 par.)
hier müsste es "Mk9,2-9 par." heißen. Sehr trügerisch
Es würde mich sehr überraschen, wenn die digitale RGG3 bei der Erstellung der RGG4 (oder ihrer elektronischen Edition) irgendeine Rolle gespielt hätte, aber ausschließen kann ich es nicht. Soweit ich weiß, ist wirklich ein großer Teil der Texte signifikant bearbeitet oder neu erstellt worden.
hastaenuntius:Der Punkt, der mich eher wundert, ist, dass es ja eine digitale Ausgabe der RGG4 gibt. Die wird bei Brill gehostet (die auch die engl. Üs. haben.) Da sind die Fehler nicht drin. Kann natürlich sein, dass Brill das Digitalisat gemacht hat und nicht Mohr Siebeck...
Ich bin leider auch nicht sicher, wo die Daten herkommen, da ich an der Koordination des Projekts nicht direkt beteiligt war.
hastaenuntius:Ich bezog mich oben darauf, dass die Fehler per OCR gekommen seien. Das kann ich mir aber beim besten Willen nicht vorstellen. Eher ein LaTex zu Word Problem.
Kannst du das näher ausführen? Das interessiert mich. Wenn dem so ist, wäre die Lösung vielleicht einfacher als eine manuelle Korrektur....
Hallo Ben
Das LaTex zu Word Problem ist mir aufgefallen, als ich von PDFs kopiert und in Word eingefügt habe. Von einigen PDFs waren alle Umlaute, ß und Ligaturen zerschossen. Ich bin dann darauf gestossen, dass jene PDFs mit LaTex erstellt wurden. Ich hatte damals dann einfach per Suchen Ersetzen, mit aktivierten Case Sensitive, die Änderungen vorgenommen. In der Zwischenzeit weiss ich, dass es Programme gibt, das von haus aus können.
Eine weitere Möglichkeit könnte sein, dass das Programm u und ¨ benutzte für ü. Und dann bei einem Wechsel von z.B. unicode zu Latin1 die ¨ gelöscht wurden. Nicht jedes Programm handhabt das sauber.
Ich weiss es gibt für alles was ich oben beschrieben habe Fachausdrücke, aber ich hoffe meine Umschreibungen sind dennoch hilfreich.
Also in der Welt der Zeichensätze und Codierungen gibt es eine Unmenge an Fehlerquellen, es wäre jetzt schon sehr gewagt zu spekulieren wo genau die Übertragung einer Zeichenkette nicht korrekt funktioniert hat. Es wäre weitaus einfacher nachzuvollziehen, welche Schritte unternommen wurden um sich dann anzuschauen an welcher Stelle die Fehler aufgetreten sind (und in welchen Umgebungen, Tools, Formaten) um eine Einschätzung geben zu können.
Auch das Thema PDF ist unglaublich komplex und es gibt so viele Möglichkeiten wie ein PDF aufgebaut ist, dass man nie generell sagen kann, ob ein auf eine Weise generiertes PDF kopierten Text (mit welchen Tool geöffnet? in welche Word-Version kopiert?) auf eine bestimmte Weise falsch codiert weitergibt. Aber ich denke, das ist sowieso klar.
Die Möglichkeit bei den aktuelleren Microsoft Word-Versionen ein PDF direkt mit Word zu öffnen ist euch bekannt, oder? Aber da das auch hier nur in manchen Fällen einigermaßen und in den seltensten Fällen korrekt funktioniert, weißt auf das eben angesprochene PDF-Problem hin.
Update: Wir hatten neulich einen Kostenvoranschlag zur systematischen Korrektur der RGG-Ressource anhand der Druckdaten beantragt. Die Korrektur ist jetzt in Auftrag gegeben. Ich werde hier nach Möglichkeit über das Auslieferungsdatum informieren. Wer Bescheid wissen will, könnte z.B. neue Beiträge in diesem Thread abonnieren.