{"id":896,"date":"2009-09-03T19:00:41","date_gmt":"2009-09-03T16:00:41","guid":{"rendered":"http:\/\/www.clausmoser.com\/?p=896"},"modified":"2009-09-03T19:00:41","modified_gmt":"2009-09-03T16:00:41","slug":"google-books-und-die-entgleisten-metadaten","status":"publish","type":"post","link":"http:\/\/clausmoser.de\/blog\/2009\/09\/03\/google-books-und-die-entgleisten-metadaten\/","title":{"rendered":"Google Books und die entgleisten Metadaten"},"content":{"rendered":"<p><a href=\"http:\/\/books.google.com\">Google Books<\/a> wird ja derzeit von mehreren Seiten aus unter Feuer genommen, aber ich muss gestehen, <a href=\"http:\/\/languagelog.ldc.upenn.edu\/nll\/?p=1701\">dieser Artikel hier<\/a> hat mich zu gleichen Teilen fasziniert, am\u00fcsiert und erschreckt. Denn es sieht so aus, als ob die Metadaten (Autor, Erscheinungsjahr usw.) vieler bei Google Books erfasster B\u00fccher fehlerhaft sind, und zwar in einem Ausma\u00df, dass die \u00fcblichen Pannen, Bugs und Schludrigkeiten um ein vielfaches \u00fcbersteigt.<\/p>\n<blockquote><p>Google&#8217;s [metadata] are a train wreck: a mish-mash wrapped in a muddle wrapped in a mess. <\/p><\/blockquote>\n<p>Das ist deutlich gesagt, und der Artikel f\u00e4hrt (elegant und mit reichlich S\u00fcffisanz) eine gro\u00dfe Zahl von Beispielen auf: Falsche Datierungen, falsche Autorenangaben, unsinnige Rubrizierungen &#8211; teilweise so absurd und grotesk, als habe man mit Karteikarten Bingo gespielt. Etwa dies hier:<\/p>\n<blockquote><p>To take G[oogle] B[ook]&#8217;s word for it, 1899 was a literary annus mirabilis, which saw the publication of Raymond Chandler&#8217;s <em>Killer in the Rain<\/em>, <em>The Portable Dorothy Parker<\/em>, Andr\u00e9 Malraux&#8216; <em>La Condition Humaine<\/em>, Stephen King&#8217;s <em>Christine<\/em>, <em>The Complete Shorter Fiction of Virginia Woolf<\/em>, Raymond Williams&#8216; <em>Culture and Society<\/em>, Robert Shelton&#8217;s biography of Bob Dylan, Fodor&#8217;s <em>Guide to Nova Scotia<\/em>, and the Portuguese edition of the book version of <em>Yellow Submarine<\/em>,  to name just a few.<\/p><\/blockquote>\n<p>Ich kann nur empfehlen, den Artikel selbst nachzulesen. Es lohnt sich auch, die nachfolgenden Kommentare durchzust\u00f6bern &#8211; nicht nur, weil da noch einige bizarre Beispiele folgen (ein Buch, das laut Google <a href=\"http:\/\/books.google.com\/books?id=sxYEAAAAQAAJ&#038;pg=PA1&#038;dq=%22Holy+Trinity%22#v=onepage&#038;q=&#038;f=false\">von der Heiligen Dreifaltigkeit<\/a> verfasst wurde), sondern weil sich auch ein Google-Verantwortlicher <a href=\"http:\/\/languagelog.ldc.upenn.edu\/nll\/?p=1701#comment-41758\">zu Wort meldet<\/a>. Zun\u00e4chst mit dem erstaunlichen Eingest\u00e4ndnis:<\/p>\n<blockquote><p>We know we have problems. Oh lordy we have problems. Geoff refers to us having hundreds of thousands of errors. I wish it were so. We have millions.<\/p><\/blockquote>\n<p>Ein Satz, den ich so nie vom Hersteller meines Autos h\u00f6ren m\u00f6chte. Nach dieser vertrauenerweckenden Mitteilung folgt aber ein ausf\u00fchrliches Aufrechnen, wer jetzt genau f\u00fcr die zitierten Fehler verantwortlich ist, und nein, es liegt nat\u00fcrlich nicht an Google, sondern vor allem an den Bibliotheken und den widerspr\u00fcchlichen, mi\u00dfverst\u00e4ndlichen oder fehlerhaften Daten, die von dort geliefert werden.<\/p>\n<p>Selbst wenn das so w\u00e4re (und vielen dieser versuchten Richtigstellungen wird im Blog selbst schon Kontra gegeben): Es ist wohl kaum der richtige Weg, wenn das System solche Fehler einfach nur aufsaugt und (inklusive reichlich beigemischter eigener Pannen) einfach nur ausspuckt. Wenn man bei Google wei\u00df, das aktuelle Prozesse der Erfassung und Katalogisierung nicht nur \u201eHunderttausende\u201c, sondern sogar \u201eMillionen von Irrt\u00fcrmern\u201c mit sich bringen: Warum schaufelt man diese Irrt\u00fcmer trotzdem tausendfach in die \u00d6ffentlichkeit, in der vagen Hoffnung, irgendwelche \u201eCrowdsourcing\u201c-Mechanismen k\u00f6nnten f\u00fcr die n\u00f6tigen Korrekturen sorgen?<\/p>\n<p>In der aktuellen Kritik an Google Books mag viel Hysterie beigemischt, aber das eine bedeutende Ressource auf arg wackligen F\u00fc\u00dfen daherkommt, das ist bedenklich.<\/p>\n<p>(<a href=\"http:\/\/archiv.twoday.net\/stories\/5916959\/\">Via<\/a>.)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Google Books wird ja derzeit von mehreren Seiten aus unter Feuer genommen, aber ich muss gestehen, dieser Artikel hier hat mich zu gleichen Teilen fasziniert, am\u00fcsiert und erschreckt. Denn es sieht so aus, als ob die Metadaten (Autor, Erscheinungsjahr usw.) vieler bei Google Books erfasster B\u00fccher fehlerhaft sind, und zwar in einem Ausma\u00df, dass die [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-896","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts\/896","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/comments?post=896"}],"version-history":[{"count":1,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts\/896\/revisions"}],"predecessor-version":[{"id":1006,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts\/896\/revisions\/1006"}],"wp:attachment":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/media?parent=896"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/categories?post=896"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/tags?post=896"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}