{"id":237,"date":"2005-11-22T02:25:48","date_gmt":"2005-11-22T01:25:48","guid":{"rendered":"http:\/\/www.clausmoser.com\/?p=237"},"modified":"2005-11-22T02:49:20","modified_gmt":"2005-11-22T01:49:20","slug":"bbc-to-google-base-youre-boring","status":"publish","type":"post","link":"http:\/\/clausmoser.de\/blog\/2005\/11\/22\/bbc-to-google-base-youre-boring\/","title":{"rendered":"BBC to Google Base: You&#8217;re boring"},"content":{"rendered":"<p><img decoding=\"async\" align=\"left\" src=\"http:\/\/static.flickr.com\/35\/65675844_019a07c3ef_m.jpg\" alt=\"BBC Database\" \/> Vor einigen Jahren habe ich mal f\u00fcr RTL eine Comedy-Datenbank aufgebaut. Das war der geilste Job meines Lebens: Wir guckten den ganzen Tag die besten Comedy-Serien aus England und den USA (<em>The Fast Show<\/em>! <em>The Day Today<\/em>!) und hackten nebenher ein paar Daten in den Computer. Schon damals hab ich mir gedacht: Einmal in die Archive der BBC steigen d\u00fcrfen und da die ganzen Sch\u00e4tze heben. Und tats\u00e4chlich: Daran frickeln zur Zeit ein paar Programmierer, und wenn das, woran sie da frickeln, auch nur halb so spannend ist, wie es in der Ger\u00fcchtek\u00fcche und im Flurgefl\u00fcster klingt, dann ist Googles niedliche <a href=\"http:\/\/base.google.com\">Base<\/a> dagegen Informatik aus der Volkshochschule.<!--more--><\/p>\n<p>Die BBC hat vor zwei Jahren angek\u00fcndigt, ihre Archive der \u00d6ffentlichkeit zug\u00e4nglich zu machen.Das steht im Zusammenhang mit vielen \u00e4hnlichen (und fast durchweg spannenden) <a href=\"?p=113\">BBC-Initiativen<\/a>, die eine ganz interessante Neuorientierung des \u00f6ffentlich-rechtlichen Rundfunks einleiten k\u00f6nnten. Die Anforderungen sind freilich nicht ohne:  &#8222;Fast eine Million Programme sind katalogisiert, mit Beschreibungen, Details \u00fcber Mitwirkende und Anmerkungen, die aus einem herrlich detaillierten und kontrollierten Vokabular bezogen werden&#8220;, schreibt <a href=\"http:\/\/www.hackdiary.com\/archives\/000071.html\">Mark Biddulph<\/a>, der f\u00fcr das Projekt verantwortlich ist.<\/p>\n<p>Diese Eintragungen gehen bis in kleinste Programmdetails &#8211; Biddulph erz\u00e4hlt, dass er einen Auftritt seines Vaters in einer regionalen Nachrichtensendung wiederfinden konnte -, und die nat\u00fcrlich soll die finale Version der Datenbank multimedial sein.<\/p>\n<p>Man kann sich vorstellen, dass es eine Herkulesarbeit ist, einen strukturierten Zugriff auf diese Datenflut einzurichten. Biddulph hat von der BBC scheinbar freie Hand bekommen, um das Projekt randvoll mit allem zu packen, was im Moment an Features so angesagt ist:<\/p>\n<blockquote><p>Es ist alles in Ruby on Rails entwickelt, und es hat Unmengen Ajax und Tags und RDF und FOAF und Sparklines und Microformats, und \u00fcberhaupt alles, was wir noch mit unterbringen k\u00f6nnen.<\/p><\/blockquote>\n<p>hei\u00dft es im Blog von Designer <a href=\"http:\/\/www.benhammersley.com\/weblog\/2005\/10\/31\/hot_bbc_archive_action.html\">Ben Hammersley<\/a>. Und wenn er sagt, hier entstehe  &#8222;the Database to end all Databases&#8220;, dann klingt das vielleicht hoch gestochen, aber im Grunde ist das der Anspruch, dem ein solches Projekt gen\u00fcgen muss. Herauskommen soll, n\u00e4mlich nichts Geringeres als<\/p>\n<blockquote><p>eine Art BBC-Wikipedia voller Live-Feeds \u00fcber Suchbegriffe, Programme, BBC-Mitarbeiter usw., mit Daten, die bis ins Jahr 1936 zur\u00fcckreichen, und einem kontrollierten Vokabular an Stichworten, dass in der gesamten Zeitspanne von BBC-Bibliothekaren genauestens beachtet wurde. Das wird ein einmaliges Datenarchiv sein, und die BBC rechnet mit bei diesem Ding mit bis zu 3.000 Anfragen pro Sekunde (ja, Sie haben das richtig gelesen).<\/p><\/blockquote>\n<p>Das schreibt einer, der bei der <a href=\"http:\/\/www.quotesque.net\/archives\/2005\/11\/web_38_london_w.html\">ersten \u00f6ffentlichen Pr\u00e4sentation<\/a>, letzte Woche auf einer Konferenz in London, mit dabei war. Ich war&#8217;s nicht, aber angesichts der positiven Stimmen, die man von Teilnehmern h\u00f6ren und lesen kann, bin ich schon etwas neidisch. (<a href=\"http:\/\/www.hackdiary.com\/slides\/wf2005\/\">Hier<\/a> gibt es Biddulphs Slides im S5-Format, die sind allerdings nicht so vielsagend. Screenshots gibt&#8217;s <a href=\"http:\/\/www.hackdiary.com\/images\/peel-search.png\">hier<\/a> und <a href=\"http:\/\/www.hackdiary.com\/images\/peel-contrib.png\">hier<\/a> &#8211; noch dazu als nette Verbeugung an einen gro\u00dfen Mann.)<\/p>\n<p>Aber was hat die multimediale Datenbank eines Rundfunkhauses mit Google Base zu tun? Sehr viel, denn die Erfassung der Programmarchive ist ja nur der Anfang. Der n\u00e4chste Schritt wird sein, auch den Zugriff auf die Inhalte zu erm\u00f6glichen: Auch hier geht es um schnellen und eleganten Zugriff auf disparate Informationen: Eine <a href=\"?p=218\">Datenbank f\u00fcr alles<\/a>. Und da kann ein Dinosaurier wie die BBC auf ganz andere Ressourcen zur\u00fcckgreifen als Google: Kochrezepte, regionale Infos,  Tipps f\u00fcr Hobbyg\u00e4rtner &#8211; was Google von seinen Nutzern erst hochgeladen bekommen m\u00f6chte, ist ja dort schon alles vorhanden. Das Wettrennen geht nun darum, wer es am schnellsten schafft, diese Inhalte so ins Netz zu bef\u00f6rdern, das man alle m\u00f6glichen Verwertungsm\u00f6glichkeiten da andocken kann. Google ist zwar ganz sch\u00f6n flink unterwegs, aber an der BBC sieht man, dass die alten Dickschiffe noch lange nicht reif f\u00fcrs Trockendock sind.<\/p>\n<p>Die BBC jedenfalls will demn\u00e4chst mal eine \u00f6ffentliche Beta launchen. Die wird noch nicht multimedial sein, sondern erst einmal Zugriff auf s\u00e4mtliche Programmdaten seit 1936 bieten: &#8222;So eine Art IMDB f\u00fcr die BBC, nur gr\u00f6\u00dfer&#8220;, hei\u00dft es bei Hammersley. Ich bin gespannt.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Vor einigen Jahren habe ich mal f\u00fcr RTL eine Comedy-Datenbank aufgebaut. Das war der geilste Job meines Lebens: Wir guckten den ganzen Tag die besten Comedy-Serien aus England und den USA (The Fast Show! The Day Today!) und hackten nebenher ein paar Daten in den Computer. Schon damals hab ich mir gedacht: Einmal in die [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-237","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts\/237","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/comments?post=237"}],"version-history":[{"count":0,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/posts\/237\/revisions"}],"wp:attachment":[{"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/media?parent=237"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/categories?post=237"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/clausmoser.de\/blog\/wp-json\/wp\/v2\/tags?post=237"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}