Wikidata – eine neue Spielwiese für freies Wissen

12 Apr

Hallo alle Miteinander,

in der Wikipedia lassen sich z. B. Listen für alles Mögliche, in allen möglichen Sprachen finden. Eine nützliche Sache, umso erstaunlicher, wenn all diese Listen „von Hand“ gepflegt werden. Man fragt sich, ob diese Pflege sich nicht zentralisieren bzw. automatisieren lässt? Und ja, es gibt eine solche Anlaufstelle, sie heißt Wikidata.

Wikidata, der jüngste Spross aus dem Wikimedia/Wikipedia-Universum, ist eine Datenbank. Dort werden die einzelnen Artikel aller Wikipedien durch Datenobjekte repräsentiert. mmh, falsch formuliert, die verschiedensprachigen Artikel zu einem Artikel werden durch ein Datenobjekt repräsentiert. Deutschland (genauer das politische Gebilde seit 1871) wird z. B. durch das Datenobjekt Q183 vertreten. Nun durchforsten Computerprogramme (Bots) nach entsprechenden Artikeln. Ist ein Artikel noch nicht in Wikidata, über ein Datenobjekt repräsentiert, wird es eben vom Bot angelegt. 

Jetzt kommt der Mensch ins Spiel: nun taucht das Datenobjekt ÖLEG A (Q293803) auf. Alles was wir haben ist der Titel des Wikipedia-Artikels, der in Wikidata übernommen wurde, und den Wikipedia-Link.  Der Mensch ließt sich den Wikipedia-Artikel durch und filtert bestimmte Aussagen. Die ÖLEG A ist eine Dampflokomotive. Diese Aussage wird in wikidata folgendermaßen dargesetellt: die Aussage Ist ein(e) wird durch das „Property P31“ repräsentiert. Nun muss dieses Property mit einem weiteren Datenobjekt verbunden werden, eben mit der Lokomotive (Q171043). Alles läuft darauf hinaus, dass Datenobjekte über Properties miteinander verbunden werden. Ziel soll sein, Listen automatisch generieren zu können, die heute noch von Hand gepflegt werden. „Gib mir eine Liste aller Lokomotiven, die in Österreich zwischen 1880 und 1900 genutzt wurden“ Oder „gib mir eine Liste der größten Städte der Welt, die von einer Frau regiert werden.“ Oder gib mir eine Liste aller diplomatischen Beziehungen, welche die Bundesrepublik zwischen 1960 und 1975 führte“. Und was soll das Ganze?

Big Data in frei und quellenoffen.

Die Wikipedien dieser Welt bieten einen enormen Datenfundus (aka Big Data) auf. Natürlich steht da auch jede Menge Quatsch drin. Aber ich glaube dass es darum erst mal nicht geht. Diese Daten müssen aufbereitet werden, damit man gezielter nach „Quatsch“ suchen kann. Sicher ist es auch für Soziologen und Sprachforscher interessant, welcher Quatsch, wo steht und ob sich Zusammenhänge finden lassen.

Für mich als Politikwissenschaftler ist folgendes interessant: mit Wikidata werden zukünftige Komolitonen in der Lage sein einfacher zu arbeiten: „Gib mir eine Liste aller förderal verfassten Staaten und deren BIP. Gib mir noch eine Liste aller Einheitsstaaten und deren BIP“. Nun kann der Kommilitone, diese Daten statistisch aufbereiten lassen und für seine Arbeit/Forschung verwenden. Das ist alles ferne Zukunftsmusik, aber sie kommt näher. Und man kann daran mitarbeiten.

Belege, Belege, Belege

Auch wenn es nicht erste Priorität hat, man kann in Wikidata Aussagen belegen. Z. B., dass die BRD diplomatische Beziehungen mit Vietnam führt. Das Auswärtige Amt pflegt in seiner Online-Präsenz Übersichtsseiten über seine  diplomatische Beziehungen, da wird man immer fündig. So kann man das AA (als eigenes Datenobjekt) als Datenherkunft angeben, mit URL der Übersichtsseite, mit Zitat, dass die Aussage konkret belegt, und mit Abrufdatum der URL. Analog kann man beim Außenministerium Vietnam vorgehen und beim entsprechenden Wikipedia-Artikel.

Lernkurve nicht ganz ohne

Einerseits finde ich das Interface bei Wikidata intuitiver als bei Wikipedia. Man muss sich nicht mit Wikisyntax rumquälen. Man tippt (bei Properties und Datenobjekten) etwas ins Feld ein, und es wird etwas passendes ergänzt. Man muss sich die Codes also nicht merken. Man muss aber andererseits wissen, vor allem bei den Properties, was es gibt. Ob dies Sinn ergibt ist eine weitere Frage. So ergibt die Aussage „BWL ist Teil eines Geschäftsführers“ keinen Sinn. Computer und Menschen nehmen es eben sehr genau.

Mir macht es Spaß, wer weiß wie lange noch? 🙂

 

Zum nachhören: Pritlove, Tim (Moderation), Ohlig, Jens: CRE205 Wikidata, Metaebene vom 9. Dezember 2013

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: