Eine Anwendung der sones GraphDB für DBpedia soll aufdecken, welche Wiki Artikel auch indirekt zusammengehören. Nutzer können Beziehungen zwischen den Einträgen künftig noch schneller erkennen.
Die neuartige Datenbank sones GraphDB analysiert Einträge von Wikipedia, um diese künftig noch besser miteinander zu verknüpfen. Zu diesem Forschungszweck stellt die sones GmbH ihre Anwendung der Universität Leipzig zur Verfügung. Die neuartige Datenbank wird für das Projekt DBpedia 3,5 Millionen Datensätze analysieren.
Artikel auf Wikipedia besser verknüpfen
DBpedia ist ein Projekt der Universität Leipzig, der Freien Universität Berlin und von Open Link Software. Es extrahiert strukturiertes Wissen aus Wikipedia-Artikeln und verbindet dieses mit anderen Informationen, wie z.B. der Nachrichtenseite New York Times und dem Buchportal Project Gutenberg. So können bereits vorhandene Inhalte noch weiter verdichtet werden. Bislang nutzt DBpedia dazu vor allem semantische Technologien. Nun sollen auch indirekte und entfernte Beziehungen zwischen den Einträgen aufgedeckt werden. Die bisher verwendeten Technologien sind zwar effizient beim Verwalten und Abfragen großer Datenmengen, sagt Sören Auer, Projektleiter an der Universität Leipzig. Indirekte Beziehungen zwischen den Einträgen über mehrere Informationsknoten hinweg können damit jedoch nur schwer gefunden werden. Für solche Fragestellungen eignet sich die sones GraphDB, die wir als erste ihrer Art für diesen Zweck evaluieren.
Nutzer erkennen Zusammenhänge schneller
Ziel der Kooperation ist es, Zusammenhänge zwischen den jeweiligen Wikipedia-Artikeln besser abzubilden. Soziale Netzwerke ermöglichen es bereits, die Beziehungen zwischen verschiedenen Personen zu beschreiben und zu analysieren. Langfristig sollen Nutzer im Internet beispielweise auch die indirekten Verknüpfungen zwischen Reiseangeboten und touristischen Zielen oder Unternehmen und Politikern leichter erkunden können, erläutert der Projektleiter.
Zukunft für Pharma- und Automobilindustrie
Die GraphDB untersucht Datensätze, in denen Verknüpfungen bis jetzt nur manuell durch die Autoren gesetzt wurden, sagt Daniel Kirstenpfad, CTO bei sones. Die Anwendung findet auch bisher verborgene Zusammenhänge zwischen den einzelnen Wikipedia-Artikeln, die sich dann mittels neuer Links fixieren lassen. In Zukunft können Informationen auch in anderen Bereichen, wie der Pharma- und der Automobilindustrie, so besser miteinander verbunden werden.
DBpedia strukturiert Wissen
DBpedia analysiert Wikipedia-Artikel unter anderem zu Personen, Orten, Organisationen sowie geschichtlichen Ereignissen und biologischen Klassifikationen. Ergebnis ist eine Wissensbasis die ähnlich wie eine Datenbank nach verknüpften Daten abgefragt werden kann. Damit ist es möglich Fragen zu beantworten, auf die einzelne Wikipedia-Artikel keine Antwort geben. In DBpedia kann man so z.B. nach allen Bürgermeisterinnen von Städten mit mehr als 50.000 Einwohnern oder nach allen Fußballspielern mit der Trikotnummer 11 suchen.
Zur GraphDB
Die GraphDB von sones speichert und analysiert strukturierte, semi-strukturierte und unstrukturierte Daten. Sie verwendet die dafür eigens entwickelte Abfragesprache, die Graph Query Language – GQL. Diese ist an das bekannte SQL angelehnt und wurde für die praktischen Anwendungsfälle auf Basis der Graphentheorie entsprechend erweitert.
Über sones
Die sones GmbH, mit Sitz in Leipzig, wurde 2007 in Erfurt gegründet. Sie konnte 2009 die T-Venture, das Venture Capital Unternehmen der Deutschen Telekom, als Investor gewinnen. Die sones GmbH ist spezialisiert auf die Entwicklung von Graph-Datenbanken. Dabei stützt sie sich auf ein eigenes Dateisystem. Die sones GraphDB-Datenbanktechnologie arbeitet ähnlich wie das menschliche Gehirn: Sie verbindet Informationen, indem sie komplexe, semistrukturierte Datenmengen miteinander verknüpft. Damit wird die Skalierbarkeit erleichtert und die Performance bei Speicherung und Analyse von Daten erhöht sich. Die Datenbanktechnologie von sones legt den Grundstein für viele neue Anwendungen etwa in den Bereichen Internet, Dokumentenmanagement und Information Lifecycle Management. 2011 konnte die sones GmbH eine weitere Finanzierungsrunde erfolgreich abschließen. Am Investment beteiligen sich der Technologiegründerfonds Sachsen (TGFS) als Hauptinvestor sowie T-Venture und die Kreditanstalt für Wiederaufbau (KfW). Weitere Informationen und Download der Open Source Edition unter http://www.sones.com.
Über die Forschungsgruppe AKSW
Die Forschungsgruppe Agile Knowledge Engineering and Semantic Web (AKSW) am Institut für Angewandte Informatik (InfAI) der Universität Leipzig arbeitet an Forschungen zur Erzeugung und Bearbeitung von Ontologien, Wissensextraktion, und Datenintegration im Semantic Web. in Fokus der Gruppe ist Ergebnisse sowohl auf theoretischer als auch praktischer Ebene in Form von Software und frei verfügbaren Ontologien zu erzielen. Open-Source Software und Community-Projekte die von AKSW durchgeführt werden, sind unter anderem die Wikipedia-Wissensextraktion DBpedia, das Machine Learning Framework DL-Learner, die geographische Wissensbasis LinkedGeoData, sowohl das Semantic Web Anwendungsentwicklungs- und Kollaborations-Framework OntoWiki. AKSW wurde im Jahr 2006 von Dr. Sören Auer gegründet und besteht zu Zeit aus über 15 Wissenschaftlern und Doktoranden.