BBC-DaaS ist ein Verbundprojekt der Hochschule für Technik und Wirtschaft Berlin (HTW Berlin) und der Beuth Hochschule für Technik Berlin (Beuth HS) sowie der Firma WebXells GmbH als beteiligtem regionalem Partner. Der Projektträger ist das Institut für angewandte Forschung (IFAF).

Das Projekt hat wichtige Aspekte eines Data-as-a-Service (DaaS) Dienstes in der Cloud erforscht: 

Projektteil A:

Da auf dem Informationsmarktplatz Datenanbieter und Informationssuchende zusammenkommen sollen (Matching), ist eine entsprechende Technologie zum Suchen und Finden der passenden Anbieter notwendig. 

Im Forschungsprojekt BBC-DaaS wurden zwei Ansätze für eine verbesserte Suche verschlagworteter Datensätze untersucht, Lösungen entwickelt und diese in Software implementiert: 

1) Beim Nutzen der Schlagworte für die Suche tritt das Problem auf, dass gleiche Konzepte unterschiedlich benannt werden können, z.B. sind ''Bild'' und ''Foto'' bedeutungsgleich (= synonym). Die Suche nach einem Schlagwort ergibt deshalb nur Begriffe, die mit dem Suchwort direkt bzw. in der linguistischen Grundform übereinstimmen. Zur Verbesserung der Suche werden daher häufig Synonym-Thesauri (Synonym-Lexika) eingesetzt. Ein manueller Aufbau und die Pflege dieser Thesauri ist allerdings mit hohem Aufwand verbunden. Im Rahmen des Projektes BBC-DaaS wurde eine Software geschaffen, mit der automatisch entsprechende Synonym-Thesauri aufgebaut werden können.

2) Außerdem wurde eine Lösung entwickelt, die es ermöglicht, mittels (freier) Wissensbasen die Terme semantisch einzuordnen, um neben dem Synonym-Problem das Homonym-Problem anzugehen. Ein Beispiel für ein Homonym ist das Wort “Hahn”. Es steht sowohl für das Konzept “Wasserhahn” als auch für den Vogel. So wird es möglich, die Suche auf die semantisch passenden Schlagworte einzugrenzen. Die entsprechende Software ist unter https://github.com/christianherta/BBC-DaaS verfügbar.

Projektteil B:

Im Teilbereich B wurden die Grundlagen für offene Datenmarktplätze und Open Data Portale gelegt. Dazu gehörte initial die Definition aller Use Cases und die Entwicklung von GUIs, welche sowohl auf dem Desktop, als auch mobil mit html5 Daten manipulierbar und handelbar machen. Weiterhin wurden die Punkte Search und Security für Open Data Portale angegriffen und mit verschiedenen modularen Verfahren (OAuth, Single-Sign On) gelöst. Abschließend wurden diverse relationale und NoSQL Datenbanken angebunden und eine Deployment Pipeline aufgebaut, die durchgängig von Github auf PaaS Services wie Heroku, Cloud Foundry etc. deployt.

Diese Technologien sind daher Blueprint und Einsatzbeschleuniger und als erste dieser Art Open-Source verfügbar. Inzwischen hat der Marktführer Sokrata ebenfalls Teile als Open-Source verfügbar gemacht. Neben vielen nationalen und internationalen Publikationen sind Teile des Projektes auf Github verfügbar: https://github.com/edlich/BBC-DaaS und https://github.com/ipf/bbc-daas.

Ein früher Prototyp (ohne Analyse Funktionalität), welcher für mobile Endgeräte optimiert ist, kann hier angezeigt werden. Kooperationen mit anderen erfolgreichen Großprojekten in diesem Bereich wie MIA und Nachfolgeprojekt laufen oder sind geplant. Teile der BBC-DaaS Technologie wurden erfolgreich in der Industrie für offene Portale eingesetzt.

Dies ist ein Verbundprojekt der HTW Berlin, Beuth Hochschule und der Firma WebXells GmbH.

Projektträger IFAF

Copyright © 2011 - bcc-daas.de