ISSN 1618-2162

Cover Heft 16

6. Jahrgang, Heft 16, Februar 2006

Kurz erklärt

Walter Waterfeld

Kurz erklärt: Ontologien

Eine Ontologie definiert die Terminologie, die Konzepte und ihre Zusammenhänge in einem bestimmten Anwendungsbereich. Sie besteht damit aus einem Vokabular, um eine bestimmte Realität zu beschreiben, und aus expliziten Definitionen, um die Bedeutung des Vokabulars festzulegen. Dies geschieht üblicherweise durch logikbasierte Definitionen. Die Bedeutung des Vokabulars wird festgelegt, indem durch logische Formalismen die möglichen Interpretationen eingeschränkt werden. Durch die präzisen logischen Formalismen können Ontologien durch Maschinen verarbeitet werden. Ontologien können somit nicht nur die Software beschreiben und strukturieren, sondern Softwareagenten und "intelligentere" Anwendungen können damit zur Laufzeit Informationen über einen Anwendungsbereich austauschen.

Wie das folgende Beispiel veranschaulicht, hat eine Ontologie typischerweise die beiden Komponenten Vokabular für Konzepte und Einschränkungen des Anwendungsgebietes.

Konzeptname Definition
Elefant Konzept, dessen Mitglieder Tiere sind
Pflanzenfresser Konzept, dessen Mitglieder Tiere sind, die nur Pflanzen fressen
Erwachsener Elefant Konzept, dessen Mitglieder Elefanten sind, die älter als 20 Jahre sind
Konzeptname Einschränkungen
Erwachsener Elefant Erwachsene Elefanten wiegen mindestens 2000 kg
Elefanten Alle Elefanten sind entweder afrikanische Elefanten oder indische Elefanten
Pflanzenfresser, Fleischfresser Kein Individuum kann sowohl Pflanzenfresser als auch Fleischfresser sein

Diese Verwendung des Begriffes Ontologie hat sich erst seit einiger Zeit in der Informatik etabliert. Ursprünglich ist die Ontologie eine philosophische Disziplin. Sie beschreibt die Lehre von den Möglichkeiten und Bedingungen des Seienden. Gegenüber dieser fundamentalen philosophischen Disziplin stellt die Verwendung des gleichen Begriffes in der Informatik natürlich eine starke Überhöhung dar. Im Gegensatz zu der einen Ontologie in der Philosophie gibt es in der Informatik damit viele Ontologien.

Beim Umfang der Ontologien kann man nach [Guarino 1998] zwischen drei Arten von Ontologien unterscheiden.

Die erste Art sind Top-Level-Ontologien, die generelles, bereichsübergreifendes Wissen darstellen. Aufgrund des eher hohen Anspruchs gibt es relativ wenige derartige Ontologien. Ein Beispiel ist die schon länger existierende Cyc-Ontologie [Lenat 1995].

Die zweite Art sind Bereichs-Ontologien, die die Terminologie eines Bereiches oder Arbeitsgebietes definieren. Das erfordert üblicherweise, dass sich eine Gruppe von Experten auf eine gemeinsame Terminologie und ihre Bedeutung einigt.

Schließlich gibt es noch Anwendungs-Ontologien, die einen begrenzten Ausschnitt der realen Welt modellieren. Sie sind vergleichbar mit traditionellen Datenmodellen. Allerdings enthält die Ontologie üblicherweise nur beschreibende Information und Fakten, die immer wahr sind. Das heißt, der Inhalt einer Ontologie ist zustandsunabhängig.

Ontologien benötigen eine hohe Ausdrucksmächtigkeit. Sie beinhalten die meisten bekannten Modellierungskonzepte, so dass viele andere Modellierungssprachen in Ontologien enthalten sind.

Das gilt in jedem Fall für Taxonomien, die eine hierarchische Klassifikation von Begriffen im Sinne einer "IS-A"- Hierarchie darstellen. Damit kann jede Taxonomie direkt in eine sehr einfache Ontologie umgewandelt werden. Entsprechendes gilt für Thesauri. Auch sind die meisten Konzepte von Entity-Relationship- Modellen und von UML in Ontologien wiederzufinden, da Ontologien auf objektorientierten Konzepten basieren.

Das Charakteristikum der meisten Ontologiesprachen ist die starke Formalisierung durch die Benutzung von Logik. Damit stehen Inferenzmechanismen zur Verfügung, um implizites Wissen ableiten zu können. Im Gegensatz zu anderen Modellierungssprachen sind sie damit nicht nur sehr ausdrucksmächtig, sondern sind aufgrund ihrer exakten logischen Definition auch ausführbar. Eine breite Übersicht zum Thema Ontologien enthält [Staab & Studer 2004].

Die Hauptursache für die zunehmende Verbreitung von Ontologien ist jedoch ihre Verwendung im Semantic Web [Berners-Lee et al. 2001]. Das Semantic Web hat die Vision, statt des aktuellen, nur für Menschen verständlichen Web ein Web zu schaffen, das von Maschinen interpretiert werden kann. Dies erfordert eine von Maschinen zu interpretierende Semantik. Ontologien sind dafür als zentraler Mechanismus vorgesehen.

Inzwischen gibt es daher bereits einen W3C-Standard Web Ontology Language, abgekürzt OWL [McGuinness & Harmelen 2004], der eine Ontologiesprache standardisiert. OWL beruht auf Beschreibungslogiken und ist eine relativ mächtige Ontologiesprache. Die Hauptvariante OWL/DL erlaubt beispielsweise die Definition von Klassenausdrücken mit booleschen Operatoren, Negation und Aufzählungen. OWL-Prozessoren ermöglichen eine automatische Klassifizierung, indem die Ableitungshierarchie berechnet wird.

Bis vor einigen Jahren waren Ontologien fast ausschließlich Gegenstand der Forschung. Aufgrund der Semantic-Web-Initiative und der Standardisierung gibt es jedoch inzwischen eine Reihe von Produkten und erste erfolgreiche Einsätze der Technologie in der Praxis. Wahrscheinlich nicht weiter überraschend erfolgt der Einsatz jedoch noch nicht im Weltmaßstab als Semantic Web, sondern zunächst in eher überschaubarem Rahmen wie beispielsweise für die Metadatenverwaltung von Unternehmen.

[Berners-Lee et al. 2001] Berners-Lee, T.; Hendler, J.; Lassila, O.: The Semantic Web. Scientific American, 05/2001.

[Guarino 1998] Guarino, N.: Formal Ontology and Information Systems. In: Proceeding FOIS’98, IOS Press, Amsterdam, 1998.

[Lenat 1995] Lenat, D. B.: Cyc: A Large-Scale Investment in Knowledge Infrastructure. The Communications of the ACM 38(11):33-38, 1995.

[McGuinness & Harmelen 2004] McGuinness, D. L.; Harmelen, F. (Eds.): OWL Web Ontology Language Overview. W3C Recommendation, www.w3.org/TR/owl-features, 02/2004.

[Staab & Studer 2004] Staab, S.; Studer, R. (Eds.): Handbook on Ontologies Series: International Handbooks on Information Systems. Springer-Verlag, 2004.

Walter Waterfeld kam nach der Promotion in Datenbanken an der TU Darmstadt zur Software AG. Dort beschäftigte er sich in der Produktentwicklung u.a. mit Persistenzkomponenten und XML-Datenbanken. Zurzeit ist er Architekt für ein auf semantischen Technologien basierendes Informations-Integrations-Produkt.

Dr. Walter Waterfeld
Software AG
Uhlandstr. 12
64297 Darmstadt
walter [dot] waterfeld [at] softwareag [dot] com
www.softwareag.com

Zum Inhaltsverzeichnis

Valid XHTML 1.0! Valid CSS 2.0!