Intelligente Verbindungen auf ZEIT online
Die von ZEIT online entwickelte Technologie untersucht Texte auf Wörter, die den Inhalt wesentlich tragen. Dazu bedient sich die Software einer linguistischen Wortformenanalyse, die vom Projekt „Digitales Wörterbuch“ der Berlin-Brandenburgischen Akademie der Wissenschaften entworfen wurde. Anschließend wird ermittelt, wie oft andere Wörter des Textes in der Nachbarschaft dieser inhaltstragenden Wörter vorkommen. Auf diese Weise erzeugt die Software ein eindeutiges Kennzeichen für den Text, vergleichbar mit einem Fingerabdruck. Im letzten Schritt werden die charakteristischen Merkmale sämtlicher im Archiv von ZEIT online vorhandenen Texte mittels statistischer Verfahren auf ihre inhaltliche Ähnlichkeit untersucht und einander zugeordnet. „Diese Verbindung der Informationen kommt direkt unseren Nutzern zugute“, sagt Peter M. Buhr, Technischer Leiter von ZEIT online. „Zu jedem Artikel können nun thematisch interessante Verweise auf weiterführendes Material angeklickt werden. Diese Zuordnungen manuell herzustellen hätte Jahre gedauert – nun benötigen wir für einen Gesamtdurchlauf durch das Archiv ungefähr 20 Minuten.“
Das „Digitale Wörterbuch der deutschen Sprache“ (DWDS) der Berlin-Brandenburgischen Akademie der Wissenschaften erstellt auf der Grundlage sehr großer und ausgewogener elektronischer Corpora der deutschen Sprache des 20. Jahrhunderts ein digitales Wörterbuchsystem (siehe [www.dwds.de](http://www.dwds.de)). ZEIT online und DWDS kooperieren seit dem Jahr 2000. ZEIT online betreibt die Internetpräsenz www.zeit.de seit 2002 auf der Basis von Open-Source-Komponenten, die eine eigenständige und kostengünstige Weiterentwicklung erlauben.
ZEIT online ist eine eigenständige GmbH und wird als hundertprozentige Tochter des ZEIT Verlags geführt.