Custom cover image
Custom cover image

Clustern mit Hintergrundwissen / Andreas Hotho

By: Resource type: Ressourcentyp: BuchBookLanguage: German Series: Dissertationen zur künstlichen Intelligenz ; 286Publisher: Berlin : Akademische V.-G. Aka, 2004Description: XXII, 242 S : Ill., graph. Darst ; 21 cmISBN:
  • 3898382869
Subject(s): Genre/Form: DDC classification:
  • 004
  • 004
MSC: MSC: *68T10 | 68T50 | 68-02Action note:
  • 3
Dissertation note: Zugl.: Karlsruhe, Univ., Diss., 2004 Summary: Mit der immer größer werdenden Menge von Textdokumenten durch das WWW und Dokument-Management-Systeme stellt das automatische und effiziente Berechnen von Clustern ein immer wichtigeres Mittel zur Strukturierung von sehr großen Dokumentsammlungen dar. Auch im Customer-Relationship-Management bzw. Marketing werden Clusterverfahren zur Kundensegmentierung eingesetzt. Die Clustergüte der verfügbaren Clusterverfahren ist nicht immer zufriedenstellend und die Ergebnisse sind häufig schwer verständlich. In diesem Buch werden drei neu entwickelte Methoden zur Lösung dieser Fragestellungen unter Verwendung von formal repräsentiertem Hintergrundwissen in Form von Ontologien beim Clustern vorgestellt: Subjektives Clustern berechnet benutzerbezogene Cluster bei gleichzeitiger Dimensionsreduktion. Der Anwender kann dabei aus mehreren ontologiebasierten, niedrigdimensionalen Clusterungen auswählen. Hintergrundwissen lässt sich erfolgreich während der Vorverarbeitung der Dokumente in den Clusterprozess integrieren. Es konnte gezeigt werden, dass diese neue ontologiebasierte Repräsentation für Textdokumente gegenüber der herkömmlichen wortbasierten Repräsentation zu einer Steigerung der Clustergüte führt. Erstmals werden Verfahren der Formalen Begriffsanalyse zur Präsentation von Textclustern verwendet, die für Menschen leicht verständliche Beschreibungen der berechneten Cluster liefern. Die entwickelten Methoden wurden in zwei Anwendungsgebieten eingesetzt und evaluiert. Einerseits wurden die Kunden der Deutschen Telekom AG anhand ihrer Verbindungsdaten, andererseits Dokumente dreier realer Textkorpora geclustert: Nachrichtentexte der Agentur Reuters, Lernmaterialen zur Programmiersprache Java und Texte landwirtschaftlicher Fachzeitschriften. In allen Fällen konnte gezeigt werden, dass die in diesem Buch vorgestellten Methoden zu einer Verbesserung der Clustergüte bzw. zu leichter verständlichen Clusterergebnissen führenCall number: Grundsignatur: 2004 DA 156PPN: PPN: 396427561
Holdings
Item type Home library Collection Shelving location Call number Copy number Status Barcode
Archiv (Magazin CS) Bibliothek Campus Süd Archiv 2004 DA 156 Available 46989677090
Magazinbestand ausleihbar Bibliothek Campus Süd Geschlossenes Magazin 2004 DA 156 ;b Available 54162305090
Magazinbestand ausleihbar Bibliothek Campus Süd wirt 11 Geschlossenes Magazin 2004 DA 156 ;c Available 47440181090
Freihandbestand ausleihbar Fachbibliothek Informatik F.Hot Bibliothek / frei aufgestellt F.Hot(46686) Available 000475947090
Total holds: 0

Archivierung prüfen 20240511 DE-640 3 pdager