Worthäufigkeit visualisiert: Wordle
Geschrieben von DrNI
am Donnerstag, 19. Juni 2008
um 13:00
in Computational Linguistics
Unlängst berichtete ich vom Vorhaben, wie schon einmal eine Buzzword-Wand aus Karrieregeblubber zu fabrizieren, das ich dann aber doch nicht in die Tat umsetzte. Wordle nimmt einem die Arbeit ab und macht optisch auch einiges mehr her. Die automatische Wortwolke sieht dann so aus:
Es handelt sich hierbei um eine automatische »Analyse« eines Blog-Posts über eine Suchmaschine für Computerlinguistische Publikationen. Den Titel des Posts habe ich mit zum Input hinzugefügt.
Wordle benutzt als Grundlage für diese Darstellung die Worthäufigkeit, wobei allgemeine Wörter weggelassen werden. Ob letzteres auf Grundlage einer Stoppwortliste oder einfach auf Grundlage von ein bisschen statisischer Magie basiert, das blieb mir bis jetzt verborgen. Die Farbgebung ist eine mehr oder minder zufällige Auswahl aus einer Palette, sie transportiert also keine Aussage.
Obwohl das Werkzeug sicherlich gestalterische Prinzipien in den Vordergrund stellt, ist es meiner Meinung nach auch zur Darstellung von Informationen doch nicht ganz unnütz. Es schafft es bei meinem Blog-Post immerhin, dass die Wörter deutlich hervorgehoben sind, um die sich das Thema dreht. Sozusagen eine »typo-grafische« Inhaltsangabe auf einen Blick.
Der Haken ist, dass das als Java-Applet umgesetzte Programm keinen Export seines Resultats erlaubt. Die Druckfunktion weigert sich, in Datei zu drucken. Mit diesem kleinen Trick bekommt man nämlich zumindest unter Linux/Un*x immer eine Grafikdatei, die man wo anders einbetten könnte. Somit bleibt nur: Alternative suchen oder einen virtuellen Trickserdrucker installieren.
Und da ist noch was: Blog-Posts sind kurz, oft scheint hier eine »ein Thema – ein Post«-Situation vorzuliegen. Bei längeren Texten wird die einfache Worthäufigkeit vermutlich weniger konkret sichtbare Ergebnisse liefern, außer man schafft es, mehrere solche Wortwölkchen aus schlau gewählten, thematisch abgegrenzten Textabschnitten zu bauen.
via.





Das hier schon beschriebene Wordle visualisiert Worthäufigkeiten mit Hilfe der typografischen Eigenschaft der Schriftgröße. Auf ein eher künstlerisches Podest hievt Fleshmap die Worthäufigkeit: das Projekt zeigt Fotos von Körperteilen in verschiedenen Grö
Aufgenommen: Aug 27, 16:40