<?xml version="1.0" encoding="utf-8" ?>

<rss version="2.0" 
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
   xmlns:admin="http://webns.net/mvcb/"
   xmlns:dc="http://purl.org/dc/elements/1.1/"
   xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
   xmlns:wfw="http://wellformedweb.org/CommentAPI/"
   xmlns:content="http://purl.org/rss/1.0/modules/content/"
   
	 xmlns:podcast='http://ipodder.sourceforge.net/docs/podcast.html'
>
<channel>
    <title>Gsallbahdr - Computational Linguistics</title>
    <link>http://www.drni.de/blog/</link>
    <description>Das Wort zum Alltag von DrNI</description>
    <dc:language>de</dc:language>
    <generator>Serendipity 1.4.1 - http://www.s9y.org/</generator>
    <pubDate>Tue, 24 Nov 2009 09:54:56 GMT</pubDate>

    <image>
        <url>http://www.drni.de/niels/weblog/favicon.png</url>
        <title>RSS: Gsallbahdr - Computational Linguistics - Das Wort zum Alltag von DrNI</title>
        <link>http://www.drni.de/blog/</link>
        <width>16</width>
        <height>16</height>
    </image>

<item>
    <title>Mit einer Tautologie zu Christus – oder sonst wo hin?</title>
    <link>http://www.drni.de/blog/archives/872-Mit-einer-Tautologie-zu-Christus-oder-sonst-wo-hin.html</link>
            <category>Computational Linguistics</category>
            <category>Direktsaft</category>
    
    <comments>http://www.drni.de/blog/archives/872-Mit-einer-Tautologie-zu-Christus-oder-sonst-wo-hin.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=872</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=872</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Ich habe endlich die Fotos von meinem Handy heruntergeladen. Da ich das Handy immer dabei habe sind auch einige sprachlich interessante Botschaften fotografisch dokumentiert worden. Zunächst ein Plakat, das den Betrachter auf den richtigen Weg bringen möchte:&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;position:relative; margin-bottom:10px; margin-left:0px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; vertical-align:text-bottom&quot; src=&quot;http://www.drni.de/niels/weblog/pix/deshalb-mist.jpg&quot; alt=&quot;&quot; /&gt;&lt;/div&gt;&lt;br /&gt;
»Christ? Weil… es zum Umsteigen nie zu spät ist!«&lt;br /&gt;
&lt;br /&gt;
Nehmen wir mal an, der begründende Satz »Weil es zum Umsteigen nie zu spät ist« wäre immer oder wenigstens meistens wahr, was die meisten von uns wohl bekräftigen dürften, dann könnte man aus diesem Satz alles folgern:&lt;br /&gt;
&lt;br /&gt;
»Muslim? Weil es zum Umsteigen nie zu spät ist.«&lt;br /&gt;
»Agnostiker? Weil es zum Umsteigen nie zu spät ist.«&lt;br /&gt;
»Vegetarier? Weil es zum Umsteigen nie zu spät ist.«&lt;br /&gt;
&lt;br /&gt;
Dieses Muster könnte man beliebig fortsetzen. Außer vielleicht, wenn sofort klar ist, dass ein Umstieg sehr schwer bis unmöglich ist. Nicht alle Daseinsformen hängen vom freien Willen alleine ab, manchmal braucht man auch gewisse formale oder biologische Voraussetzungen:&lt;br /&gt;
&lt;br /&gt;
»Professor? Weil es zum Umsteigen nie zu spät ist.« &lt;br /&gt;
»Frau? Weil es zum Umsteigen nie zu spät ist.« (Für Männer)&lt;br /&gt;
»Homosexuell? Weil es zum Umsteigen nie zu spät ist.« &lt;br /&gt;
&lt;br /&gt;
Es ist jedenfalls keine gute Idee, eine so offensichtlich logisch anfällige Werbeaussage auf einem Plakat in einem von Linguisten bevölkerten Unigebäude anzubringen. Abgesehen davon darf man sich natürlich fragen, warum christliche Organisationen Werbung machen (dürfen) und die anderer Glaubensgruppen nicht. Siehe auch &lt;a href=&quot;http://de.wikipedia.org/wiki/Atheist_Bus_Campaign&quot;&gt;Atheist Bus Campaign&lt;/a&gt;.&lt;br /&gt;
&lt;br /&gt;
&lt;hr /&gt;&lt;small&gt;Die Hörnchen auf dem Kopf der Dame wurden wohl in ähnlicher Verwunderung von jemand anderem angebracht, sie sind jedenfalls nicht original.&lt;/small&gt; 
    </content:encoded>

    <pubDate>Mon, 23 Nov 2009 19:00:00 +0100</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/872-guid.html</guid>
    
</item>
<item>
    <title>Crossref</title>
    <link>http://www.drni.de/blog/archives/842-Crossref.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/842-Crossref.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=842</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=842</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    DrNI@AM schreibt über &lt;a href=&quot;http://www.drni.de/niels/s9y/archives/13-Hohenheimer-Verstaendlichkeitsindex.html&quot;&gt;Parteiprogramme und den Hohenheimer Verständlichkeitsindex&lt;/a&gt;. 
    </content:encoded>

    <pubDate>Sat, 26 Sep 2009 18:39:58 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/842-guid.html</guid>
    
</item>
<item>
    <title>Crossref</title>
    <link>http://www.drni.de/blog/archives/819-Crossref.html</link>
            <category>Computational Linguistics</category>
            <category>English Posts</category>
    
    <comments>http://www.drni.de/blog/archives/819-Crossref.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=819</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=819</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    DrNI@Automatic Mind writes: &lt;a href=&quot;http://www.drni.de/niels/s9y/archives/12-Text-Difficulty-and-Information-Retrieval.html&quot;&gt;&lt;em&gt;Text Difficulty and Information Retrieval&lt;/em&gt;&lt;/a&gt; 
    </content:encoded>

    <pubDate>Thu, 20 Aug 2009 11:23:07 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/819-guid.html</guid>
    
</item>
<item>
    <title>Marathon auf Rhodos</title>
    <link>http://www.drni.de/blog/archives/753-Marathon-auf-Rhodos.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/753-Marathon-auf-Rhodos.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=753</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=753</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    &lt;code&gt;DEBUG [main] (LuceneIndexManager.java:90) - Closing IndexWriter.&lt;br /&gt;
INFO  [main] (IndexerController.java:87) - Worked on 247233 documents.&lt;br /&gt;
INFO  [main] (IndexerController.java:88) - Skipped 18029 documents.&lt;/code&gt;&lt;br /&gt;
&lt;br /&gt;
&lt;small&gt;(Rhodos ist unsere neue Schüssel für die Aufarbeitung von &lt;a href=&quot;http://de.wikipedia.org/wiki/Textkorpus&quot;&gt;Korpora&lt;/a&gt;. Potent&amp;hellip; könnte aber auch noch ein paar CPUs mehr drin haben. Mein vorheriges Spielzeug im Nebenjob hatte derer 4 sowie 32GB RAM und mehrere TB Plattenkapazität, da konnte man richtig nett arbeiten.)&lt;/small&gt; 
    </content:encoded>

    <pubDate>Sat, 28 Mar 2009 11:41:00 +0100</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/753-guid.html</guid>
    
</item>
<item>
    <title>Web as Corpus vs. Information Retrieval</title>
    <link>http://www.drni.de/blog/archives/743-Web-as-Corpus-vs.-Information-Retrieval.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/743-Web-as-Corpus-vs.-Information-Retrieval.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=743</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=743</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Ein paar weitere Live-Marginalien meiner Master-Arbeit&amp;hellip; Web as Corpus heute mal mit Schwerpunkt Information Retrieval, aber doch sehr ähnlich zum ehrwürdigen &lt;a href=&quot;http://www.drni.de/wac-tk/&quot;&gt;WaC Tk&lt;/a&gt;:&lt;br /&gt;
&lt;br /&gt;
&lt;code&gt;INFO  [main] (IndexerController.java:75) - Worked on 83210 documents.&lt;br /&gt;
INFO  [main] (IndexerController.java:76) - Skipped 9084 documents.&lt;/code&gt;&lt;br /&gt;
&lt;br /&gt;
Rechenintensive Aufgaben machen eben doch Spaß, da spürt man mal wieder die schiere Kraft der Maschine. Erstaunlich ist, dass &lt;a href=&quot;http://lucene.apache.org/java/&quot;&gt;Lucene&lt;/a&gt; sich langsamer anfühlt als die &lt;a href=&quot;http://www.sketchengine.co.uk/&quot;&gt;Word Sketch Engine&lt;/a&gt;.&lt;br /&gt;
&lt;br /&gt;
&lt;a href=&quot;http://de.wikipedia.org/wiki/Natural_language_processing&quot;&gt;NLP&lt;/a&gt; mit drei Gigabyte Text oder gar mehr fordert den beteiligten Verarbeitungskomponenten eine große Robustheit ab: Man kann weder einzelne Resultate manuell überprüfen (es sind zu viele) noch darf etwas &lt;a href=&quot;http://www.drni.de/blog/archives/742-2009-VAGINA-oder-die-Arbeit-mit-echten-Daten.html&quot;&gt;abstürzen&lt;/a&gt;. Im Zweifel muss man  Verarbeitungsfehler automatisch abfangen und protokollieren und dann das Dokument zunächst wegwerfen.  Bei all dem ist es gut, dass ich auf einen reichen Erfahrungsschatz beim automatischen Aufbereiten größerer Korpora zurückgreifen kann. Die mussten schließlich so gut werden, dass man sie hinterher verkaufen konnte (siehe &lt;a href=&quot;http://www.sketchengine.co.uk/&quot;&gt;Sketchengine&lt;/a&gt;).&lt;br /&gt;
&lt;br /&gt;
Grau wird alle Theorie, wenn es um die echte Wurst geht. 
    </content:encoded>

    <pubDate>Sat, 14 Mar 2009 11:10:00 +0100</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/743-guid.html</guid>
    
</item>
<item>
    <title>2009 × VAGINA oder die Arbeit mit echten Daten</title>
    <link>http://www.drni.de/blog/archives/742-2009-VAGINA-oder-die-Arbeit-mit-echten-Daten.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/742-2009-VAGINA-oder-die-Arbeit-mit-echten-Daten.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=742</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=742</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Wenn man als Computerlinguist mit echten Daten arbeitet, was leider viel zu wenige Kollegen tun, dann bekommt man nette Effekte. Zum Beispiel ist da dieser Eintrag in der &lt;a href=&quot;http://simple.wikipedia.org/&quot;&gt;Simple English Wikipedia&lt;/a&gt;, der 2009 Mal das Wort &lt;em&gt;VAGINA&lt;/em&gt; enthält. Getrennt durch Leerzeichen, ohne Punkt und ohne Komma direkt hintereinander. Einen Satz dieser Länge quittierte mein Programm ungalant mit einem &lt;a href=&quot;http://java.sun.com/javase/6/docs/api/java/lang/StackOverflowError.html&quot;&gt;StackOverflowError&lt;/a&gt;.&lt;br /&gt;
&lt;br /&gt;
Mal sehen, wann der &lt;a href=&quot;http://simple.wikipedia.org/wiki/Popcorn&quot;&gt;Eintrag&lt;/a&gt; repariert wird. Mein Programm kommt jetzt jedenfalls auch damit klar. 
    </content:encoded>

    <pubDate>Fri, 13 Mar 2009 16:16:00 +0100</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/742-guid.html</guid>
    
</item>
<item>
    <title>A Preview of my Readability Library</title>
    <link>http://www.drni.de/blog/archives/687-A-Preview-of-my-Readability-Library.html</link>
            <category>Computational Linguistics</category>
            <category>English Posts</category>
    
    <comments>http://www.drni.de/blog/archives/687-A-Preview-of-my-Readability-Library.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=687</wfw:comment>

    <slash:comments>0</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=687</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Is there anything worse than procrastinating the studying for your MA oral exam by writing Java code for your MA thesis? Anyways. Here we go with a little preview on a Java library of readability measures. I&#039;m planning to write a longer article about the sense and senselessness of readability measures for my &lt;a href=&quot;http://www.drni.de/niels/cl/blog/&quot;&gt;CL Blog&lt;/a&gt;. To cut a long story short: readability measures resp. algorithms take a text, split it into words and syllables, and apply some weird formula to that. In the end, you get a figure saying how easy or difficult to read (or understand) the text is supposed to be. One of the most prominent measures is the &lt;a href=&quot;http://en.wikipedia.org/wiki/Flesch-Kincaid&quot;&gt;Flesch-Kincaid Readability Test&lt;/a&gt; which is supposed to say how many years of US education one needs in order to be able to understand the given text. &lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;position:relative; text-align: center; margin-bottom:10px; margin-top:10px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; &quot; src=&quot;http://www.drni.de/niels/weblog/pix/readability-demo.png&quot; alt=&quot;&quot; /&gt;&lt;/div&gt;&lt;br /&gt;
Let&#039;s have a look at the screen shot of my demo. First of all, be aware that some or all of the measures might be wrong. As one can see, for the given text, it takes almost 14 years of school education. The text I took is a &lt;a href=&quot;http://www.neopets.com/neopedia.phtml?neopedia_id=123&amp;criteria=&quot;&gt;pirates story for kids from Neopedia&lt;/a&gt;, which some of my fellow students might be well aware of because they are currently suffering from a named entity annotation task for that text. So why is this fairy-tale alike story so hard to read? A comparison with the output of &lt;a href=&quot;http://www.online-utility.org/english/readability_test_and_improve.jsp&quot;&gt;this online  tool&lt;/a&gt; revealed that the sentence counter I&#039;m using cannot deal with the quotation marks used in direct speech and the text contains lots of it. The Flesch-Kincaid formula punishes documents for long sentences, therefore the score goes up the fewer sentences you have.&lt;br /&gt;
&lt;br /&gt;
The sentence counting part currently is based on &lt;a href=&quot;http://www.representqueens.com/fathom/&quot;&gt;Java Fathom&lt;/a&gt;, a port from Perl&#039;s &lt;a href=&quot;http://search.cpan.org/dist/Lingua-EN-Fathom/&quot;&gt;Lingua::EN::Fathom&lt;/a&gt; module. The syllable counter is also the Fathom port from there. Apart from that, Java Fathom has a bug preventing it from working at all. I contacted the maintainer. He keeps reacting with silence. So in order to be able to publish this library, I need to re-invent some wheels myself, because other people messed things up. (This is what usually happens if computer scientists try to do something with language.)&lt;br /&gt;
&lt;br /&gt;
As some of my readers may have noticed, I &lt;a href=&quot;http://www.drni.de/blog/archives/632-Alles-neu-macht-der-September.html&quot;&gt;reactivated&lt;/a&gt; the &lt;a href=&quot;http://www.drni.de/blog/categories/18-Computational-Linguistics&quot;&gt;Computational Linguistics&lt;/a&gt; category here. I consider it to be the CL blather dump from now on. After all, this post isn&#039;t enough of a post for my  &lt;a href=&quot;http://www.drni.de/niels/cl/blog/&quot;&gt;CL Blog&lt;/a&gt;.&lt;br /&gt;
&lt;br /&gt;
Stay tuned on both blogs, if everything works out as I hope it to work out, I&#039;ll pass the exam next week and I&#039;ll publish the open-sourced readability library somewhen in January. 
    </content:encoded>

    <pubDate>Sun, 14 Dec 2008 12:56:00 +0100</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/687-guid.html</guid>
    
</item>
<item>
    <title>Alles neu macht der September</title>
    <link>http://www.drni.de/blog/archives/632-Alles-neu-macht-der-September.html</link>
            <category>Computational Linguistics</category>
            <category>Direktsaft</category>
    
    <comments>http://www.drni.de/blog/archives/632-Alles-neu-macht-der-September.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=632</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=632</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    &lt;div style=&quot;position:relative; margin-bottom:10px; margin-left:0px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; vertical-align:text-bottom&quot; src=&quot;http://www.drni.de/niels/weblog/pix/buerotechnik.jpg&quot; alt=&quot;&quot; /&gt;&lt;/div&gt;Neu weil weg: Der Klapprechner rechts im Bild ist tot, mause. Auch das ist neu, seit langer Zeit bin ich mal wieder laptoplos. Ein Nachfolger ist noch nicht gewählt und es ist noch nicht sehr akut, da ich ja seit neuestem in der Uni ein &lt;a href=&quot;http://www.drni.de/blog/archives/629-Ich-lass-die-Hosen-runter.html&quot;&gt;Büro mit einem iMac&lt;/a&gt; habe. Aber es gibt noch mehr Neues. Am Rande: Ein neuer Bass als Ersatzteil für Notfälle auf der Bühne. &lt;br /&gt;
&lt;br /&gt;
Neu und noch nicht gänzlich fertig ist vor allem auch ein komplettes frisches Design auf meiner &lt;a href=&quot;http://www.drni.de/niels/&quot;&gt;persönlichen Homepage&lt;/a&gt;. Und dazu ist alles, was nicht mit dem »beruflichen« zu tun hat, von dort verschwunden. Die Seite ist seitdem konsequent in Englisch gehalten. Und sie beinhaltet das neueste Neue: Mein neues Blog. Die Kategorie &lt;a href=&quot;http://www.drni.de/blog/categories/18-Computational-Linguistics&quot;&gt;Computational Linguistics&lt;/a&gt; hierzublog ist also ein Relikt, weiter geht es mit der Computerlinguistik in meinem &lt;a href=&quot;http://www.drni.de/niels/s9y/categories/1-CL-Blog&quot;&gt;englischsprachigen CL Blog&lt;/a&gt;. Gewonnen hat den &lt;a href=&quot;http://www.drni.de/blog/archives/631-Das-richtige-CMS-muss-erst-noch-erfunden-werden.html&quot;&gt;Kampf um das Content Management&lt;/a&gt; übrigens &lt;a href=&quot;http://www.s9y.org&quot;&gt;Serendipity&lt;/a&gt;.&lt;br /&gt;
&lt;br /&gt;
Nun mag man die Trennung zwischen (zukünftigem) Beruf und Privatleben als überholt ansehen oder auch nicht. Darüber mag ich hier nicht befinden. Der Trennung liegt für mich die Erkenntnis zugrunde, dass &lt;a href=&quot;http://www.drni.de/niels/s9y/categories/1-CL-Blog&quot;&gt;Wissenschaft&lt;/a&gt; und &lt;a href=&quot;http://www.drni.de/blog/archives/622-Bukowski.html&quot;&gt;Perversität&lt;/a&gt; sowie allerhand alltäglich irrelevantes polemisches &lt;a href=&quot;http://www.drni.de/blog/archives/598-Atomstrahlen-essen-Seele-auf!-Erloese-uns-von-der-Prokrastination..html&quot;&gt;Geplapper&lt;/a&gt; nicht unbedingt die gleiche Klientel ansprechen.&lt;br /&gt;
&lt;br /&gt;
Die an Computerlinguistik interessierten Leser möchte ich hiermit auffordern, mein &lt;a href=&quot;http://www.drni.de/niels/s9y/categories/1-CL-Blog&quot;&gt;Zweitblog&lt;/a&gt; zu abonnieren. Für alle anderen bleibt alles beim Alten. 
    </content:encoded>

    <pubDate>Fri, 12 Sep 2008 20:57:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/632-guid.html</guid>
    
</item>
<item>
    <title>Worthäufigkeiten von Körperteilen in Songtexten: Hiphop Asses, Blues Hands</title>
    <link>http://www.drni.de/blog/archives/619-Worthaeufigkeiten-von-Koerperteilen-in-Songtexten-Hiphop-Asses,-Blues-Hands.html</link>
            <category>Computational Linguistics</category>
            <category>Musik</category>
    
    <comments>http://www.drni.de/blog/archives/619-Worthaeufigkeiten-von-Koerperteilen-in-Songtexten-Hiphop-Asses,-Blues-Hands.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=619</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=619</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Das &lt;a href=&quot;http://www.drni.de/blog/archives/559-Worthaeufigkeit-visualisiert-Wordle.html&quot;&gt;hier schon beschriebene Wordle&lt;/a&gt; visualisiert Worthäufigkeiten mit Hilfe der typografischen Eigenschaft der Schriftgröße. Auf ein eher künstlerisches Podest hievt &lt;a href=&quot;http://www.fleshmap.com/listen/music.html&quot;&gt;Fleshmap&lt;/a&gt; die Worthäufigkeit: das Projekt zeigt Fotos von Körperteilen in verschiedenen Größen. Die Größe repräsentiert die Häufigkeit des Namen des Körperteils in einem Songtext&amp;#160;&amp;ndash; oder vielmehr in einer Sammlung von Songtexten eines Genres.&lt;br /&gt;
&lt;br /&gt;
Augen scheinen überall ein wichtiges Konzept zu sein. Beim Hiphop hingegen springen dem Betrachter Ärsche, Schwänze und Muschis ins Auge. Der Blues hat viel mit den Händen zu tun. Und mit Brüsten. Was nicht das gleiche ist wie Titten. Zwischen verschiedenen Synonymen oder nah verwandten Begriffen wird nämlich peinlich genau unterschieden. Mehrdeutige Wörter wie »back« wurden vorsichtshalber nicht gewertet. &lt;br /&gt;
&lt;br /&gt;
Man kann auch einzelne Texte selbst in eine Körperteil-Darstellung umwandeln lassen. Dabei zeigt sich ganz indirekt die Sinnlosigkeit von Stichwort-Filtern zur Überwachung von irgendwas: Während so mancher Song ziemlich viele kleine Tittenbildchen fabriziert, drücken sich die meisten etwas feineren Musiker um die expliziten Worte, um genau das gleiche auszudrücken. So bleiben die Bilder zum Beispiel bei &lt;a href=&quot;http://www.geocities.com/odetobobbiegentry/lyric/lhmawom.htm&quot;&gt;&lt;em&gt;He Made A Woman Out Of Me&lt;/em&gt;&lt;/a&gt; abwesend. Trotz der mit 16 Jahren verlorenen Jungfreulichkeit der weiblichen Protagonisten.&lt;br /&gt;
&lt;br /&gt;
Die Kunst findet immer wieder interessante Schnittpunkte mit der Computerlinguistik. Es bleibt spannend. Also Arsch hoch, ihr Computerkünstlerlinguisten! 
    </content:encoded>

    <pubDate>Wed, 27 Aug 2008 16:39:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/619-guid.html</guid>
    
</item>
<item>
    <title>Worthäufigkeit visualisiert: Wordle</title>
    <link>http://www.drni.de/blog/archives/559-Worthaeufigkeit-visualisiert-Wordle.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/559-Worthaeufigkeit-visualisiert-Wordle.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=559</wfw:comment>

    <slash:comments>6</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=559</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    &lt;a href=&quot;http://www.drni.de/blog/archives/552-Karriere-Berater.html&quot;&gt;Unlängst berichtete ich&lt;/a&gt; vom Vorhaben, wie schon einmal eine &lt;a href=&quot;http://www.drni.de/blog/archives/251-Fuer-Kritik-an-der-heiligen-Kuh-des-Turbokapitalismus-wurde-von-der-Wirtschaftsmacht-die-Hoechststrafe-verhaengt-Lebenslaenglich-Praktikum.html&quot;&gt;Buzzword-Wand aus Karrieregeblubber&lt;/a&gt; zu fabrizieren, das ich dann aber doch nicht in die Tat umsetzte. &lt;a href=&quot;http://wordle.net/&quot;&gt;Wordle&lt;/a&gt; nimmt einem die Arbeit ab und macht optisch auch einiges mehr her. Die automatische Wortwolke sieht dann so aus:&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;position:relative; text-align: center; margin-bottom:10px; margin-top:10px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; &quot; src=&quot;http://www.drni.de/niels/weblog/pix/wortwand.png&quot; alt=&quot;&quot; /&gt;&lt;/div&gt;&lt;br /&gt;
Es handelt sich hierbei um eine automatische »Analyse« eines &lt;a href=&quot;http://www.drni.de/blog/archives/523-Eine-Suchmaschine-fuer-Publikationen-im-Bereich-der-Computerlinguistik.html&quot;&gt;Blog-Posts über eine Suchmaschine für Computerlinguistische Publikationen&lt;/a&gt;. Den Titel des Posts habe ich mit zum Input hinzugefügt.&lt;br /&gt;
&lt;br /&gt;
Wordle benutzt als Grundlage für diese Darstellung die &lt;a href=&quot;http://de.wikipedia.org/wiki/Worth%C3%A4ufigkeit&quot;&gt;Worthäufigkeit&lt;/a&gt;, wobei allgemeine Wörter weggelassen werden. Ob letzteres auf Grundlage einer &lt;a href=&quot;http://de.wikipedia.org/wiki/Stoppwort&quot;&gt;Stoppwort&lt;/a&gt;liste oder einfach auf Grundlage von ein bisschen statisischer Magie basiert, das blieb mir bis jetzt verborgen. Die Farbgebung ist eine mehr oder minder zufällige Auswahl aus einer Palette, sie transportiert also keine Aussage.&lt;br /&gt;
&lt;br /&gt;
Obwohl das Werkzeug sicherlich gestalterische Prinzipien in den Vordergrund stellt, ist es meiner Meinung nach auch zur Darstellung von Informationen doch nicht ganz unnütz. Es schafft es bei meinem Blog-Post immerhin, dass die Wörter deutlich hervorgehoben sind, um die sich das Thema dreht. Sozusagen eine »typo-grafische« Inhaltsangabe auf einen Blick. &lt;br /&gt;
&lt;br /&gt;
Der Haken ist, dass das als Java-Applet umgesetzte Programm keinen Export seines Resultats erlaubt. Die Druckfunktion weigert sich, in Datei zu drucken. Mit diesem kleinen Trick bekommt man nämlich zumindest unter Linux/Un*x immer eine Grafikdatei, die man wo anders einbetten könnte. Somit bleibt nur: Alternative suchen oder einen virtuellen Trickserdrucker installieren.&lt;br /&gt;
&lt;br /&gt;
Und da ist noch was: Blog-Posts sind kurz, oft scheint hier eine »ein Thema&amp;#160;&amp;ndash; ein Post«-Situation vorzuliegen. Bei längeren Texten wird die einfache Worthäufigkeit vermutlich weniger konkret sichtbare Ergebnisse liefern, außer man schafft es, mehrere solche Wortwölkchen aus schlau gewählten, thematisch abgegrenzten Textabschnitten zu bauen.&lt;br /&gt;
&lt;br /&gt;
&lt;hr/&gt;&lt;small&gt;&lt;a href=&quot;http://www.spreeblick.com/2008/06/19/apfelmannchen-fur-germanisten/&quot;&gt;via&lt;/a&gt;.&lt;/small&gt; 
    </content:encoded>

    <pubDate>Thu, 19 Jun 2008 13:00:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/559-guid.html</guid>
    
</item>
<item>
    <title>Tag der Computerlinguistik in Tübingen</title>
    <link>http://www.drni.de/blog/archives/553-Tag-der-Computerlinguistik-in-Tuebingen.html</link>
            <category>Computational Linguistics</category>
            <category>Direktsaft</category>
            <category>Gebührend studieren</category>
            <category>Tübingen</category>
    
    <comments>http://www.drni.de/blog/archives/553-Tag-der-Computerlinguistik-in-Tuebingen.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=553</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=553</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    &lt;div style=&quot;position:relative; text-align:center; float:right; margin-bottom:10px; margin-left:10px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; vertical-align:text-bottom&quot; src=&quot;http://www.drni.de/niels/weblog/pix/wegweiser.jpg&quot; alt=&quot;[Foto: Wegweiser mit Pfeilen in viele Richtungen auf dem Campus der Uni Heidelberg]&quot; /&gt;&lt;br /&gt;
&lt;small&gt;Was will ich studieren?&lt;/small&gt;&lt;/div&gt;Am 21. Juni 2008 veranstaltet die Fachschaft Sprachwissenschaft einen &lt;em&gt;Tag der Computerlinguistik&lt;/em&gt;.  Geworben wird dabei in erster Linie für den Studiengang &lt;a href=&quot;http://www.sfs.uni-tuebingen.de/iscl/&quot;&gt;International Studies in Computational Lingistics (ISCL)&lt;/a&gt;, den auch ich mir zu Gemüte führe und in dem ich auch schon einen Bachelor-Abschluss ergattern durfte. Motiviert wird die Veranstaltung von vielen Faktoren. Zum einen sind seit Einführung der Studiengebühren die Anfängerzahlen eingebrochen (&lt;a href=&quot;http://www.drni.de/blog/archives/384-Geruechtekueche-Situation-verbessert.html&quot;&gt;ich spekulierte&lt;/a&gt;), zum anderen ist die Computerlinguistik generell wenig bekannt, obwohl sie ein Geschäft mit Zukunft darstellt. &lt;br /&gt;
&lt;br /&gt;
Beim Tag der Computerlinguistik soll es aber natürlich nicht um diese Dinge gehen. Vielmehr will man junge Leute begeistern und informieren. Schaut her, hier gibt es was zu sehen! Und wer darüber wirklich alles wissen will, der kann das auch studieren! Und zwar nach dem Abi im Bachelor-Programm oder nach dem Bachelor im Master-Programm. Alle Vorträge sollen möglichst wenig Vorkenntnisse erfordern und für die Allgemeinheit genießbar sein. Das macht den Tag der Computerlinguistik interessant für alle, die einfach mal wissen wollen, um was es dabei geht.&lt;br /&gt;
&lt;br /&gt;
Meine Wenigkeit wird bei dieser Veranstaltung ebenfalls mitwirken, und zwar mit einem Vortrag, dessen Arbeitstitel da lautet: &lt;em&gt;Wie kommen eigentlich die Wörter ins Wörterbuch?&lt;/em&gt;&lt;br /&gt;
 
    </content:encoded>

    <pubDate>Fri, 13 Jun 2008 11:36:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/553-guid.html</guid>
    
</item>
<item>
    <title>Germanisch? Egal, wir stehen auf Bäume!</title>
    <link>http://www.drni.de/blog/archives/531-Germanisch-Egal,-wir-stehen-auf-Baeume!.html</link>
            <category>Computational Linguistics</category>
            <category>Gebührend studieren</category>
    
    <comments>http://www.drni.de/blog/archives/531-Germanisch-Egal,-wir-stehen-auf-Baeume!.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=531</wfw:comment>

    <slash:comments>3</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=531</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Die Erkenntnis kommt spät für einen Teilzeitlinguisten, aber sie kommt: Das englische Wort &lt;a href=&quot;http://en.wikipedia.org/wiki/Indo-European_languages&quot;&gt;&lt;em&gt;Indo-European&lt;/em&gt;&lt;/a&gt; heißt im Deutschen &lt;a href=&quot;http://de.wikipedia.org/wiki/Indogermanische_Sprachfamilie&quot;&gt;&lt;em&gt;indogermanisch&lt;/a&gt;&lt;/em&gt;&lt;sup&gt;&lt;small&gt;1&lt;/small&gt;&lt;/sup&gt;. Und das, obwohl der germanische Sprachzweig darunter nur einer von vielen ist. Keltisch, Griechisch, Indo-Iranisch (und damit die heutigen Sprachen Hindi und Bengali, aber auch das tote Sanskrit) sind ebenfalls indo&lt;em&gt;germanisch&lt;/em&gt; (um nur ein Paar zu nennen).&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;position:relative;  text-align: center; margin-bottom:10px; margin-top:10px; width:auto; height:auto;&quot;&gt;&lt;iframe width=&quot;500&quot; height=&quot;325&quot; marginwidth=&quot;0&quot; style=&quot;background-color: white;&quot; src=&quot;http://www.drni.de/niels/weblog/iframepic.php?p=partial-indo-european.png&quot;&gt;&lt;small&gt;(Dein Browser oder Feedreader kann keine Iframes anzeigen.)&lt;/small&gt;&lt;/iframe&gt;&lt;br /&gt;
&lt;small&gt;Partieller Stammbaum der indogermanischen Sprachen (†: Tote Sprachen)&lt;/small&gt;&lt;/div&gt;&lt;br /&gt;
Populärwissenschaftliche Bilderbuchempfehlung: &lt;em&gt;The Atlas of Languages&lt;/em&gt; von Bernard Comrie, Stephen Matthews und Maria Polinsky. Darin findet sich auch auf Seite 39 eine schöner Stammbaum der indogermanischen Sprachen, aus dem der hier abgebildete unvollständige Stammbaum (&lt;a href=&quot;http://www.drni.de/niels/weblog/indo-european.dot&quot;&gt;Sourcecode&lt;/a&gt;) hervorging.&lt;br /&gt;
&lt;br /&gt;
Alles in allem eigentlich ein interessantes Thema, war da wann was mit wem und warum das wohl heute so ist wie es ist, das mit dem Turmbau zu Babel. Aber das unterscheidet schließlich den Master-Studenten (mit &lt;a href=&quot;http://www.drni.de/blog/archives/58-Abschlussarbeit-Gutachten.html&quot;&gt;Bachelor&lt;/a&gt;-Titelchen) vom angehenden Gelehrten: Nur nicht zu weit links oder rechts kucken!&lt;br /&gt;
&lt;br /&gt;
Und damit zurück &lt;strike&gt;ins Studio&lt;/strike&gt; zum Thema der graphischen Darstellung von Ergebnissen der &lt;a href=&quot;http://de.wikipedia.org/wiki/Cluster-Analyse&quot;&gt;Clusteranalyse&lt;/a&gt;. Immerhin nicht gänzlich unverwandt mit Bäumen wie dem oben gezeigtem.&lt;br /&gt;
&lt;br /&gt;
&lt;hr /&gt;&lt;small&gt;&lt;sup&gt;&lt;small&gt;1&lt;/small&gt;&lt;/sup&gt;: John Rupert Firth erwähnte diesen Unterschied schon 1950 in seinem Aufsatz &lt;em&gt;Personality and Language in Society&lt;/em&gt;.&lt;/small&gt; 
    </content:encoded>

    <pubDate>Mon, 19 May 2008 11:37:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/531-guid.html</guid>
    
</item>
<item>
    <title>Eine Suchmaschine für Publikationen im Bereich der Computerlinguistik</title>
    <link>http://www.drni.de/blog/archives/523-Eine-Suchmaschine-fuer-Publikationen-im-Bereich-der-Computerlinguistik.html</link>
            <category>Computational Linguistics</category>
            <category>Gebührend studieren</category>
    
    <comments>http://www.drni.de/blog/archives/523-Eine-Suchmaschine-fuer-Publikationen-im-Bereich-der-Computerlinguistik.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=523</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=523</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Wie legal es ist, wissenschaftliche Publikationen aus dem Netz zu laden, das ist ja &lt;a href=&quot;http://www.laelles.de/index.php?/archives/266-Schoene-neue-Welt.html&quot;&gt;mittlerweile ungeklärt&lt;/a&gt;. &lt;a href=&quot;http://www.drni.de/blog/archives/282-Urheberrechtsproblem!-Bitte-signieren..html&quot;&gt;Man hatte sich zu wehren versucht&lt;/a&gt;, aber die Lobbyisten waren wohl die stärkeren Gesetzgeber. So mancher Dienst &lt;a href=&quot;http://www.heise.de/newsticker/Online-Fernleihe-via-Subito-nur-noch-mit-digitalen-Fesseln-Update--/meldung/103973&quot;&gt;reagiert panikartig&lt;/a&gt; und läuft damit Gefahr, nicht mehr nutzbar zu sein. Gesetzliche Verunmöglichung des Hochschulbetriebs hin oder her, die Abschlussarbeit ist am Horizont schon zu sehen und &lt;a href=&quot;http://www.drni.de/blog/archives/516-Erklaerung-zur-Hausarbeit-als-LaTeX-Paket.html&quot;&gt;Hausarbeiten &lt;/a&gt; müssen eh &lt;a href=&quot;http://www.drni.de/blog/archives/505-Die-Erkenntnis-der-Nacht.html&quot;&gt;immer&lt;/a&gt; geschrieben werden. Was wäre also schöner, als eine Suchmaschine, die Publikationen aus dem Gebiet der Computerlinguistik zu Tage fördert?&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;position:relative; text-align: center; margin-bottom:10px; margin-top:10px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; &quot; src=&quot;http://www.drni.de/niels/weblog/pix/cl-search.png&quot; alt=&quot;&quot; /&gt;&lt;/div&gt;&lt;br /&gt;
Was hier als &lt;a href=&quot;http://www.googl.com/ig/&quot;&gt;iGoogle&lt;/a&gt; Gadget daherkommt ist mein Versuch, eine &lt;em&gt;Google Custom Search Engine&lt;/em&gt; zu erstellen. Sie heißt &lt;a href=&quot;http://www.google.com/coop/cse?cx=000302137693213122178:ycoqke386yy&quot;&gt;&lt;em&gt;Computerlinguistische Publikationen&lt;/em&gt;&lt;/a&gt;, ist hochgradig Beta (wie bei 2.0 so üblich, jaja) und steht jedem offen, auch wenn sie noch nicht im öffentlichen Verzeichnis steht. iGoogle braucht man dafür natürlich nicht unbedingt. &lt;br /&gt;
&lt;br /&gt;
Wer das Gadget will, der möge es &lt;a href=&quot;http://fusion.google.com/add?moduleurl=http%3A//www.google.com/coop/api/000302137693213122178/cse/ycoqke386yy/gadget&quot;&gt;hiermit installieren&lt;/a&gt;. Kommentare und Vorschläge zur neuen Suchmaschine sind jederzeit willkommen. 
    </content:encoded>

    <pubDate>Mon,  5 May 2008 14:05:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/523-guid.html</guid>
    
</item>
<item>
    <title>Corpus delicti: Beflügelte Vorstellungen von weiblichen Organen</title>
    <link>http://www.drni.de/blog/archives/504-Corpus-delicti-Befluegelte-Vorstellungen-von-weiblichen-Organen.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/504-Corpus-delicti-Befluegelte-Vorstellungen-von-weiblichen-Organen.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=504</wfw:comment>

    <slash:comments>2</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=504</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Eine Randnotiz aus einem meiner Nebenjobs als Computerlinguist: Beim Erstellen von Korpora aus dem World Wide Web kommt man am Ende nicht um eine manuelle Kontrolle herum. Man gibt also diverse Stichworte ein, anhand derer man &lt;em&gt;sexually explicit material&lt;/em&gt; finden sollte. Das wird dann rausgenommen. Natürlich liest man so allerhand, was nicht direkt Porno ist. Zum Beispiel:&lt;blockquote&gt;»One of the first women&#039;s vulva turned into a mouth, complete with teeth, which bit off her partner&#039;s penis. This myth of the vagina dentata appears in many cultures around the world.«&lt;/blockquote&gt;Ich fühle mich gerade sehr jugendlich. Selten habe ich auf meiner beruflichen Suche nach Brüsten, Penissen, Vaginen, Vulven, Anus und weiteren Körperteilen mit so viel Aufklärungsliteratur befassen dürfen. Und das auch noch auf Englisch.&lt;br /&gt;
&lt;br /&gt;
Da lernt man was fürs Leben. Und mal ehrlich, ist &lt;em&gt;Vagina Dentata&lt;/em&gt; nicht ein guter Kandidat für ein geflügeltes Wort? 
    </content:encoded>

    <pubDate>Thu, 10 Apr 2008 15:30:00 +0200</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/504-guid.html</guid>
    
</item>
<item>
    <title>GraleJ: [peter,likes,mary]</title>
    <link>http://www.drni.de/blog/archives/482-GraleJ-peter,likes,mary.html</link>
            <category>Computational Linguistics</category>
    
    <comments>http://www.drni.de/blog/archives/482-GraleJ-peter,likes,mary.html#comments</comments>
    <wfw:comment>http://www.drni.de/blog/wfwcomment.php?cid=482</wfw:comment>

    <slash:comments>1</slash:comments>
    <wfw:commentRss>http://www.drni.de/blog/rss.php?version=2.0&amp;type=comments&amp;cid=482</wfw:commentRss>
    

    <author>nospam@example.com (DrNI)</author>
    <content:encoded>
    Nun also mal wieder ein Blick in meine Welt der Computerlinguistik, in der ich als Student gleich mehrfach drinstecke. Heute mal mit Neuigkeiten von meinem Hiwi-Job beim &lt;a href=&quot;http://www.sfb441.uni-tuebingen.de/&quot;&gt;SFB&amp;#160;441&lt;/a&gt;: GraleJ Version&amp;#160;0.1 wurde heute veröffentlicht! Das Programm ist &lt;a href=&quot;http://code.google.com/p/gralej/downloads/list&quot;&gt;frei wie freie Rede&lt;/a&gt; und plattformunabhängig im Java-Sinne.&lt;br /&gt;
&lt;br /&gt;
Die Hauptaufgabe von GraleJ als Neuimplementierung von Grale (Nachfolger des legendären Grisu) ist es, Attribut-Wert-Matrizen (AVMs) darzustellen. Wie man auf dem Screenshot sehen kann, funktioniert das auch tadellos. Wo kommen die AVMs eigentlich her? Nun, man kann die einfach in einem speziellen Format von der Festplatte laden. Aber natürlich&amp;#160;&amp;ndash; und das ist die zweite große Aufgabe von GraleJ&amp;#160;&amp;ndash; werden sie auch automatisiert von der &lt;a href=&quot;http://www.sfs.uni-tuebingen.de/hpsg/archive/projects/trale/&quot;&gt;TRALE&lt;/a&gt; Grammar Implementation Platform übertragen und dargestellt.&lt;br /&gt;
&lt;br /&gt;
&lt;div style=&quot;position:relative; text-align: center; margin-bottom:10px; margin-top:10px; width:auto; height:auto;&quot; &gt;&lt;img style=&quot;border: solid 1px; &quot; src=&quot;http://www.drni.de/niels/weblog/pix/peter-likes-mary.png&quot; alt=&quot;&quot; /&gt;&lt;/div&gt;&lt;br /&gt;
Damit ist GraleJ auch zugleich der neue offizielle graphische Viewer von TRALE. Vorabversionen wurden bereits in einem Seminar zu Unterrichtszwecken eingesetzt. Version&amp;#160;0.1 bringt einige Neuerungen und Verbesserungen im Detail. Das erste Mal ist auch ein schnuckeliger Dialog für die Einstellungen dabei, der allerdings noch nicht gänzlich mit Funktion belebt wurde. Auch der Export der Grafiken im Postscript- und EPS-Format funktioniert noch nicht. SVG, PNG und JPEG sollten aber ihre Dienste tun, ebenso gibt es eine Exportmöglichkeit für LaTeX, die allerdings ein spezielles Package in LaTeX voraussetzt. Diese Funktion gab es auch schon im alten Grisu und wurde von mir in meiner &lt;a href=&quot;http://www.drni.de/niels/cl/papers/EquippingTRALE.pdf&quot;&gt;Bachelor-These&lt;/a&gt; ausgiebig genutzt.&lt;br /&gt;
&lt;br /&gt;
Wie man sieht, kann GraleJ auch Bäume darstellen. Ja, auch in HPSG kommt man um Bäume nicht gänzlich herum. Und TRALE ist nun mal ein System, das hauptsächlich der Implementierung von HPSG-Grammatiken dient. Aber es gibt noch mehr Features. So kann GraleJ z.B. als Client für WebTrale dienen. Da kann man dann zwar keine eigenen Grammatiken entwerfen, aber ohne viel Installationsaufwand vorhandene Grammatiken testen und mit ihnen spielen. Sicherlich auch für Demonstrationszwecke in Seminaren eine interessante Möglichkeit. Die Benutzerschnittstelle für WebTrale ist meiner Meinung nach noch etwas verbesserungswürdig.&lt;br /&gt;
&lt;br /&gt;
Mein Teil der Arbeit war bisher&amp;#160;&amp;ndash abgesehen vom Preferences-Dialog&amp;#160;&amp;ndash; doch eher ein verborgener. Dinge unter der Haube, wie z.B. die Client-Server-Geschichten. Das wird sich aber vermutlich bald ändern, denn unser Entwickler-Team besteht seit dieser Woche nur noch aus zwei Personen. 
    </content:encoded>

    <pubDate>Fri, 29 Feb 2008 12:35:00 +0100</pubDate>
    <guid isPermaLink="false">http://www.drni.de/blog/archives/482-guid.html</guid>
    
</item>

</channel>
</rss>