Sprechende Kühlschränke ... twitternde Staubsauger .... - Sprachtechnologie in Wissenschaft und Alltag.
Die Computerlinguistik stellt sich mit einer Reihe von interaktiven Computerprogrammen vor, die einen Eindruck des Fachs vermitteln. Unsere Programme visualisieren den Wandel von Wortbedeutungen und analysieren den Stil von Texten und Autoren, beispielsweise in Filmkritiken.
© Universität Trier, Computerlinguistik
49.75116,6.63824
Beschreibung:

Trier Sentiments (Sentimentanalyse)

Das Programm ist in der Lage, englischsprachige Filmkritiken zu klassifizieren: Es unterscheidet dabei zwischen positiven, eher positiven, neutralen, eher negtiven und negativen Kritiken. Als Grundlage verwendet das Programm das Korpus der „Kaggel‘s movie review challange“ (https://www.kaggle.com/c/sentiment-analysis-on-movie-reviews), welches wiederum von der bekannten Webseite Rotten Tomatoes gesammelte Rezensionen zu Filmen und Serien enthält, die speziell für unsere Analyse aufbereitet wurden.

Analyse des Wortgebrauchs über Zeit

Die Analyse des Wortgebrauchs über Zeit ist eine Applikation, welche die Häufigkeiten ausgewählter Wörter in einem gegebenen Korpus auswertet und graphisch präsentiert. Dazu kann der Nutzer Suchwörter eintragen und ein entsprechendes Korpus als Grundlage auswählen. Zur Verfügung stehen aktuell: Antrittsreden der US-Präsidenten von 1789 bis 2017 (Englisch), Antrittsreden italienischer Premierminister ab 1949 bis 2012 (Italienisch), die Preußische Zeitung Provinzial-Correspondenz von 1863 bis 1894 (Neuhochdeutsch) und das Zeitungskorpus der taz (Deutsch) von 1987 bis 1998.

 

Geschlechterwahrscheinlichkeit von Vornamen

Vornamen sind in den meisten Fällen geschlechtsspezifisch: "Konrad" ist ein typischer Jungen- und "Mathilda" ein typischer Mädchenname. Das Programm versucht anhand einfacher Merkmale zu erkennen, ob es sich bei einem Namen um einen männlichen oder weiblichen Vornamen handelt.

Ausgehend von einer Sammlung von 9873 Vornamen (5924 weibliche und 3949 männliche Vornamen) wurde eine Menge von 8373 Namen beider Geschlechter zufällig ausgewählt und zum Training des Programms verwendet.

 

Wordcloud

Eine Wordcloud ist eine Schlagwortwolke oder Schlagwortmatrix, die der Informationsvisualisierung dient. Dabei wird die Worthäufigkeit innerhalb eines Textes oder Korpus ausgewertet und daraus eine gewichtete Präsentation generiert, meist ist diese auch alphabetisch sortiert, sodass eine Wordcloud zwei Ordnungsdimensionen (Gewichtung und alphabetische Sortierung) „auf einen Blick“ liefert. Je häufiger ein Wort im Korpus vorkommt, desto größer wird es in der flächigen Präsentation angezeigt um seine Prägnanz hervorzuheben.

 

Stilometer

„Sie schreiben wie ... Sarah Wagenknecht!“

Das Programm berechnet die stilistische Ähnlichkeit zwischen einem vom Nutzer selbst erstellten oder ausgewählten Text und den in einer Datenbank gespeicherten Texten berühmter Persönlichkeiten (von Sarah Wagenknecht über Franz Kafka bis hin zu Georg Wilhelm Friedrich Hegel). Ähnliche stilometrische Maße, wie die in diesem Programm verwendeten, finden auch in der forensischen Linguistik etwa bei der Autorenschaftsbestimmung ihre Anwendung.

Öffnungszeiten:
16:00 bis 00:00
Aussteller:
Dr. Sven Naumann
Universität Trier, Computerlinguistik

Ort:
Angela-Merici-Gymnasium