Eine unglaubliche Dissertation

Prof. Thaller hat 1975 mit dieser extrem umfangreichen und inhaltlich äußerst interessanten Dissertation seine bemerkenswerte wissenschaftliche Arbeit begonnen. 700 Zeitungsjahrgänge wurden untersucht, 8000 Fußnoten erzeugt und 35.000 Blätter A5 verbraucht. Den Inhalt kurz zusammenenzufassen scheint unmöglich, aber ein Rückgriff auf die Statistik lässt großes erahnen:
ca. 3.613.117 Anschläge mit einer mechanischen (?) Schreibmaschine auf einer Matrize) waren vonnöten
und diese ergaben 502.508 Wörter auf 2559 Seiten.
Die Anzahl der zuvor verbrauchten Kugelschreiber (3,5 Stück pro Woche) ist legendär...

Tag Clouds, WordClouds, Wortwolken

Wunderschön! ... gibt es heute überhaupt noch eine Webseite ohne diese Wunderwerke der Technik?

Welche Worte wurden am häufigsten verwendet?

Ahhhh! Wie gut, dass zu wissen.

frequency - frequency - frequency

Um die Übersicht über diese wichtigen Daten nicht zu verlieren, müssen unbedingt ausgefeilte grafische Darstellungen her.

Mehr als die magische 100...

Diese vielen Worte wurden alle tatsächlich mehr als 100x geschrieben. Bemerkenswert!

Textmining

Das ist absolut großartig: wir können auch noch hierarchische Cluster analysieren, Dendrogramme erzeugen, K-means clustering betreiben oder umfangreiche Similarityuntersuchungen anstellen und sogar Assoziationsgrafen generieren. Oder einfach mal sehen, welche Worte im unmittelbaren Zusammenhang zu "Östereich" vorkommen...

Österreich




Aber leider muss nun festgestellt werden, dass Prof. Thaller in einer Kontroversdiskussion
folgendes zu Prof. Heyers Statment gesagt hat:
Heyer (Th. Paraphrase): CL, Corpuslinguistik und Textmining kann alle Probleme der Geisteswissenschaften lösen.
Thaller: Nein !!!!!!!!!!!!!!!!!!!!!


Also lassen wir das lieber und zeigen hier nun diese unglaubliche Dissertation,
die bis zu diesem Tage leider nie veröffentlicht wurde.
Bis zur Klärung aller rechtlichen Fragen, erscheint hier vorerst nur das Deckblatt.