Fragen? Antworten! Siehe auch: Alternativlos
Meine Texte sind absichtlich wenig komplex. Kurze Sätze, knackige Ansagen, hoffentlich wenig mißverständlich, eignen sich zum kurz vorlesen, in Mails pasten oder, ja, auch für Twitter. Das ist kein Unfall oder ein Versehen, das ist Absicht. Und das ist nicht einfach und kam nicht von alleine, das will ich euch mal sagen. Das muss man trainieren. Und man muss sich zusammenreißen, um das durchzuhalten. Mir gelingt es auch nicht immer, z.B. wenn ich mich zu einem längeren Textblock hinreißen lasse. Also, zu der letzten Grafik. Das ist Absicht, dass meine Texte wenig komplex sind. Das ist ja auch die Idee beim Webjournalismus, wenn ihr mal drüber nachdenkt. Es geht mir ja darum, dass die Leute rezipieren, was ich zu sagen habe. Journalisten in großen Redaktionen geht es häufig darum, sich durch geschwollene, komplexe Formulierungen von ihren Konkurrenten abzusetzen. Und Parteiprogramme werden ja absichtlich so formuliert, dass sie keiner lesen will oder verstehen kann.
Das war zu der letzten Grafik. Die davor sind in ähnlicher Form ein Fall für Captain Obvious. Der Bag of Words Ansatz eignet sich höchstens für Suchmaschinen (aber nicht mal da ist er besonders gut) und für Text-Clustering (dafür ist er soweit ich weiß Stand der Technik). Für den Vergleich der Entropie einer Publikation eignet er sich nicht, insbesondere nicht bei Quellen wie meinem Blog, bei dem 50% des Textes Zitate sind, womöglich noch in anderen Sprachen. Desweiteren schreibt bei mir einer die Meldungen, beim Spiegel Dutzende. Dass da eine andere Entropie rauskommt, leuchtet ein. Die Messung ist also grober Unfug. Mir leuchtet auch nicht ein, was da die Aussage sein soll. Auf sowas kann nur ein Physiker kommen :-) In der Physik sind Energie- und Entropiemessungen in der Tat Standard, um ein neues Signal anzugucken.
Die Redundanzanalyse ist natürlich auch Mumpitz als Bewertungkriterium für ein Verschwörungsblog. Da geht es ja gerade darum, Zusammenhänge aufzuzeigen, also aus diversen Quellen ähnliche Schlüsse zu ziehen.
Kurz gesagt: ein Teil Mumpitz, ein Teil offensichtlich. Haut mich nicht vom Hocker. Macht euch mal keine Sorgen.
Übrigens, falls jemand interessiert ist, was diese Lesbarkeitsindizes sind: Bei Amdahl geht es um die Satzlängen in Worten und um Silben pro Wort. Bei SMOG geht es um Silben pro Wort. Bei WSTF geht es um eine Kombination daraus. Offensichtlich sind die Silbenvergleiche unfair, weil ich viele englische Texte zitiere. An meiner Satzlänge arbeite ich noch. :-)
Update: nochmal zur Redundanzanalyse. Da weist gerade jemand per Mail drauf hin, dass die die Titelseite im Abstand von 24h geholt haben. Bei der Bild sind die alten Meldungen dann weg, weil die ja wollen, dass man häufiger klickt, um mehr Werbung verkaufen zu können. Bei mir kriegt man immer die Meldungen der letzten drei Tage. Wenig überraschend also, dass da Redundanzen existieren.
Update: Hier gibt es einen Kommentar des Autoren der Studie, der einige Dinge erklärt. Bei Redundanz geht es nicht um Redundanz innerhalb eines Mediums, sondern zwischen Medien. Hohe Redundanz heißt also nahe am Zeitgeist, kleine Redundanz heißt belangloses Randgruppenblog. Außerdem sagen sie, sie hätten Zitate entfernt für ihre Untersuchung.