Donald Trump und Kosinskis Bombe (Teil 1)

Viel wurde Anfang des Jahres in den Medien der Artikel diskutiert, der im Schweizer „Magazin“ erschienen ist. Schnell konzentrierte sich die Diskussion auf eine Frage: Haben Kosinskis Methoden, angewandt von einer zweifelhaften Firma namens Cambridge Analytica, die amerikanische Präsidentenwahl entschieden? Im Vordergrund stand nicht mehr Kosinski und seine Forschung, sondern Cambridge Analytica und vor allem die Gestalt des Alexander Nix. Nix soll ein brillanter Verkäufer sein. Die Aufmerksamkeit, die er für Cambridge Analytica zu erzeugen versteht, spricht dafür, dass diese Zuschreibung stimmt.

Hat Cambridge Analytica Donald Trump zum Präsidenten gemacht?

Die Frage, ob Cambridge Analytica die Wahl entschieden hat, ist weniger schwierig zu beantworten, als es zunächst scheint. Die Zusammenarbeit von Cambridge Analytica mit Donald Trump hat erst gegen Ende der Primaries begonnen, im Juni also. Sie hat, mit anderen Worten, weniger als ein halbes Jahr gedauert, ein halbes Jahr zudem, in dem Cambridge Analytica nur eine von mehreren einschlägigen Firmen war, die Trump unterstützt haben und die sich oft uneins waren. Das ist zu wenig Zeit, um eine solche Kampagne ausreichend vorzubereiten, zu wenig Zeit also, um ein wichtiger Einflussfaktor zu werden.

Werden Kosinskis Methoden zukünftige Wahlen entscheiden?

Viel interessanter als der Einfluss auf die letzte US-Wahl ist der Ausgangspunkt der Diskussion: Michal Kosinski und seine Forschung. Was sind es für Methoden, die er entwickelt hat? Wie wirkungsvoll sind sie? Dahinter steht die eine, die wirklich große Frage: Welche Rolle werden Kosinskis Methoden bei zukünftigen Wahlen spielen, auch, aber nicht nur in den USA?

Kosinski ist, im Gegensatz zu Nix, Forscher, und als solcher publiziert er seine Arbeit. Es liegt also nahe, seine Arbeiten einfach mal zu lesen. Ein guter Startpunkt dafür ist ein Artikel, der 2013 veröffentlicht wurde und dessen Titel den Kern von Kosinskis Entdeckung nüchtern auf den Punkt bringt: „Private traits and attributes are predictable from digital records of human behavior“. Darin beschreibt Kosinski, welche Daten er verwendet und wie er sie analysiert hat.

Wie hat Kosinski die Daten beschafft, die Auskunft geben über die Persönlichkeit
zehntausender Menschen?

Das Muster, nach dem die Daten gewonnen wurden, ist ebenso einfach wie genial: Man bietet auf Facebook einen Persönlichkeitstest an. Wer neugierig auf die Ergebnisse ist, „bezahlt“ mit seinen Daten – im Fall von Kosinskis Tests spendeten die Probanden diese Daten freiwillig der Wissenschaft. Wer das nicht wollte, bekam wohl die Testergebnisse trotzdem.

Wer einen solchen Test ausfüllt und seine Daten (also seine Facebook-Likes) zur Verfügung stellt, liefert gleichzeitig die Ergebnisse des Tests, also (je nach Test) einen mehr oder weniger detaillierten Einblick in die eigene Persönlichkeit.

Wie lässt sich Persönlichkeit in Zahlen fassen?

Aber von was für einem Einblick sprechen wir da genau? Das Problem mit echten psychologischen Testverfahren liegt darin, dass sie in der Entwicklung sehr komplex und in der Durchführung meist langwierig sind. Was man dann tatsächlich gemessen hat, ist dabei oft nicht ganz frei von Interpretationen. Es ist ähnlich wie mit der Intelligenz. Auf die Frage hin, was tatsächlich Intelligenz ist, wird in Psychologenkreisen gerne geantwortet: Intelligenz ist das, was der Intelligenztest misst.

Ganz ähnlich ist es bei Persönlichkeitstests: Es gibt keine klar benennbaren, unumstößlichen Dimensionen, nach denen man die Persönlichkeit eines Menschen vermessen könnte. Was diesem Ziel noch am nächsten kommt, sind die Big Five oder OCEAN-Persönlichkeitsmerkmale. Auf diese bezieht sich Kosinski ebenso wie Cambridge Analytica. Die OCEAN-Merkmale wurden nicht durch sorgfältiges Sezieren von Gehirnen oder intensive Beobachtungen von Menschen in freier Wildbahn entdeckt, sondern durch Fragebögen, ausgewertet mit enorm umfangreichen faktoranalytischen Berechnungen auf Basis einer Vielzahl an Fragen und Befragten. Das Endresultat sind fünf Cluster an Fragen. Jedes Cluster fasst Fragen zusammen, deren Antworten untereinander hochkorreliert (überspitzt: kenn ich eine Antwort, kenn ich alle), aber gleichzeitig ziemlich unabhängig von den Antworten aus anderen Clustern sind.

Wenn man diese Cluster anschaut, stellt man fest, dass es inhaltliche Beziehungen zwischen den Fragen gibt, die zu demselben Cluster gehören. Beispielsweise enthält das erste Cluster Fragen, die alle irgendwie zu tun haben mit einer gewissen Offenheit für neue Erfahrungen. Darum steht das „O“ in OCEAN für „Openness“. Genauso wurden die anderen vier Dimensionen gewonnen. Außer Openness sind das noch Conscientiousness (Gewissenhaftigkeit), Extraversion (im Deutschen ist das derselbe Begriff), Agreeableness (Verträglichkeit) sowie Emotional Stability (emotionale Stabilität; diese Dimension hat man früher Neurotizismus genannt, daher das „N“ in OCEAN). Diese inhaltlichen Beschreibungen der Cluster sind also Interpretationen, man kann sie weder berechnen, noch kann man beweisen, dass sie richtig sind. Sie sind lediglich plausibel.

Stabiler Persönlichkeitszug oder Momentaufnahme einer Laune?

Man kann also nicht beweisen, dass zum Beispiel „Offenheit“ eine angemessene Interpretation gewisser Antworten ist. Was man dagegen schon empirisch nachweisen kann, ist eine gewisse Stabilität der Ergebnisse, wenn man die Persönlichkeit eines Menschen nach dem OCEAN-Schema vermisst. Man bezeichnet die fünf Persönlichkeitsmerkmale aus dem OCEAN-Test deshalb auch nicht als (vorübergehende) States, sondern als sogenannte Traits, also stabile, über die Zeit nur wenig veränderliche Persönlichkeitsmerkmale.

„Traits“ ist auch die Begrifflichkeit, die auf der Website von Cambridge Analytica verwendet wird. Mit etwa 50 Fragen kann man dort die eigene Persönlichkeit sofort vermessen lassen. Genau hier trennt sich nun aber das beworbene „wissenschaftliche Vorgehen“ von der echten wissenschaftlichen Theorie. Um einen Trait seriös zu messen, muss man viele Fragen einsetzen, um Stabilität zu erzielen. Fragestellungen aus dem Web-Fragebogen, wie z. B. „I waste my time“ oder „I find it difficult to get down to work“, können bei mir zumindest allein im Wochenverlauf zwischen Montagmorgen und Freitagnachmittag deutlich schwanken. Dieser Effekt wird in der psychologischen Skalenkonstruktion vermindert, indem man mehrere leicht variierende Fragen mit ähnlichen Inhalten stellt. Diese Variationen sind nicht beliebig, sondern müssen empirisch daraufhin geprüft werden, dass sie tatsächlich ähnliche Inhalte abdecken. Erst mit einem Fragebogen, der weit über 100 Fragen beinhaltet, nähert man sich einer zuverlässigen Messung, die bei Wiederholung nach einem halben Jahr vergleichbare Resultate liefert. Erst dann kann ich auch besser tatsächliches Verhalten vorhersagen, da die breiteren Skalen genügend Fragen beinhalten, um auch Unterfacetten abbilden zu können.

Was Cambridge Analytica hier tut, ist eher die Messung von States und nicht von Traits. Sie messen also eher den aktuellen Gemütszustand bei der Beantwortung der Fragen als Aspekte einer dauerhaften Persönlichkeitsstruktur. Wenn man auf dieser Basis Werbung steuert, läuft man Gefahr, Launen anzusprechen, die bereits lang vergangen sind. Das heißt noch lange nicht, dass das nicht tatsächlich die Meinung und das Wahlverhalten beeinflussen kann. Man sollte sich aber etwas von der Vorstellung lösen, hier wie beworben das Resultat langjähriger psychologischer Forschung am Werk zu sehen.

Was kann man eigentlich alles mit einem Cambridge-Analytica-Fragebogen abfragen? Wie präzise können die so gewonnenen Ergebnisse die Persönlichkeit eines Menschen beschreiben? Und was bedeutet das alles für zukünftige Wahlkämpfe? All diese Fragen werden im zweiten Teil des Blogbeitrags beantwortet.