4 Wege in Excel, einen Korrelationskoeffizienten zu berechnen

Immer mal wieder taucht die Frage auf, ob zwischen zwei Größen ein Zusammenhang besteht. Das ist ein statistisches Problem, Statistik beschäftigt sich auch mit der Analyse von Zusammenhängen.

Eine Aussage über einen Zusammenhang zwischen zwei Größen erhältst Du, indem Du eine Korrelation berechnest. Dazu gehört einerseits der Korrelationskoeffizient und andererseits der p-Wert.

In diesem Beitrag geht es jedoch nur um die Berechnung des Korrelationskoeffizienten.
Excel bietet Dir dazu 4 Möglichkeiten an.

1. Die Datenbasis

In meinem Beitrag zur Excel-Funktion Standardabweichung habe ich Datenmaterial aus einer Studie zur Größe von Menschen aus 135 Nationen verwendet. [1]

Neben der Größe wurde in der Studie auch das Gewicht der Menschen dargestellt.

Für diesen Beitrag wird nun ebenfalls angenommen, dass Größe und Gewicht von jeweils zufällig ausgewählten 135 Männern und Frauen als Messwerte vorliegen.

Es soll die Frage beantwortet werden, ob zwischen der Größe und dem Gewicht ein Zusammenhang besteht.

Hier ein Auszug aus der Tabelle, die Du vollständig hier findest: KORREL

Korrel1

2. Die Funktion KORREL

Laut Excel-Hilfe gibt die Funktion KORREL den Korrelationskoefizienten einer zweidimensionalen Zufallsgröße zurück, deren Werte in den Zellbereichen Matrix1 und Matrix2 stehen.

Die Syntax lautet:
KORREL(Matrix1;Matrix2)

Matrix1 und Matrix2 sind erforderlich und stellen jeweils einen Zellbereich mit Werten dar.

Mit der Funktion berechnest Du jetzt den Korrelationskoeffizienten für die beiden Wertereihen Größe und Gewicht bei Männern und bei Frauen.

Männer
=KORREL(Tabelle2!C8:C142;Tabelle2!D8:D142)
=0,806264477

Frauen
=KORREL(Tabelle2!E8:E142;Tabelle2!F8:F142)
=0,625397738

Ein Korrelationskieffizient bewegt sich zwischen -1 und +1, das ist bei beiden Berechnungen der Fall.

Deine berechneten Werte zeigen mit rund 0,8 bzw. 0,6 jeweils einen positiven Zusammenhang, der bei Männern etwas stärker ist als bei Frauen.

Die folgenden Diagramme zeigen die Konzentration der Werte und jeweils eine lineare Trendlinie.

Korrel2

Korrel3

Zu erkennen ist, dass bei einigen Größen eine recht große Streuung vorliegt.
Dennoch ist allgemein ein Zusammenhang zwischen Größe und Gewicht erkennbar.

3. Die Funktion PEARSON

Excel bietet mit PEARSON eine zweite Funktion zur Berechnung eines Korrelationskoeffizienten an.

Laut Excel-Hilfe gibt die Funktion den Pearsonschen Korrelationskoeffizienten r zurück. Dieser Koeffizient ist ein Maß dafür, inwieweit zwischen zwei Datensätzen eine lineare Abhängigkeit besteht. Nichts anderes macht auch KORREL.

Die Syntax ist ähnlich der von KORREL.

PEARSON(Matrix1;Matrix2)

Dabei ist Matrix1 eine Reihe unabhängiger Werte und Matrix2 eine Reihe abhängiger Werte.

Verwende die Funktion so:

Männer
=PEARSON(Tabelle2!C8:C142;Tabelle2!D8:D142)
=0,806264477

Frauen
=PEARSON(Tabelle2!E8:E142;Tabelle2!F8:F142)
=0,625397738

Die Ergebnisse sind mit denen aus der Berechnung mit KORREL erzielten identisch.

Warum gibt es aber diese zweite Funktion, die ein gleiches Ergebnis errechnet?

Dazu ist im Support von Microsoft zu erfahren, dass bei Verwendung von PEARSON in Excel-Versionen vor 2003 Rundungsfehler auftreten können. Deshalb wird generell die Nutzung von KORREL empfohlen.

4. Die Funktion BESTIMMTHEITSMASS

Wenn Du Dich erinnerst, vor längerer Zeit konntest Du hier im Blog einen Beitrag über diese Funktion lesen.

Das Bestimmtheitsmass ist das Quadrat des Korrelationskoeffizienten.
Folglich ist der Korrelationskoeffizient die Wurzel aus dem Bestimmtheitsmass.

Schreibe die Formel so:
Männer
=WURZEL(BESTIMMTHEITSMASS(Tabelle2!D8:D142;Tabelle2!C8:C142))
=0,806264477

Frauen
=WURZEL(BESTIMMTHEITSMASS(Tabelle2!F8:F142;Tabelle2!E8:E142))
=0,625397738

Die Ergebnisse entsprechen wiederum denen aus den Abschnitten 2 und 3.

5. Die Analysefunktion KORRELATION

Im Menü Daten/Analyse/Datenanalyse findest Du die Funktion KORRELATION.

Korrel4

Rufe sie auf und fülle die Abfrage so aus:

Männer

Korrel5

Ergebnis: 0,806264477

Korrel6

Was kannst Du nun daraus entnehmen?
Der Korrelationskoeffizient zwischen Spalte 2 und Spalte 1 beträgt 0,788477642.

Frauen

Korrel7

Ergebnis: 0,625397738

Korrel8

Die Ergebnisse aus der Analysefunktion entsprechen ebenfalls denen aus den Abschnitten 2 und 3.

6. Zusammenfassung

Du hast jetzt 4 Möglichkeiten in Excel kennengelernt, einen Korrelationskoeffizienten zu berechnen.
Eingangs habe ich erwähnt, dass zur Korrelation auch noch der p-Wert gehört.

Vielleicht hast Du Lust, diesen zu berechnen? Excel bietet Dir dafür die Funktion TVERT an.

Zum Thema empfehle ich unbedingt die professionellen Seiten von Statistikexpertin Daniela Keller [2].

Ein sehr schönes Beispiel zur Funktion KORREL ist bei Pia Bork zu finden [3].

Und merke: Korrelation bedeutet nicht Kausalität.

Quellen:

[1] https://www.laenderdaten.info/durchschnittliche-koerpergroessen.php

[2] http://www.statistik-und-beratung.de/2013/05/Analyse-von-zusammenhangen-korrelation/

[3] http://bork-blog.de/archive/6478

3 Kommentare zu „4 Wege in Excel, einen Korrelationskoeffizienten zu berechnen“

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s