Korrelation und Kovarianz. Korrelation und Kovarianz sind zwei… | von Chandradip Banerjee | Juli 2023

0
23


Korrelation Und Kovarianz sind zwei statistische Maße, die die Beziehung zwischen zwei Variablen quantifizieren. Obwohl es sich um verwandte Konzepte handelt, erfassen sie unterschiedliche Aspekte der Beziehung zwischen Variablen.

Kovarianz ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen. Es misst, wie Änderungen in einer Variablen mit Änderungen in einer anderen Variablen verbunden sind. Eine optimistic Kovarianz zeigt an, dass sich die Variablen tendenziell in die gleiche Richtung bewegen, während eine unfavourable Kovarianz auf eine umgekehrte Beziehung hinweist. Die Kovarianz stellt jedoch kein standardisiertes Maß dar und reagiert empfindlich auf die Einheiten der Variablen. Daher kann es schwierig sein, das Ausmaß der Kovarianz zu interpretieren und die Stärke der Beziehung zwischen verschiedenen Variablenpaaren zu vergleichen.

Korrelationhingegen ist ein standardisiertes Maß für die lineare Beziehung zwischen zwei Variablen. Es quantifiziert die Stärke und Richtung der Beziehung auf einer Skala von -1 bis +1. Eine Korrelation von +1 weist auf eine perfekte optimistic lineare Beziehung hin, eine Korrelation von -1 auf eine perfekte unfavourable lineare Beziehung und eine Korrelation von 0 auf keine lineare Beziehung. Die Korrelation ist einheitenlos und wird nicht durch die Skala oder Einheiten der Variablen beeinflusst, wodurch es einfacher wird, die Stärke der Beziehungen zwischen verschiedenen Variablenpaaren zu vergleichen.

In Summe:

  • Kovarianz misst das Ausmaß, in dem zwei Variablen gemeinsam variieren, ist jedoch nicht standardisiert und wird von den Einheiten der Variablen beeinflusst.
  • Korrelation misst die Stärke und Richtung der linearen Beziehung zwischen zwei Variablen auf einer standardisierten Skala und erleichtert so die Interpretation und den Vergleich.

Beide Kovarianz Und Korrelation sind nützlich, um die Beziehung zwischen Variablen zu verstehen. Korrelation wird jedoch häufiger verwendet, da sie ein standardisiertes Maß für die Assoziation bietet, das einen einfacheren Vergleich und eine einfachere Interpretation ermöglicht.

In Python können Sie mithilfe verschiedener Bibliotheken wie NumPy und Pandas sowohl Kovarianz als auch Korrelation berechnen. Hier ist ein Beispiel für die Berechnung der Kovarianz und Korrelation zwischen zwei Variablen in Python:

numpy als np importieren
Pandas als PD importieren

# Beispieldaten
x = np.array([1, 2, 3, 4, 5]) # Variable 1
y = np.array([2, 4, 6, 8, 10]) # Variable 2

# Kovarianz berechnen
Kovarianz = np.cov(x, y)[0, 1]
print(„Kovarianz:“, Kovarianz)

# Korrelation berechnen
Korrelation = np.corrcoef(x, y)[0, 1]
print(“Korrelation:”, Korrelation)

In diesem Beispiel haben wir zwei Variablen: x Und y, mit entsprechenden Datenpunkten. Wir benutzen das np.cov() Funktion von NumPy zur Berechnung der Kovarianz zwischen x Und y. Die Kovarianz wird aus der Kovarianzmatrix und erhalten [0, 1] wird verwendet, um den Kovarianzwert zwischen den beiden Variablen auszuwählen.

Als nächstes verwenden wir die np.corrcoef() Funktion von NumPy, um die Korrelation zwischen zu berechnen x Und y. Der Korrelationskoeffizient wird aus der Korrelationsmatrix und erhalten [0, 1] wird verwendet, um den Korrelationswert zwischen den beiden Variablen auszuwählen.

Sowohl die Kovarianz- als auch die Korrelationswerte werden als Ausgabe gedruckt.

Sie können das ersetzen x Und y Arrays mit Ihren eigenen Daten, um die Kovarianz und Korrelation für Ihre interessierenden Variablen zu berechnen. Darüber hinaus können Sie Pandas DataFrames verwenden, wenn Sie Daten in einem Tabellenformat haben und Kovarianz und Korrelation über mehrere Variablen hinweg berechnen möchten.

Die Hauptunterschiede zwischen Kovarianz und Korrelation sind wie folgt:

Definition: Kovarianz misst das Ausmaß, in dem zwei Variablen gemeinsam variieren, und gibt die Richtung der linearen Beziehung an. Er wird als Durchschnitt des Produkts der Abweichungen der Variablen von ihren jeweiligen Mittelwerten berechnet. Die Korrelation hingegen misst die Stärke und Richtung der linearen Beziehung zwischen zwei Variablen. Es handelt sich um ein standardisiertes Maß, das von -1 bis +1 reicht.

Einheiten: Die Kovarianz wird in den Einheiten der Variablen gemessen, was es schwierig macht, die Stärke der Beziehungen zwischen verschiedenen Variablenpaaren oder zwischen verschiedenen Datensätzen zu vergleichen. Korrelation ist jedoch ein einheitenloses Maß, da sie durch Standardisierung der Variablen berechnet wird. Dies ermöglicht einen einfachen Vergleich und eine einfache Interpretation der Stärke von Beziehungen.

Bereich: Kovarianz hat einen unbegrenzten Bereich, d. h. sie kann je nach Daten jeden beliebigen Wert annehmen. Im Gegensatz dazu ist die Korrelation zwischen -1 und +1 begrenzt, wobei -1 eine perfekte unfavourable lineare Beziehung angibt, +1 eine perfekte optimistic lineare Beziehung angibt und 0 angibt, dass keine lineare Beziehung besteht.

Deutung: Kovarianz ist nicht einfach als eigenständiges Maß zu interpretieren. Optimistic Werte weisen auf eine optimistic Beziehung hin, unfavourable Werte auf eine unfavourable Beziehung und Null bedeutet keine lineare Beziehung. Die Größe der Kovarianz gibt jedoch keinen Aufschluss über die Stärke des Zusammenhangs. Die Korrelation hingegen stellt ein standardisiertes Maß dar, das direkt die Stärke und Richtung der linearen Beziehung angibt.

Normalisierung: Die Kovarianz ist nicht normalisiert, was bedeutet, dass sie von den Skalen und Einheiten der Variablen beeinflusst wird. Als standardisiertes Maß wird die Korrelation durch die Skalen nicht beeinflusst und ermöglicht faire Vergleiche zwischen verschiedenen Variablenpaaren.

Zusammenfassend lässt sich sagen, dass die Kovarianz die lineare Beziehung und Richtung zwischen Variablen misst, es jedoch an standardisierter Interpretation und Vergleichbarkeit mangelt. Korrelation hingegen ist ein standardisiertes Maß, das die Stärke und Richtung der linearen Beziehung quantifiziert und so eine einfachere Interpretation und einen einfacheren Vergleich ermöglicht.

Die Wahl zwischen der Verwendung von Kovarianz und Korrelation hängt von Ihren spezifischen Zielen und den Eigenschaften der Variablen ab, die Sie analysieren. Hier sind einige Überlegungen dazu, wann Kovarianz und wann Korrelation verwendet werden sollten:

Kovarianz:

  • Kovarianz ist nützlich, wenn Sie die Richtung und Größe der linearen Beziehung zwischen zwei Variablen verstehen möchten.
  • Kovarianz kann verwendet werden, um die gemeinsame Variabilität zweier Variablen zu messen und zu beurteilen, wie sie gemeinsam variieren.
  • Die Kovarianz hängt von den Maßeinheiten der Variablen ab und ist daher möglicherweise nicht direkt zwischen verschiedenen Datensätzen oder Variablenskalen vergleichbar.
  • Kovarianz kann bei bestimmten mathematischen Berechnungen oder in einigen statistischen Modellen nützlich sein.

Korrelation:

  • Korrelation eignet sich, wenn Sie die Stärke und Richtung der linearen Beziehung zwischen zwei Variablen beurteilen möchten.
  • Die Korrelation stellt ein standardisiertes Maß ohne Einheit dar und ermöglicht eine einfache Interpretation und einen Vergleich zwischen verschiedenen Datensätzen oder Variablenskalen.
  • Korrelation wird häufig in der statistischen Analyse, Datenexploration und Modellbildung eingesetzt.
  • Korrelation kann dabei helfen, den Grad der Assoziation zwischen Variablen zu ermitteln, und ist nützlich, um Muster in den Daten zu erkennen und zu verstehen.

Zusammenfassend lässt sich sagen, dass Kovarianz nützlich ist, wenn Sie an der linearen Beziehung und der gemeinsamen Variabilität zweier Variablen interessiert sind, während Korrelation besser geeignet ist, wenn Sie die Stärke, Richtung und Vergleichbarkeit der linearen Beziehung zwischen zwei Variablen beurteilen möchten. Wenn Sie sich nicht sicher sind, wird häufig die Korrelation bevorzugt, da sie ein standardisiertes Maß bietet, das einfacher zu interpretieren und über verschiedene Datensätze hinweg zu verallgemeinern ist.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here