Prämissen der linearen Regression: Grundlagen und Bedeutung der statistischen Analyse | von Joao Igor Dos Santos | Juni 2023

0
27


Bei der linearen Regression wird eine erweiterte statistische Technik verwendet Modell in Beziehung zwischen verschiedenen linearen Modellen. Ich habe mir ein grundlegendes Papier zur statistischen Analyse vorgenommen und es zugelassen Vorschau Es gibt viele, die von einem oder mehreren unabhängigen Menschen abhängig sind, wie z Entendimento do comportamento dessas variáveis. Um ein mathematisches Modell zu erstellen, bietet eine lineare Regression die Möglichkeit, sie zu erforschen, da Beziehungen vorhanden sind, die aus Dados und Fazer-Schätzungen und Valiosas-Schlussfolgerungen bestehen.

Essa técnica é baseada no conceito de aprendizado supervisorado Wir haben die Möglichkeit, ein geeignetes Mathematikmodell zu erstellen, ohne vorher eine von Y(Ziel) abhängige Variable oder mehrere unabhängige X1, X2…, (Zum Beispiel, als X1 ein Jahr später eintraf) durch die Interpretation der im Modellgleichgewicht gefundenen Koeffizienten.

Gleichung der linearen einfachen Regression (mit einer unabhängigen Variable)

Das Ziel der linearen Regression besteht darin, die meisten möglichen Koeffizienten für einen Reta-Gleichgewicht zu finden, indem man den Medienabstand zwischen den Reta-Werten und den realen Werten der von Y abhängigen Varianz minimiert. Aufgrund des Gleichstands müssen Sie die unterschiedlichsten Schätzungen und Rückschlüsse ziehen.

Zusammenfassend lässt sich sagen, dass einige dieser Faktoren von der Methode geschätzt werden könnten Regressão de Mínimos Quadradosum das Ziel auf ein Minimal zu reduzieren, d Gradiente Descendente.

Beispiel dafür, dass jemand genau darauf eingestellt ist

Dies ist jedoch nicht der Fall, weil wir uns nicht sicher sind, ob wir zu einem linearen Rückschritt führen können. Es ist notwendig, dass einige Prämissen für Ihre Konstruktion verwendet werden, weil die Formel, die ich brauche, um eine bessere lineare Schätzung zu ermöglichen, nicht beachtet wird. Vamos eine kurze Erklärung über alle drei:

Natürlich, erst einmal, was ich hatte Es handelt sich um eine lineare Beziehung zwischen X und YEs ist ein Beziehungstyp, den ich von meinem Modell erobern werde.

Um zu überprüfen, ob es sich bei beiden Varianten um eine lineare Beziehung in einfacherer Kind handeln kann, ist eine grafische Darstellung der Verteilung erforderlich und sie wird visuell wie in der Beziehung interpretiert. Grafisches Beispiel:

Fälle von Linearität und Nichtlinearität

Als ich das Bild aufnahm, könnten zwei verschiedene Dinge zwischen linearen Überlegungen berücksichtigt werden, egal ob die Grafik eine besondere Bedeutung hat. Diese Linearität kann sowohl positiv als auch negativ sein.

Die zweite Prämisse ist, dass die Fehlervariation bei der bisherigen Verteilung gleich ist, oder in dieser Zeit ist es wichtig, dass die Fehler im Laufe der Regressionslinie verteilt werden, was zu einer Benachrichtigung über die Werte der verschiedenen unabhängigen Unternehmen führt.

Es ist einfach, die Homosexualität und die grafische Darstellung der Reste (Modellfehler) im Zusammenhang mit den bisherigen Werten zu überprüfen. In keinem Fall der Homosexualität wird beobachtet, dass sich die Rückstände bis zum Nullpunkt verteilen, ohne dass ein System vorhanden ist. Ja

Fall mit homozedasticidade und Fall mit heterocedasticidade (größere variância em valores mais de x)

Dies ist eine Voraussetzung, da es nicht möglich ist (wenn ein spezielles Pad ohne Grafik vorhanden ist), dass der Wert zweier Faktoren zu einer hohen Varianz führen kann, die auf die Effizienz des Modells ausgelegt ist. Eine Kind des Lidar ist so eine Verwendung von Techniken zur Umwandlung von Daten oder der Verwendung von Modellalternativen, als Regression nachgedacht oder Regression sturdy, die in Betracht gezogen werden muss, um eine Heterozedastik zu bewirken.

Die dritte Prämisse der linearen Regression ist eine Normalisierung der Rückstände, oder später müssen die Rückstände zu einer normalen Verteilung führen. Diese Prämisse ist wichtig, da die normale Verteilung von zwei Resten es ermöglicht, Schlussfolgerungen aus gültigen Statistiken zu ziehen, wie z. B. Vertraulichkeitsintervalle und Checks der Hypothesen.

Normale Verteilung und Rückstandsverteilung

Es handelt sich um eine Kind der Überprüfung der Normalität der Reste durch die QQ-Grafik (Quantil-Quantil), die die Verteilung der Reste mit der normalen Verteilung vergleicht. Keine QQ-Grafik, die Anzahl der Reste liegt in der Beziehung zu den für eine normale Verteilung angegebenen Mengen. Wenn sich die QQ-Grafik ungefähr in der Nähe befindet, bedeutet dies, dass die Reste ungefähr eine normale Verteilung aufweisen. Zum Beispiel:

Die Verteilung der Rückstände ist ungefähr regular

Im gegenteiligen Fall wird der Vertrieb nicht wie gewohnt zusammengebaut und vorab nicht bereitgestellt. Wie hier:

Die Verteilung der Rückstände erfolgt nicht wie gewohnt

Es ist jedoch wichtig, dass im großen Amt eine Verletzung der Normalität der beiden Reste eine geringere Auswirkung auf die statistischen Schlussfolgerungen hat, die von Teorema Central do Limite stammen. In einigen Fällen besteht die Möglichkeit, robustere Schätzungen zu erhalten, wenn die Normalität nicht erwartet wird. Wir empfehlen Ihnen jedoch, die Normalität so lange wie möglich in Betracht zu ziehen, um eine Validierung statistischer Schlussfolgerungen zu gewährleisten, die anhand des linearen Regressionsmodells erzielt werden.

Ein Viertel der linearen Regression ist eine Unabhängigkeit von den Resten, oder es bedeutet, dass sie als Beobachtungen unabhängig voneinander sein müssen. Außerhalb des Palavras muss noch keine Autokorrelation vorliegen, oder es wird darauf hingewiesen, dass die Reste eines bestimmten Pontons zu keinem Zeitpunkt mit den Resten der vorderen oder hinteren Pontons korrelieren.

Bei vorhandener Autokorrelation können die Rückstände nach der Validierung der geschätzten Koeffizienten und der statistischen Schlussfolgerung aus dem Regressionsmodell ermittelt werden. Wenn die Autokorrektur erfolgt ist, kann es zu Fehlern kommen, wenn eine Abhängigkeitsserie auftritt, oder die Voraussetzung für die Unabhängigkeit erfüllt ist und die geschätzten und ineffizienten Schätzungen entstehen können.

Grafik mit Autokorrelation und Grafik mit Autokorrelation

Um zu testen, ob zwischen den Rückständen eine Autokorrelation vorliegt, müssen wir den Durbin-Watson-Take a look at verwenden. Sie können diese Formel verwenden:

Gleichstellung des Durbin-Watson-Checks

Die Teststatistik entspricht ungefähr 2*(1-r) und weist eine Autokorrelation zwischen zwei Resten auf. Assim, für r == 0, zeigt eine serielle Korrelation an, die Teststatistik ist gleich 2 (ideales Ergebnis). Es ist eine Statistik, die jedes Jahr zwischen 0 und 4 liegt. Mehr als die Statistik von 0, mehr Belege für eine constructive Serienkorrelation. Quanto mehr als 4, mehr Beweise für die unfavourable Korrelation der Serie.

Multikolinearität ist eine Menge unabhängiger Variablen und wird durch eine oder mehrere unabhängige Variablen erklärt, oder es besteht die Möglichkeit, dass zwischen ihnen eine lineare Beziehung besteht. In diesem Zustand kam es zu einer Redundanz zwischen verschiedenen Angreifern, die zu einem ungenauen Rückschritt führten und die Interpretation ihrer Koeffizienten erschwerten.

Das Downside ist sehr groß und kann auftreten, wenn:

  • Eine Vielzahl von Fehlern wurde aufgrund eines Fehlers mehrfach weggelassen
  • P-Dummies, vor allem P-1-Dummies, sind aus einer Vielzahl von Kategorien gefertigt
  • Die unterschiedlichen Duas sind immer perfekt miteinander verbunden

Eine Möglichkeit zur Überprüfung einer Multikolinearität besteht darin, den VIF (Varianzinflationsfaktor) zu verwenden, der durch diese Formel dargestellt wird:

Gleichstellung des VIF

Wenn VIF das R2(R-Quadrado)-Konzept verwendet, wird die Metrik verwendet, um Ergebnisse von Regressionsmodellen zu erhalten, die jeweils einen Wert darstellen, der sie darstellt, da verschiedene unabhängige „Explikate“ und abhängige Variablen vorliegen. In diesem Fall ist es so, dass die R2-Berechnung zwischen den verschiedenen Prüfern durchgeführt wurde, und zwar so, dass sie nicht in der Lage ist, etwas zu erläutern, oder es stellt sich heraus, dass eine signifikante Korrelation vorliegt.

Der Wert des VIF wurde für jede Variation berechnet und wir mussten den Wert 5 berücksichtigen, indem wir ihn ausreichend hoch sendeten. Wenn es Zeit wird, müssen wir eine Änderung ausschließen und den VIF neu berechnen, da wir noch keine Änderungen im Vergleich zu weniger als 5 VIF vorgenommen haben.

Die Bedeutung der Prämissen für eine lineare Regression liegt in der Garantie der Zuverlässigkeit der Ergebnisse und in der Erlangung gültiger Interpretationen der geschätzten Koeffizienten. Um diese Prämissen zu verstehen, müssen wir sicher sein, dass unser Regressionsmodell ein nicht beneidenswerter linearer Schätzer ist, der in der Lage ist, sie angemessen zu erfassen, da die Beziehungen bereits vorhanden sind und genaue Schätzungen und Schlussfolgerungen aus der Statistik ziehen.

Im Gegenzug ist es wichtig, darauf zu achten, dass all dies als Voraussetzung nicht immer erforderlich ist, insbesondere in Fällen, in denen eine vorrangige und genaue Voraussicht erforderlich ist. In diesen Situationen besteht die Möglichkeit, dass alle Prämissen einer linearen Regression durch eine signifikante Komparierung der Fähigkeit des Modells der Fazer-Akuraden flexibel gestaltet werden.

Es ist wichtig zu verstehen, dass eine lineare Regression ein Grund für die Vorausschau ist, die für eine statistische Schlussfolgerung erforderlich ist. Aufgrund der Flexibilität als Prämissen müssen wir uns darüber im Klaren sein, welche Konsequenzen und Einschränkungen sich aus der Abschaffung ergeben. Ich bin nicht konform mit den Prämissen, die ich mit geschätzten Wünschen oder Ungenauigkeiten vergleichen kann, in bestimmten Kontexten ist es möglich, ein robustes und nützliches Vorschaumodell zu erhalten.

Dies ist jedoch nicht der Fall, ich muss grundsätzlich Sensibilitätsanalysen durchführen und das Modell in verschiedenen Szenarien sorgfältig prüfen oder aussortieren. Es ist notwendig, die Natur der einzelnen Dinge, den spezifischen Kontext des Issues und die Anforderungen des Projekts zu berücksichtigen. Auf diese Weise entscheiden wir uns für eine flexiblere Gestaltung der Prämissen und garantieren, dass das Modell weiterhin vertrauliche und vorläufige Informationen erhält, um die endgültige Entscheidung zu treffen.

Im Lebenslauf muss ich die Grundvoraussetzungen mit den Grundvoraussetzungen vergleichen, um die statistischen Schlussfolgerungen zu überprüfen. In bestimmten Fällen ist es möglich, vorab eine präzise Voraussicht zu nehmen und die Grundvoraussetzungen für eine lineare Regression zu entspannen. Nichtsdestotrotz ist es unbedingt erforderlich, mit der Vorsicht vorzugehen, die potenziellen Auswirkungen zu berücksichtigen und die entsprechenden Maßnahmen zu analysieren, um die Zuverlässigkeit und Nutzung der vorhersehbaren Ergebnisse für das jeweilige Modell zu gewährleisten.

Annahmen des linearen Regressionsalgorithmus | von Gomathi tamilselvam | Auf dem Weg zur Datenwissenschaft

Die vier Annahmen der linearen Regression – Statistik



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here