Analyse sozialer Netzwerke mit Python und NetworkX 2

0
30


Fortsetzung des Anfängerleitfadens zur Verwendung der NetworkX-Bibliothek von Python zur Durchführung von Analysen sozialer Netzwerke

In Teil 1 haben wir die Linkanalyse untersucht, insbesondere die Analyse sozialer Netzwerke bei der Untersuchung und dem Verständnis von Beziehungen zwischen Einzelpersonen und Organisationen. Dann stellten wir vor Analyse sozialer Netzwerke (SNA), eine spezielle Artwork der Linkanalyse, die sich auf Personen und Gruppen und ihre Beziehungen konzentriert. Wir haben die Grundkonzepte von SNA überprüft, einschließlich Knoten (die Individuen darstellen) und Kanten (die Verbindungen zwischen Individuen darstellen). Anschließend diskutierten wir am Beispiel von Billy Corgan und seiner Beziehung zu den Gründungsmitgliedern von Smashing Pumpkins, wie SNA verwendet werden kann, um sozialen Einfluss, Gruppenbildung und Informationsfluss mithilfe von Metriken wie Gradzentralität und Zwischenzentralität zu verstehen.

Bild von Gordon Johnson aus Pixabay

In diesem Beispiel haben wir das Netzwerk klein und einfach gehalten. In diesem Tutorial werden wir weiterhin Python und NetworkX verwenden, um den Einflussbereich von Billy Corgan zu untersuchen. Wir werden auch das Netzwerk von Billy Corgan erweitern, um es komplexer zu machen und unser Verständnis zu verbessern Abschlusszentralität Und Zwischenzentralität. Während wir dieses Beispiel durcharbeiten, werden wir den Kontext und die Vorgehensweise besprechen Fachwissen ist unerlässlich, um den Nutzen der Analyse sozialer Netzwerke zu maximieren.

Analyse sozialer Netzwerke im Kontext

Fachwissen und Forschung sind wesentliche Bestandteile der Analyse sozialer Netzwerke, da sie den notwendigen Kontext, den theoretischen Rahmen und das Verständnis der sozialen und kulturellen Faktoren bieten, die soziale Netzwerke prägen. Ohne dieses Verständnis laufen Sie Gefahr, irreführende oder falsche Ergebnisse zu erzielen, die die Komplexität und Nuancen der Daten sozialer Netzwerke nicht genau erfassen.

Bevor du anfängst…

  1. Verfügen Sie über Grundkenntnisse in Python? Wenn nicht, Fang hier an.
  2. Sind Sie mit grundlegenden Konzepten der Analyse sozialer Netzwerke wie Knoten und Kanten oder Metriken wie Zentralität vertraut? Wenn nicht, Fang hier an.

Sammeln von Daten zur Analyse sozialer Netzwerke

Welche Artwork von Daten benötigen wir additionally, um mit der Untersuchung des Einflussbereichs von Billy Corgan zu beginnen? Beginnen wir mit all seinen aktuellen und ehemaligen Bandkollegen von den Smashing Pumpkins.

Mithilfe von Wikipedia können wir eine ziemlich zuverlässige Liste aller Musiker erhalten, die seit 1988 bei den Smashing Pumpkins gespielt haben. Übrigens – wussten Sie das? Billy Corgan hatte (kurzzeitig) eine andere Band namens Zwan im frühe Achtziger? Spoiler-Alarm, es endete nicht intestine. Machen wir auch eine Liste davon.

Öffnen Sie dann Ihre bevorzugte IDE, importieren Sie die relevanten Bibliotheken und erstellen Sie zwei Pay attention – eine für Smashing Pumpkins und eine für Zwan.

Beziehungen in sozialen Netzwerken beschreiben

Unsere nächste Aufgabe besteht darin, einige Tupellisten zu erstellen, um die Beziehungen zwischen Billy Corgan und jedem dieser Bandmitglieder darzustellen. Wir müssen auch die Beziehung zwischen jedem Bandmitglied und allen anderen Bandmitgliedern berücksichtigen.

In der Graphentheorie wird diese Artwork von Beziehung als bezeichnet symmetrisch. Wenn Billy mit Jimmy in einer Band ist, ist Jimmy auch mit Billy in einer Band.

Um dies zu erreichen, können wir mit Python eine einfache Funktion erstellen, die jede Liste von Bandmitgliedern aufnimmt und alle möglichen Kombinationen der Paare zurückgibt.

Dann können wir es auf jede Liste anwenden und die Ergebnisse kombinieren, um eine Liste von Tupeln zu erstellen, die die Beziehungen zwischen allen Bandmitgliedern von Zwan und den Smashing Pumpkins enthalten.

Die Ausgabe sieht etwa so aus:

[('Billy Corgan', 'James Iha'),
('Billy Corgan', 'Jimmy Chamberlin'),
('Billy Corgan', 'Katie Cole'),
('Billy Corgan', "D'arcy Wretzky"),
('Billy Corgan', 'Melissa Auf der Maur'),
('Billy Corgan', 'Ginger Pooley'),
('Billy Corgan', 'Mike Byrne'),
('Billy Corgan', 'Nicole Fiorentino'),
('James Iha', 'Jimmy Chamberlin'),
('James Iha', 'Katie Cole'),
('James Iha', "D'arcy Wretzky"),
('James Iha', 'Melissa Auf der Maur'),
('James Iha', 'Ginger Pooley'),
('James Iha', 'Mike Byrne'),
('James Iha', 'Nicole Fiorentino'),
('Jimmy Chamberlin', 'Katie Cole'),
('Jimmy Chamberlin', "D'arcy Wretzky"),
('Jimmy Chamberlin', 'Melissa Auf der Maur'),
('Jimmy Chamberlin', 'Ginger Pooley'),
('Jimmy Chamberlin', 'Mike Byrne'),
('Jimmy Chamberlin', 'Nicole Fiorentino'),
('Katie Cole', "D'arcy Wretzky"),
('Katie Cole', 'Melissa Auf der Maur'),
('Katie Cole', 'Ginger Pooley'),
('Katie Cole', 'Mike Byrne'),
('Katie Cole', 'Nicole Fiorentino'),
("D'arcy Wretzky", 'Melissa Auf der Maur'),
("D'arcy Wretzky", 'Ginger Pooley'),
("D'arcy Wretzky", 'Mike Byrne'),
("D'arcy Wretzky", 'Nicole Fiorentino'),
('Melissa Auf der Maur', 'Ginger Pooley'),
('Melissa Auf der Maur', 'Mike Byrne'),
('Melissa Auf der Maur', 'Nicole Fiorentino'),
('Ginger Pooley', 'Mike Byrne'),
('Ginger Pooley', 'Nicole Fiorentino'),
('Mike Byrne', 'Nicole Fiorentino'),
('Billy Corgan', 'Jimmy Chamberlin'),
('Billy Corgan', 'Paz Lenchantin'),
('Billy Corgan', 'David Pajo'),
('Billy Corgan', 'Matt Sweeney'),
('Jimmy Chamberlin', 'Paz Lenchantin'),
('Jimmy Chamberlin', 'David Pajo'),
('Jimmy Chamberlin', 'Matt Sweeney'),
('Paz Lenchantin', 'David Pajo'),
('Paz Lenchantin', 'Matt Sweeney'),
('David Pajo', 'Matt Sweeney')]

Als Nächstes können wir die Liste der Tupel durchlaufen, um mit Community X ein Diagramm zu erstellen.

Dadurch wird dieses Diagramm generiert:

Lassen Sie uns zwei wichtige Beobachtungen diskutieren, die sich aus dieser Grafik über das Netzwerk ableiten lassen.

  1. Die obere rechte Ecke, in der die Bandmitglieder der Smashing Pumpkins erscheinen, ist komplexer als die untere linke Ecke, in der sich die Mitglieder von Zwan befinden, da es in Zwan weniger Mitglieder gibt.
  2. Billy Corgan und Jimmy Chamberlin erscheinen in der Mitte, weil sie in beiden Bands sind.

Betrachten wir als Nächstes, wie sich diese Beobachtungen in der Gradzentralität und der Betweenness-Zentralität widerspiegeln können.

Diploma Centrality und Betweenness Centrality mit NetworkX

In Teil 1, haben wir den Grad der Zentralität und die Betweenness-Zentralität für Billy Corgan und die Gründungsmitglieder der Smashing Pumpkins berechnet. Um dies zu erreichen, haben wir zwei Methoden in NetworkX aufgerufen und ein einfaches Skript geschrieben, um sie auszuführen. Da wir dieses Mal unser Diagramm zusammengestellt haben, können wir das Diagramm einfach eingeben, um die Zentralitätsmaße zu berechnen.

Dadurch wird die folgende Ausgabe generiert:

Lassen Sie uns besprechen, wie diese Ergebnisse zu interpretieren sind.

Was sagt uns diese Tabelle über den Grad der Zentralität aller Bandmitglieder?

1. Billy Corgan hat den höchsten Zentralitätswert von 1.000, was darauf hinweist, dass er die meisten Verbindungen oder Kooperationen innerhalb von Smashing Pumpkins und Zwan hat. Er ist mit jedem anderen Mitglied beider Bands direkt verbunden.

2. Jimmy Chamberlin hat auch einen Grad-Zentralitätswert von 1.000, was darauf hindeutet, dass er, wie Billy Corgan, direkte Verbindungen zu jedem anderen Mitglied der beiden Bands hat.

3. James Iha, Katie Cole, D’arcy Wretzky, Melissa Auf der Maur, Ginger Pooley, Mike Byrne, Nicole Fiorentino, Paz Lenchantin, David Pajo und Matt Sweeney haben alle den gleichen Gradzentralitätswert von 0,727273, was darauf hindeutet, dass dies der Fall ist ähnliche Ebenen der Verbindungen oder Zusammenarbeit innerhalb der Bands.

Jimmy Chamberlin, ca. 2014 – Swimfinfan aus Chicago, CC BY-SA 2.0 <https://creativecommons.org/licenses/by-sa/2.0>, über Wikimedia Commons

Was sagt uns diese Tabelle über die Betweenness-Zentralität aller Bandmitglieder?

1. Billy Corgan und Jimmy Chamberlin haben mit 0,190909 auch die höchsten Betweenness-Zentralitätswerte, was darauf hindeutet, dass sie wahrscheinlich wichtige Vermittler oder Brücken zwischen anderen Bandmitgliedern in Bezug auf Kommunikation oder Zusammenarbeit sind.

2. Keines der Bandmitglieder außer Billy Corgan und Jimmy Chamberlin hat einen Zwischenzentralitätswert ungleich Null, was darauf hindeutet, dass sie keine zentrale Rolle bei der Überbrückung von Verbindungen zwischen anderen Mitgliedern spielen.

Schlussfolgerungen mit Domänenwissen stärken

Während Zentralitätsmetriken Datenpunkte liefern, aus denen wir Rückschlüsse ziehen können, basieren diese Rückschlüsse ausschließlich auf den in der Tabelle bereitgestellten Informationen.

Um genauere Schlussfolgerungen über den Einflussbereich von Billy Corgan zu ziehen, müssten Sie Kenntnisse über various Musik und Musiker der Neunzigerjahre haben, um eine umfassende Hypothese über die Dynamik zwischen den Mitgliedern dieser Bands aufstellen zu können.

Wenn Sie additionally ein Fan der Musik der Neunziger sind, lassen Sie mich in den Kommentaren wissen, was Sie von diesen Ergebnissen halten. Bleiben Sie auf dem Laufenden für Teil 3, in dem wir das Netzwerk erweitern, damit wir Nähezentralität, Clustering und Communities in der Analyse sozialer Netzwerke untersuchen können.

Wenn Sie möchten vollständig kommentiertes Python-Skript für dieses TutorialBesuche meine GitHub!

👩🏻‍💻 Christine Egan | Mittel | Github | LinkedIn





Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here