Mit Ithaca die Vergangenheit vorhersagen

0
26


Restaurierung, Platzierung und Datierung antiker Texte durch Zusammenarbeit zwischen KI und Historikern

Die Geburt der menschlichen Schrift markierte den Beginn von Geschichte und ist von entscheidender Bedeutung für unser Verständnis vergangener Zivilisationen und der Welt, in der wir heute leben. Beispielsweise begannen die Griechen vor mehr als 2.500 Jahren, auf Stein, Keramik und Metall zu schreiben, um alles von Pachtverträgen und Gesetzen bis hin zu Kalendern und Orakeln zu dokumentieren und so einen detaillierten Einblick in den Mittelmeerraum zu geben. Leider handelt es sich um eine unvollständige Aufzeichnung. Viele der erhaltenen Inschriften wurden im Laufe der Jahrhunderte beschädigt oder von ihrem ursprünglichen Standort entfernt. Darüber hinaus sind moderne Courting-Techniken, wie z Radiokohlenstoffdatierungkann auf diesen Materialien nicht verwendet werden, was die Interpretation der Inschriften schwierig und zeitaufwändig macht.

Im Einklang mit Die Mission von DeepMind Um Intelligenz zu lösen, um Wissenschaft und Menschheit voranzubringen, haben wir mit dem zusammengearbeitet Abteilung für Geisteswissenschaften der Universität Ca‘ Foscari in VenedigDie Fakultät für klassische Philologie der Universität Oxfordund das Fakultät für Informatik der Wirtschaftsuniversität Athen um zu untersuchen, wie maschinelles Lernen Historikern helfen kann, diese Inschriften besser zu interpretieren – was zu einem umfassenderen Verständnis der antiken Geschichte führt und das Potenzial für die Zusammenarbeit zwischen KI und Historikern freisetzt.

In einem Papier heute veröffentlicht in Natur, stellen wir gemeinsam Ithaca vor, das erste tiefe neuronale Netzwerk, das den fehlenden Textual content beschädigter Inschriften wiederherstellen, ihren ursprünglichen Standort identifizieren und dabei helfen kann, das Datum ihrer Erstellung zu ermitteln. Ithaka ist nach der griechischen Insel benannt Homers Odyssee und baut darauf auf und erweitert Pythia, unser vorheriges System, das sich auf die Wiederherstellung von Texten konzentrierte. Unsere Auswertungen zeigen, dass Ithaca eine Genauigkeit von 62 % bei der Wiederherstellung beschädigter Texte und eine Genauigkeit von 71 % bei der Identifizierung ihres ursprünglichen Standorts erreicht und Texte bis auf 30 Jahre ihres tatsächlichen Datumsbereichs datieren kann. Historiker haben das Software bereits genutzt, um bedeutende Perioden der griechischen Geschichte neu zu bewerten.

Um unsere Forschung Forschern, Pädagogen, Museumsmitarbeitern und anderen allgemein zugänglich zu machen, haben wir eine Partnerschaft mit geschlossen Google Cloud Und Google Kunst und Kultur einen starten kostenlose interaktive Version von Ithaca. Und um die weitere Forschung zu unterstützen, haben wir auch Open Source Unser Code, das vorab trainierte Modell und ein interaktives Colaboratory-Notizbuch.

Abbildung 1. Diese restaurierte Inschrift (IG I3 4B) dokumentiert einen Erlass bezüglich der Akropolis von Athen und datiert auf 485/4 v. Chr. (CC BY-SA 3.0, WikiMedia).
6231e4946bcb81d92694d69a Fig%202.2
Abbildung 2. Ithakas Architektur. Beschädigte Textteile werden mit einem Bindestrich „-“ dargestellt. Hier haben wir die Zeichen „δημ“ künstlich verfälscht. Mit diesen Eingaben stellt Ithaca den Textual content wieder her und identifiziert die Zeit und den Ort, an dem der Textual content geschrieben wurde.

Kollaborative Instruments

Ithaca wird auf der trainiert größter digitaler Datensatz griechischer Inschriften von dem Packard Humanities Institute. Verarbeitung natürlicher Sprache Modelle werden üblicherweise mithilfe von Wörtern trainiert, da die Reihenfolge, in der sie in Sätzen erscheinen, und die Beziehungen zwischen ihnen zusätzlichen Kontext und Bedeutung bieten. „Es struggle einmal“ hat beispielsweise mehr Bedeutung als jedes einzelne Zeichen oder Wort einzeln betrachtet. Allerdings sind viele der Inschriften, die Historiker mit Ithaka analysieren möchten, beschädigt und oft fehlen Textabschnitte. Um sicherzustellen, dass unser Modell auch dann noch funktioniert, wenn es mit einem dieser Elemente konfrontiert wird, haben wir es trainiert, indem wir sowohl Wörter als auch die einzelnen Zeichen als Eingaben verwendet haben. Der spärliche Selbstaufmerksamkeitsmechanismus im Kern des Modells wertet diese beiden Eingaben parallel aus, sodass Ithaca die Einschreibungen nach Bedarf bewerten kann.

6231e4aed783c158e7bc03a1 Fig%203.2
Abbildung 3. Ithacas Ergebnisse. (a) Restaurierungsvorhersagen für 6 fehlende Zeichen (Striche) in einer athenischen Inschrift (IG II² 116). Die obere Wiederherstellung in Grün ist korrekt (συμμαχία, „Allianz“). Beachten Sie, dass die folgenden Hypothesen (ἐκκλησία, „Versammlung“ und προξενία, „Vertrag zwischen Staat und Ausländer“), rot hervorgehoben, typischerweise in athenischen politischen Dekreten vorkommen und Ithakas Empfänglichkeit für den Kontext offenbaren. (b) Geografische Zuschreibung einer Inschrift aus Amorgos (IG XII 7, 2). Die Prime-Vorhersage für Ithaka ist richtig, und die nächstgelegenen Vorhersagen beziehen sich auf benachbarte Regionen. (c) Datumsverteilung für eine Inschrift aus Delos (IG XI 4, 579). Das Datumsintervall der Grundwahrheit zwischen 300 und 250 v. Chr. ist in Grau dargestellt. Die vorhergesagte Verteilung von Ithaka ist gelb und hat einen Mittelwert von 273 v. Chr. (in Grün).

Um den Wert von Ithaca als Forschungsinstrument zu maximieren, haben wir außerdem eine Reihe visueller Hilfsmittel erstellt, um sicherzustellen, dass die Ergebnisse von Ithaca für Historiker leicht interpretierbar sind:

  • Restaurierungshypothesen: Ithaca generiert mehrere Vorhersagehypothesen für die Textwiederherstellungsaufgabe, aus denen Historiker mithilfe ihres Fachwissens auswählen können.
  • Geografische Zuordnung: Ithaca zeigt seine Unsicherheit, indem es Historikern eine Wahrscheinlichkeitsverteilung über alle möglichen Vorhersagen liefert – statt nur einer einzigen Ausgabe. Als Ergebnis werden Wahrscheinlichkeiten für 84 verschiedene antike Regionen zurückgegeben, die den Grad der Sicherheit darstellen. Diese Ergebnisse werden auf einer Karte visualisiert, um Aufschluss über mögliche zugrunde liegende geografische Zusammenhänge in der gesamten antiken Welt zu geben.
  • Chronologische Zuschreibung: Bei der Datierung eines Textes erstellt Ithaka eine Verteilung der vorhergesagten Daten über alle Jahrzehnte von 800 v. Chr. bis 800 n. Chr. Dies kann es Historikern ermöglichen, die Zuverlässigkeit des Modells für bestimmte Datumsbereiche zu visualisieren, was wertvolle historische Erkenntnisse liefern kann.
  • Ausprägungskarten: Um die Ergebnisse den Historikern zu übermitteln, verwendet Ithaca eine Technik, die üblicherweise in der Bildverarbeitung verwendet wird und identifiziert, welche Eingabesequenzen am meisten zu einer Vorhersage beitragen. Die Ausgabe hebt die Wörter in verschiedenen Farbintensitäten hervor, die zu Ithacas Vorhersagen für fehlenden Textual content, fehlenden Ort und fehlende Daten führten.
6231e4cfc0dd671ee8e1dc1b Fig%204.2
Abbildung 4. Dieser Textual content (IG II² 116, Athen 361/0 v. Chr.) dokumentiert ein Bündnis zwischen den Menschen von Athen und Thessalien. Mithilfe von Salienzkarten können wir uns vorstellen, dass sich Ithaka bei der Wiederherstellung des beschädigten Wortes „Allianz“ auf die kontextuell wichtigen Wörter „Athener“ und „Thessalier“ „konzentriert“.

Beitrag zu historischen Debatten

Unsere experimentelle Auswertung zeigt, wie die Designentscheidungen und Visualisierungshilfen von Ithaca es Forschern erleichtern, Ergebnisse zu interpretieren. Die erfahrenen Historiker, mit denen wir zusammengearbeitet haben, erreichten eine Genauigkeit von 25 %, wenn sie alleine an der Restaurierung antiker Texte arbeiteten. Bei Verwendung von Ithaca steigt ihre Leistung jedoch auf 72 %, übertrifft damit die individuelle Leistung des Modells und zeigt das Potenzial der Zusammenarbeit zwischen Mensch und Maschine, die historische Interpretation voranzutreiben, relative Datierungen für historische Ereignisse festzulegen und sogar zu aktuellen methodischen Debatten beizutragen.

Beispielsweise sind sich Historiker derzeit nicht einig über das Datum einer Reihe wichtiger Ereignisse Athener Dekrete hergestellt zu einer Zeit, als bedeutende Persönlichkeiten wie Sokrates und Perikles lebten. Es wurde lange angenommen, dass die Dekrete vor 446/445 v. Chr. verfasst wurden, obwohl neue Beweise auf ein Datum in den 420er Jahren v. Chr. schließen lassen. Obwohl es wie ein kleiner Unterschied erscheinen magazine, sind diese Dekrete von grundlegender Bedeutung für unser Verständnis der politischen Geschichte des klassischen Athens.

Unser Trainingsdatensatz enthält die frühere Zahl von 446/445 v. Chr. Um die Vorhersagen von Ithaca zu testen, haben wir es anhand eines Datensatzes neu trainiert, der die datierten Inschriften nicht enthielt, und diese zurückgehaltenen Texte dann zur Analyse eingereicht. Bemerkenswerterweise liegt das durchschnittliche vorhergesagte Datum der Dekrete in Ithaka bei 421 v. Chr., was mit den jüngsten Datierungsdurchbrüchen übereinstimmt und zeigt, wie maschinelles Lernen zu Debatten rund um einen der bedeutendsten Momente der griechischen Geschichte beitragen kann.

6231e4e8ad33cf33f6d57c3c Fig%205.2
Abbildung 5. Ithacas Vorhersagen im Vergleich zu den Grundwahrheiten des Datensatzes des Packard Humanities Institute (PHI) im Vergleich zu jüngsten historischen Neubewertungen. PHI-Kennzeichnungen liegen im Durchschnitt 27 Jahre von den Neubewertungen entfernt, während Ithacas Vorhersagen im Durchschnitt nur 5 Jahre von den neu vorgeschlagenen Grundwahrheiten abweichen.

Wir glauben, dass dies erst der Anfang für Instruments wie Ithaca und das Potenzial für eine Zusammenarbeit zwischen maschinellem Lernen und den Geisteswissenschaften ist. Das antike Griechenland spielt eine entscheidende Rolle für unser Verständnis der Mittelmeerwelt, ist aber immer noch nur ein Teil eines riesigen globalen Bildes der Zivilisationen. Zu diesem Zweck arbeiten wir derzeit an Versionen von Ithaca, die auf anderen alten Sprachen trainiert wurden, und Historiker können ihre Datensätze bereits in der aktuellen Architektur verwenden, um andere antike Schriftsysteme zu untersuchen Akkadisch Zu Demotisch Und hebräisch Zu Maya-. Wir hoffen, dass Modelle wie Ithaca das kooperative Potenzial zwischen KI und den Geisteswissenschaften freisetzen und die Artwork und Weise, wie wir über einige der bedeutendsten Perioden der Menschheitsgeschichte studieren und schreiben, grundlegend beeinflussen können.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here