Herausforderungen beim maschinellen Lernen für Vertrauen und Sicherheit meistern: Vom Datenungleichgewicht zur Infrastruktur | von Yifei Ren | Juni 2023

0
23


Der Einsatz von maschinellem Lernen zur Lösung von Vertrauens- und Sicherheitsproblemen hat in letzter Zeit an Popularität gewonnen. Allerdings sind damit mehrere Herausforderungen verbunden.

Eine der größten Herausforderungen ist der Umgang mit Datenungleichgewichten. In vielen Fällen ist Betrug selten und führt zu einem unausgeglichenen Datensatz. Um dieses Drawback anzugehen, können verschiedene Techniken eingesetzt werden. Downsampling kann für die negativen Labels (keine Betrugsfälle) verwendet werden, um deren Darstellung zu reduzieren, während Upsampling angewendet werden kann, um die positiven Fälle (Betrugsfälle) zu erhöhen. Ein anderer Ansatz besteht darin, verschiedenen Klassen unterschiedliche Gewichtungen zuzuweisen, sodass Fehler bei positiven Fällen stärker bestraft werden.

Die Datenkennzeichnung ist eine weitere große Herausforderung. Für die Datenkennzeichnung können unterschiedliche Methoden eingesetzt werden. Anhand historischer Betrugsfälle können menschliche Agenten eingesetzt und geschult werden. Benutzerberichte und Suggestions bieten eine kostengünstige Möglichkeit, Daten zu erhalten, und es kann selbstüberwachtes oder unüberwachtes Lernen verwendet werden, bei dem Fälle auf der Grundlage heuristischer Regeln gekennzeichnet werden.

Eine weitere Herausforderung stellt die Datenqualität dar. Das Qualifikationsniveau menschlicher Agenten kann variieren, was zu einer falschen Kennzeichnung von Betrugs- und Nichtbetrugsfällen führt. Außerdem werden einige Betrugsfälle möglicherweise nicht zur Kennzeichnung in die Warteschlange der Agenten eingereiht, weil sie nicht von Heuristiken erkannt oder vom Benutzer nicht in die Warteschlange gestellt werden. Die Sicherstellung qualitativ hochwertiger Trainingsdaten ist für die Entwicklung genauer Modelle für maschinelles Lernen von entscheidender Bedeutung.

Die Infrastruktur ist ein entscheidender Aspekt von Vertrauen und Sicherheit oder Betrugsabwehr. Die Verwaltung großer Datenmengen aus verschiedenen Microservices innerhalb einer Microservices-Architektur erfordert eine effektive Ereignisverarbeitung. Es ist eine Echtzeiterkennung betrügerischer Verhaltensweisen erforderlich, deren Einrichtung aufgrund des Umfangs und der Genauigkeitsanforderungen kostspielig sein kann. Es können Ereignisverarbeitungs-Engines wie Kafka sowie On-line- und Offline-Jobverarbeitung verwendet werden. Speichersysteme wie Redis können sowohl On-line- als auch Offline-Daten speichern, wobei ein Function Retailer dabei hilft, Daten schnell für Vorhersagen von Machine-Studying-Modellen abzurufen.

Zusammenfassend umfassen die Herausforderungen beim Einsatz von maschinellem Lernen für Vertrauens- und Sicherheitsprobleme Datenungleichgewichte, Datenqualität und Systeminfrastruktur. Die Bewältigung dieser Herausforderungen erfordert den Einsatz geeigneter Techniken und Ansätze unter Berücksichtigung des spezifischen Kontexts und der Anforderungen des jeweiligen Issues.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here