Wie Sie sehen, wurde keines der Motive von der KI erkannt. Wenn das nicht ausreicht, um Sie zu überzeugen, möchte ich Ihnen die von mir durchgeführten Assessments anhand einer Reihe generierter CAPTCHAs zeigen.
Unten finden Sie eine Testsuite, die zwei weit verbreitete KI-Modelle, eines zur Bildklassifizierung und das andere zur Objekterkennung, mit einem Stapel generierter CAPTCHAs (in diesem Fall 100 für den Bildklassifizierungstest und 1000 für den Objekterkennungstest) ausführt vergleicht die Antworten der Modelle mit den tatsächlichen.
=============================================== ResNet50 Assessments =================================================================
Solutions = ['baseball', 'donut']; Discovered: NONE (categorized as ['pickup', 'pickup truck', 'police van']);
Solutions = ['cat', 'owl']; Discovered: NONE (categorized as ['green snake', 'grass snake', 'electric locomotive']);
[...]
Solutions = ['banana', 'chair']; Discovered: NONE (categorized as ['snow leopard', 'ounce', 'Panthera uncia']);
Solutions = ['baseball', 'owl']; Discovered: NONE (categorized as ['leaf beetle', 'chrysomelid', 'weevil']);
=================================================================================================================================
Photos analysed: 100; topics acknowledged: 0.
=================================================================================================================================
============================================== DETR-ResNet50 Assessments ==============================================================
Solutions = ['car', 'donut']; Discovered: automotive (detected with confidence 0.999);
Solutions = ['baseball', 'beer']; Discovered: NONE (['sports ball', 'sports ball'] detected with confidence [0.948, 0.986]);
[...]
Solutions = ['orange', 'owl']; Discovered: NONE ([] detected with confidence []);
Solutions = ['beer', 'owl']; Discovered: NONE (['vase', 'vase'] detected with confidence [0.924, 0.988]);
=================================================================================================================================
Photos analysed: 1000; at the least one topic acknowledged: 513; each topics acknowledged: 35.
at the least one topic acknowledged: 51.3%; each topics acknowledged: 3.5%.
=================================================================================================================================
Wie Sie sehen, schlägt die Bildklassifizierung immer fehl, da nicht einmal eines der abgebildeten Motive jemals erkannt werden kann. Die Objekterkennung ist dagegen tatsächlich intestine – wenn auch offensichtlich nicht intestine genug – und schafft es, etwa in der Hälfte der Fälle nur eines der Motive und sporadisch (normalerweise ein Prozentsatz, der zwischen 2 % und 4 % liegt) beide Motive zu erkennen. Diese Ergebnisse bedeuten einen Erfolg von 96,5 % (in dieser speziellen Testsuite). Darüber hinaus ist der Prozentsatz der Fälle, in denen das Modell beide Personen erkennt, ziemlich lächerlich, so dass die CAPTCHAs mit schlechter Leistung sogar von Hand entfernt werden könnten, da sie immer weniger laut sind und man sie mit dem bloßen Auge erkennen kann. Angesichts dieser Fakten denke ich, dass ich mit Sicherheit zu dem Schluss kommen kann, dass mein CAPTCHA schlägt KI (zumindest für den Second).
Über ein Wochenende mit Node.js zusammen mit ÄußernIch habe eine Lösung entwickelt, um die Generierung dieser CAPTCHAs zu automatisieren und es jedem zu ermöglichen, sie über eine API zu nutzen. Der gesamte Code ist öffentlich verfügbar und vollständig dokumentiert mein Repository, das auch eine grundlegende React-Demo enthält, damit Sie das System ausprobieren können. Im Repository finden Sie auch eine Jupyter Pocket book-Datei mit anpassbaren Crashtests, die ausgeführt werden ResNet-50 Und DETR-ResNet-50 – weit verbreitete Modelle zur Bildklassifizierung und Objekterkennung – gegen die CAPTCHAs.