Roboter nutzt KI, um Walter zu finden

Der Roboter einer US-Kreativagentur findet Walter mithilfe von KI innert Sekunden. Das Experiment zeigt: Solche Systeme lassen sich mittlerweile relativ einfach herstellen.

von Luca Perler 10.08.2018

Die amerikanische Kreativagentur Redpepper hat einen Roboter gebaut, der dank künstlicher Intelligenz den rot-weiss gekleideten Protagonisten der Kinderbuchreihe «Wo ist Walter?» aufspürt. Das System, das auf günstige Hardware und quelloffene Software setzt, zeigt tatsächlich auf Walter und löst Wimmelbilder dabei beeindruckend schnell. Der Rekord des Prototyps liegt Redpepper zufolge bei 4,45 Sekunden. Das sei schneller, als die meisten Fünfjährigen einen Walter finden.

Der Rekord des Prototyps liegt Redpepper zufolge bei 4,45 Sekunden Der Rekord des Prototyps liegt Redpepper zufolge bei 4,45 Sekunden © Youtube/Screenshot

Walter ist die vielleicht bekannteste Wimmelbildfigur der Welt. Dabei tarnt er sich international auch durch eine Vielzahl unterschiedlicher Namen gut. «Wally» heisst er in seiner britischen Heimat, «Charlie» in Frankreich und «Waldo» in Nordamerika. Gegen «There's Waldo», den Roboter der US-Agentur, hilft das freilich nicht. Denn der Roboter ist darauf trainiert, Walter einfach an seinem überall im Wesentlichen gleichen Aussehen zu erkennen. Wenn sich die KI zu mindestens 95 Prozent sicher ist, den Weltenbummler aufgespürt zu haben, zeigt sie dann mit einer kleinen Gummihand an einem Roboterarm auf sein Versteck.

Für die Köpfe hinter dem Projekt ging es vor allem darum auszuloten, was machbar ist. Denn der Trainings-Datensatz bestand nur aus 62 Walter-Köpfen und 45 ganzen Walter-Figuren aus einer Google-Suche, sagte Matt Reed, Creative Technologist bei Redpepper. «Ich dachte, das wären nicht genug Daten für ein starkes Modell, aber es liefert überraschend gute Vorhersagen für Walter, die nicht Teil des ursprünglichen Trainings-Sets waren», erklärte er gegenüber «The Verge».

Günstig und quelloffen

Der Walter-Suchroboter zeigt auch, dass so ein System mittlerweile mit relativ einfachen Mitteln realisierbar ist. Denn ein günstiger Rasperberry Pi steuert einen «uArm Swift Pro» des chinesischen Tech-Start-ups Ufactory mit Kameraerweiterung, um ein Wimmelbild abzusuchen. Um darin Gesichter zu erkennen, setzt das System auf OpenCV, eine freie Programmbibliothek mit Algorithmen für die Bildverarbeitung und das maschinelle Sehen. Durchgeführt wird die Analyse der Gesichter schliesslich mithilfe von Googles Cloud-Dienst AutoML, der mit den Walter-Köpfen und -Figuren trainiert wurde.

Hinweis: Dieser Text ist ursprünglich bei «pressetext.com» erschienen und wurde von Thomas Pichler verfasst. Die PCtipp-Redaktion ergänzte die Originalfassung nachträglich.