🤰 👢 🤞🏻 Gesichtserkennungstechnologie: eine geheime Geschichte 🙂 ♎️ 📕

Vor sechzig Jahren erfand Woody Bledsoe, der Sohn eines Bauern, die Gesichtsidentifikationstechnologie. Aber Beweise für seine Beteiligung an der Entdeckung sind praktisch verschwunden.

Die Herausgeber von Netology haben eine angepasste Übersetzung des Wired-Artikels über dieses Unbekannte in einem weiten Kreis der Geschichte vorbereitet , über die Entwicklungen von Bledsoe und seinem Team, die in der modernen Gesichtserkennungstechnologie verwendet werden.

Woody Bledsoe war etwa dreißig Jahre lang Professor an der University of Texas in Austin und arbeitete an der Entwicklung von automatisiertem Denken und künstlicher Intelligenz. Nach den Memoiren von Lance, Bledsoes Sohn, war der Professor ein begeisterter optimistischer Wissenschaftler, der Ende der 1950er Jahre davon träumte, einen Computer zu schaffen, der mit menschlichen Fähigkeiten ausgestattet ist und komplexe mathematische Theoreme beweisen, ein Gespräch führen und anständig Tischtennis spielen kann.

Doch zu Beginn seiner Karriere suchte Bledsoe nach einer Möglichkeit, Maschinen das Erkennen von Gesichtern beizubringen - eine unterschätzte, aber potenziell mächtige menschliche Fähigkeit. Dies waren die ersten Studien zur Gesichtsidentifikation (1960), und die Arbeit des Professors erregte das Interesse der US-Geheimdienste. Woodys Hauptinvestoren waren wahrscheinlich CIA-Frontunternehmen.

:

Heutzutage wird die Gesichtserkennung verwendet, um die Sicherheit von Telefonen, Laptops, Pässen und Zahlungsanwendungen zu gewährleisten. Diese Technologie soll den gezielten Werbemarkt revolutionieren und die Diagnose bestimmter Krankheiten beschleunigen. Gleichzeitig wird die Gesichtsidentifikationstechnologie zu einem Instrument des staatlichen Drucks und der Unternehmensüberwachung.

Mit Hilfe dieser Technologie in China verfolgt die Regierung beispielsweise Vertreter der uigurischen ethnischen Minderheit, von denen Hunderttausende in politische Gefangenenlager gebracht wurden. Und in den Vereinigten Staaten führen laut der Washington Post die Einwanderungs- und Zollpolizei und das FBI eine digitale Suche durch: Suche nach Verdächtigen in Regierungsdatenbanken für Führerscheine - manchmal ohne vorher vor Gericht zu gehen.

Im Jahr 2019 ergab eine Untersuchung der Financial Times, dass Forscher von Microsoft und der Stanford University eine große Anzahl von Datenpaketen mit Bildern von Personen ohne Wissen oder Zustimmung der Fotografierten gesammelt und öffentlich zugänglich gemacht haben. In der Folge wurden diese Daten zerstört, aber Forscher von Technologie-Startups und einer chinesischen Militärakademie haben es geschafft, sie zu erhalten.

Woody Bledsoes Forschungen zur Gesichtserkennung in den 1960er Jahren haben die technologischen Durchbrüche und ethischen Implikationen vorweggenommen, die wir heute sehen. Diese grundlegenden Werke sind jedoch fast völlig unbekannt - die meisten wurden nie veröffentlicht.

1995 bat Woody aus unbekannten Gründen seinen Sohn, das Forschungsarchiv zu zerstören. Aber die meisten Zeitungen haben überlebt, und Tausende von Seiten seiner Arbeit sind jetzt im Briscoe Center for American History an der University of Texas untergebracht.

Unter anderem sind Dutzende von Fotografien von Menschen erhalten, und einige Gesichter sind mit seltsamen mathematischen Notationen versehen, als ob sie von einer Art "geometrischer" Hautkrankheit betroffen wären. In diesen Porträts kann man die Geschichte der Entstehung der Technologie erkennen, die sich in den kommenden Jahrzehnten aktiv entwickeln und in viele Bereiche menschlichen Handelns eindringen wird.

Wie alles begann. Tupelmethode

Woodrow Wilson (Woody) Bledsoe wurde 1921 in eine große Familie eines Teilhabers aus Oklahoma geboren. Er war das zehnte Kind in der Familie und half seinem Vater, soweit er sich erinnern konnte, immer bei der Hausarbeit. Er besaß eine mathematische Denkweise. Abitur gemacht. Er studierte drei Monate an der Universität von Oklahoma, danach wurde Woody am Vorabend des Zweiten Weltkriegs in die Armee eingezogen.

Nach dem Krieg studierte Woody Mathematik an der Universität von Utah und ging dann nach Berkeley, um seinen Ph.D. Nach seinem Abschluss an der Graduiertenschule arbeitete Woody in der Atomwaffenforschung bei der staatlichen Sandia Corporation in New Mexico - zusammen mit Größen wie Stanislaw Ulam, der an der Herstellung der Wasserstoffbombe beteiligt war.

Bei Sandia hat Woody die ersten Schritte in der Computerwelt unternommen, eine Verpflichtung, die sein Leben durchziehen wird. Zuerst habe ich den Code für Atomwaffenprojekte geschrieben. Und später interessierte sich Woody für die automatische Mustererkennung, insbesondere für das maschinelle Lesen - den Prozess, einem System beizubringen, unbeschriftete Bilder geschriebener Zeichen zu erkennen.

Woody Bledsoe und sein Kollege Iben Browning, ein gelehrter Erfinder, Luftfahrtingenieur und Biophysiker, entwickelten eine Methode, die später als n-Tupel-Methode bekannt wurde.

Die Wissenschaftler projizierten zunächst ein gedrucktes Symbol - beispielsweise den Buchstaben Q - auf ein rechteckiges Zellenraster wie ein liniertes Blatt Papier. Jeder Zelle wurde eine Binärzahl zugewiesen, abhängig von der Anwesenheit oder Abwesenheit eines Teils des Symbols: 0 - für eine leere Zelle, 1 - für eine gefüllte. Die Zellen wurden dann zufällig in geordnete Paare wie Koordinatensätze gruppiert. Theoretisch könnten Gruppen eine beliebige Anzahl von Zellen enthalten, daher der Name der Methode. Anschließend hat das System mithilfe mehrerer mathematischer Schritte dem Symbolraster einen eindeutigen Wert zugewiesen. Wenn ein neues Symbol gefunden wurde, wurde das Raster dieses Symbols mit anderen in der Datenbank verglichen, bis die nächste Übereinstimmung gefunden wurde.

Das Wesentliche der Methode war, dass viele Varianten desselben Vorzeichens erkannt werden konnten: Die meisten Qs erzielten im Vergleich zu anderen Qs tendenziell ziemlich ähnliche Ergebnisse. Der Prozess funktionierte am besten mit jedem Muster, nicht nur mit Text. Laut Robert S. Boyer, Mathematiker und langjähriger Freund von Woody, hat die Tupelmethode dazu beigetragen, den Umfang der Mustererkennung zu definieren. Dies war einer der ersten Schritte zur Frage: "Wie kann ich eine Maschine so programmieren, dass sie das tut, was die Leute tun?"

Ungefähr zu der Zeit, als er die Methode der Tupel entwickelte, träumte Woody zuerst davon, eine Maschine zu schaffen, die er "Computermann" nannte.

Jahre später erinnerte er sich an die „wilde Aufregung“, die er empfand, als er Fähigkeiten für künstliche Intelligenz formulierte:

„Ich wollte, dass er getippte Zeichen und handgeschriebenen Text liest. Ich konnte ihn oder einen Teil von ihm in einer kleinen Kamera sehen, die an meiner Brille befestigt war, mit einem Ohrhörer, durch den ich hörte, wie er die Namen meiner Freunde und Bekannten rief, als ich sie auf der Straße traf ... Sie sehen, mein Computerfreund konnte Gesichter erkennen. "

Forschung bei Panoramic Research Incorporated

1960 gründete Woody zusammen mit Iben Browning und einem anderen Sandia-Kollegen Panoramic Research Incorporated (Panoramic). Sie waren ursprünglich in einem kleinen Gebäude in Palo Alto untergebracht, das noch nicht als das Herz des Silicon Valley bekannt war. Zu dieser Zeit waren die meisten Computer - massive Geräte, auf denen Daten auf Lochkarten oder Magnetbändern gespeichert waren - in den Büros großer Unternehmen und staatlicher Labors untergebracht. Woodys Firma konnte es sich nicht leisten, einen Computer zu kaufen, deshalb mieteten die Wissenschaftler Computerzeit auf einem solchen Computer von ihren Nachbarn, oft spät in der Nacht, wenn es billiger war.

Panoramics Geschäft bestand darin, "Ideen zu testen, von denen wir hofften, dass sie die Welt auf den Kopf stellen".

Laut Nels Winkless, einem Schriftsteller und Berater, der an mehreren Panorama-Projekten beteiligt war und später das Personal Computing-Magazin mitbegründete, "bestand ihre Aufgabe darin, das zu tun, was andere Leute für zu dumm halten."

Die Erfindungen einiger Panoramaforscher sind weithin bekannt geworden. Zum Beispiel arbeitete Helen Chan Wolf, eine Pionierin in der Roboterprogrammierung, am Shakey the Robot. Laut dem Institut für Elektro- und Elektronikingenieure ist es "der weltweit erste Roboter, der künstliche Intelligenz verkörpert".

Panorama versuchte vergeblich, eine Finanzierung zu finden. Woody tat sein Bestes, um die Charaktererkennungstechnologie vorzustellen, einschließlich der Präsentation der Erfindung der Fair Life Insurance Society und McCalls Magazin. Der Vertrag wurde jedoch nie unterzeichnet.

Während seiner gesamten Existenz hatte Panoramic mindestens einen zuverlässigen Kunden, die Central Intelligence Agency.

Wenn es in Woody Bledsoes Papieren Hinweise auf die CIA gab, wurden sie höchstwahrscheinlich 1995 zerstört. Fragmente von überlebendem Material zeigen jedoch deutlich, dass Woodys Firma viele Jahre mit CIA-Frontfirmen zusammengearbeitet hat. Nels Winkless, der mit dem Panoramic-Team befreundet war, sagt, das Unternehmen sei höchstwahrscheinlich mit Mitteln der Agentur gegründet worden. "Niemand hat mir jemals direkt davon erzählt", erinnert sich Winkless, "aber es war."

Panoramic Research Incorporated war eine von 80 Organisationen, die an dem MK-Ultra-Projekt arbeiteten. Dies geht aus der Anfrage des FDA (Free Access to Information Act) des Black Vault hervor. Dies ist das berüchtigte CIA-Programm zur "Gedankenkontrolle", bei dem psychologische Folter ohne Zustimmung der Menschen angewendet wurde. Über die Dummy-Forschungsstiftung der Medical Sciences Research Foundation wurde Panoramic beauftragt, Teilprojekte durchzuführen, um Bakterien- und Pilztoxine zu untersuchen und "bestimmte Tierarten aus der Ferne zu kontrollieren".

David H. Price, Anthropologe an der Saint Martin University, glaubte, dass Woody und seine Kollegen auch Geld von der Gesellschaft für das Studium der menschlichen Ökologie erhielten. Im Namen dieser Gesellschaft gewährte die CIA Wissenschaftlern Zuschüsse, deren Arbeit die von der Agentur verwendeten Befragungsmethoden verbessern oder als Deckung für solche Forschungen dienen könnte.

Die wichtigsten Forschungsergebnisse von Panoramic wurden jedoch von einem anderen fiktiven Unternehmen geliefert, der King-Hurley Research Group (King-Hurley). Nach einer Reihe von Klagen, die in den 1970er Jahren eingereicht wurden, kaufte die CIA mit dieser Forschungsgruppe Flugzeuge und Hubschrauber für die geheime Luftwaffenbehörde Air America. Eine Zeitlang finanzierte King-Hurley auch die psychopharmakologische Forschung in Stanford.

Anfang 1963 akzeptierte King-Hurley alle Arten von Präsentationen von Ideen nur von Woody Bledsoe. Er schlug vor, "Untersuchungen durchzuführen, um die Machbarkeit der Schaffung einer vereinfachten Gesichtserkennungsmaschine zu bestimmen". Woody stützte sich auf seine Arbeit mit Browning an der Tupelmethode und wollte dem System beibringen, 10 Gesichter zu erkennen. Das heißt, er plante, eine Datenbank mit 10 Fotos verschiedener Personen zu verwenden und zu prüfen, ob die Maschine neue Fotos von jedem von ihnen identifizieren konnte. "Es wird bald möglich sein, die Zahl der Menschen auf Tausende zu erhöhen", schrieb Woody. Innerhalb eines Monats gab ihm King-Hurley die Erlaubnis, mit der Arbeit zu beginnen.

Erste Experimente auf dem Gebiet der Gesichtserkennung

Die Identifizierung von zehn Personen mag heute ein eher bescheidenes Ziel sein, aber 1963 war es unglaublich ehrgeizig. Der Sprung von der schriftlichen Zeichenerkennung zur Gesichtserkennung war gigantisch. Schon allein deshalb, weil es weder eine Standardmethode zum Digitalisieren von Fotos noch eine vorhandene digitale Bildbasis gab, auf die man sich verlassen konnte. Moderne Forscher können ihre Algorithmen auf Millionen öffentlich verfügbarer Selfies trainieren, und Panoramic müsste eine Datenbank von Grund auf neu erstellen.

Es gab auch ein ernsthafteres Problem: Die dreidimensionalen Gesichter von Menschen sind im Gegensatz zu zweidimensionalen Zeichen nicht statisch. Bilder derselben Person können sich in Kopfdrehung, Lichtintensität und -winkel sowie je nach Alter, Frisur und Stimmung unterscheiden - auf einem Foto kann eine Person sorglos erscheinen, auf einem anderen ängstlich.

In Analogie zur Suche nach einem gemeinsamen Nenner in einem äußerst komplexen Bruchteil musste das Team die Variabilität korrigieren und die zu vergleichenden Bilder ordnen.

Und es ist kaum mit Sicherheit zu sagen, dass ihre Computer diese Aufgabe bewältigen werden. Eine der Hauptmaschinen war die CDC 1604 mit 192 KB RAM - etwa 21.000 Mal weniger als ein typisches modernes Smartphone.

Von Anfang an war sich Woody dieser Komplexität voll bewusst, und so verfolgte er einen Teilungs- und Eroberungsansatz: Er zerlegte die Forschung in Stücke und wies sie verschiedenen Mitarbeitern zu.

Die Arbeiten zur Digitalisierung der Bilder fanden wie folgt statt. Der Forscher machte Schwarzweißfotos der Projektteilnehmer auf 16-mm-Film. Dann benutzte er das Scangerät, das Browning entwickelt hatte, um jedes Bild in Zehntausende von Datenpunkten umzuwandeln. Jeder Punkt musste einen Lichtintensitätswert im Bereich von 0 (dunkelste) bis 3 (hellste) haben - an einer bestimmten Stelle im Bild. Es gab zu viele Punkte, um vom Computer gleichzeitig verarbeitet zu werden. Daher schrieb der Forscher das NUBLOB-Programm, das das Bild in Zufallsstichproben aufteilte und für jeden einen eindeutigen Wert berechnete, wie er mit der Tupelmethode zugewiesen wurde.

Woody, Helen Chan Wolfe und ein anderer Forscher arbeiteten an der Kopfneigung. Zunächst zeichneten die Wissenschaftler eine Reihe nummerierter kleiner Kreuze auf der linken Seite des Gesichts des Probanden, von der Stirn bis zum Kinn. Dann machten sie zwei Porträts, von denen eines die Person freute und das andere - um 45 Grad gedreht. Nach der Analyse der Position der Kreuze in diesen beiden Bildern wurden die Daten auf ein Gesichtsbild mit einer Drehung von 15 oder 30 Grad extrapoliert. Ein Schwarzweißbild eines markierten Gesichts wurde in einen Computer geladen, und die Ausgabe war ein automatisch rotierendes Porträt - beängstigend, präzise und überraschend genau.

Die Lösungen der Forscher waren originell, aber nicht effektiv genug. Dreizehn Monate nach Arbeitsbeginn gab das Panorama-Team zu, dass es die Maschine nicht trainiert hatte, mindestens ein Gesicht zu erkennen, geschweige denn zehn.

Haarwuchs, Mimik und Zeichen des Alterns - diese dreifache Herausforderung stellte „eine kolossale Quelle der Variabilität“ dar, schrieb Woody in seinem Fortschrittsbericht vom März 1964 an King-Hurley. Die gestellte Aufgabe "geht über den aktuellen Stand der Mustererkennung und moderner Computertechnologien hinaus." Dabei empfahl Woody, mehr Forschung zu finanzieren, um einen "völlig neuen Ansatz" zur Lösung des Problems der Gesichtserkennung zu finden.

"Mensch-Maschine" -Ansatz zur Gesichtserkennung

Im Laufe des nächsten Jahres kam Woody zu dem Schluss, dass der vielversprechendste Ansatz zur automatisierten Gesichtserkennung darin besteht, den Bereich auf die Beziehungen zwischen den Hauptelementen zu beschränken: Augen, Ohren, Nase, Augenbrauen, Lippen.

Das von ihm vorgeschlagene System ähnelte dem des französischen Kriminologen Alphonse Bertillon, den er 1879 schuf. Bertillon beschrieb Menschen anhand von 11 körperlichen Messungen, einschließlich der Länge des linken Beins und der Länge vom Ellbogen bis zum Ende des mittleren Zehs. Die Idee war, dass jede Person einzigartig wäre, wenn genügend Messungen vorgenommen würden. Die Methode war zeitaufwändig, aber sie funktionierte: Mit ihrer Hilfe identifizierten französische Gendarmen 1897, lange bevor Fingerabdrücke weit verbreitet waren, den Serienmörder Joseph Vache.

Während des gesamten Jahres 1965 versuchte Panoramic, ein vollautomatisches Bertillon-Gesichtserkennungssystem zu entwickeln. Das Team versuchte, ein Programm zu entwickeln, mit dem Nasen, Lippen und mehr mithilfe heller und dunkler Bereiche auf einem Foto definiert werden können. Aber sie haben versagt.

Dann griffen Woody und Wolfe den sogenannten "Mensch-Maschine" -Ansatz zur Gesichtserkennung auf - eine Technik, die ein wenig menschlichen Input in die Gleichung einbezog.

Woody zog seinen Sohn Gregory und seinen Freund für das Projekt an - sie erhielten 122 Fotos, auf denen etwa 50 Personen zu sehen waren. Die Jungs nahmen 22 Messungen an jedem Gesicht vor, einschließlich der Länge des Ohrs und der Breite des Mundes. Wolfe schrieb dann ein Programm, um die Daten zu verarbeiten.

. , : , .

Ihr nächster Schritt, Ende 1965, bestand darin, eine größere Version desselben Experiments zu erstellen, um "Mensch" in ihrem Mensch-Maschine-System effizienter zu machen. Mit King-Hurleys Geld kauften sie das RAND-Tablet, ein 18.000-Dollar-Gerät, das wie ein Flachbett-Bildscanner aussah, aber wie ein iPad funktionierte. Mit einem Stift zeichnete der Forscher auf ein Tablet und erhielt am Ausgang ein Computerbild mit relativ hoher Auflösung.

Über das RAND-Tablet wurde eine neue Serie von Fotos aufgenommen, wobei die wichtigsten Elemente des Gesichts mit dem Stift hervorgehoben wurden. Dieser Vorgang war zwar komplex, aber viel schneller als zuvor: Es wurden Daten für etwa 2.000 Bilder eingegeben, darunter mindestens zwei Bilder von jedem Gesicht. Pro Stunde wurden ca. 40 Bilder verarbeitet.

Trotz dieser größeren Stichprobe bemühte sich Woodys Team, die üblichen Hürden zu überwinden.

Das Problem mit dem Lächeln, das „das Gesicht verzerrt und die Grenzflächendimensionen radikal verändert“, sowie dem Altern ist noch nicht gelöst.

Beim Versuch, Woodys Foto von 1945 mit dem Foto von 1965 abzugleichen, wurde das System verwirrt. Sie sah keine große Ähnlichkeit zwischen einem jungen Mann mit einem breiten Lächeln und dichtem dunklem Haar und einem älteren Mann mit einem düsteren Ausdruck und schütterem Haar.

Foto von Woody Bledsoe aus einer Studie von 1965. Fotograf: Dan Winters

Es war, als hätten Jahrzehnte eine andere Person geschaffen - und in gewissem Sinne auch. Zu diesem Zeitpunkt hatte Woody es satt, nach neuen Verträgen für Panoramic zu suchen, und befand sich "in der lächerlichen Lage, entweder zu viel oder zu wenig zu arbeiten". Er präsentierte seinen Sponsoren ständig neue Ideen, von denen einige heute als ethisch fragwürdig gelten.

Im März 1965 - 50 Jahre bevor China begann, ethnische Uiguren in der Provinz Xinjiang mithilfe von Gesichtsabstimmung zu identifizieren - lud Woody die Advanced Research Projects Agency (ARPA) des US-Verteidigungsministeriums ein, Panoramic bei der Untersuchung der Verwendung von Merkmalen zu unterstützen. Personen, um die rassische Herkunft einer Person zu bestimmen. "Es gibt eine sehr große Anzahl anthropologischer Dimensionen von Menschen aus der ganzen Welt, die verschiedenen rassischen und ökologischen Gruppen angehören", schrieb Woody. "Es ist ein riesiges und wertvolles Data Warehouse, das mit großen Schwierigkeiten und Kosten gesammelt, aber nicht richtig verwendet wurde." Ob ARPA sich bereit erklärte, dieses Projekt zu finanzieren, ist unbekannt.

Woody investierte Tausende von Dollar aus eigenen Mitteln in Panoramic, ohne die Garantie für ihre Rückkehr zu haben. In der Zwischenzeit überredeten ihn seine Freunde von der University of Texas in Austin, einen Job an der Universität zu bekommen, und lockten ihn mit einem stabilen Gehalt an. Und im Januar 1966 verließ Woody Panoramic. Das Unternehmen schloss kurz danach.

Mit dem Traum, einen Computermann zu schaffen, zog Woody mit seiner Familie nach Austin, um sich dem Studium und der Lehre des automatisierten Denkens zu widmen. Aber seine Arbeit an der Gesichtserkennungstechnologie endete nicht dort.

Woody Bledsoes erfolgreichstes Gesichtserkennungsexperiment

Im Jahr 1967 übernahm Woody eine letzte Aufgabe im Zusammenhang mit der Erkennung von Gesichtsmustern. Ziel des Experiments war es, Strafverfolgungsbehörden dabei zu unterstützen, die Datenbanken festgenommener Personen auf der Suche nach Übereinstimmungen schnell zu durchsuchen.

Nach wie vor scheint die Finanzierung des Projekts von der US-Regierung gekommen zu sein. In einem Dokument von 1967, das 2005 von der CIA freigegeben wurde, wird ein "externer Vertrag" für ein Gesichtserkennungssystem erwähnt, das die Suchzeiten um das Hundertfache verkürzen würde.

Woodys Hauptprojektpartner war Peter Hart, ein Forschungsingenieur im Labor für Angewandte Physik am Stanford Research Institute. (Jetzt bekannt als SRI International. Das Institut trennte sich 1970 von der Stanford University aufgrund von Unterschieden auf dem Campus aufgrund der starken Abhängigkeit des Instituts von militärischen Mitteln.)

Woody und Hart begannen mit einer Datenbank mit etwa 800 Bildern - jeweils zwei von "400 kaukasischen erwachsenen Männern". Die Fotografierten unterschieden sich in Alter und Kopfdrehung. Mit einem RAND-Tablet zeichneten die Wissenschaftler 46 Koordinaten für jedes Foto auf, darunter fünf Werte für jedes Ohr, sieben für die Nase und vier für jede Augenbraue. Aufbauend auf Woodys früheren Erfahrungen mit der Normalisierung von Bildvariationen wurde eine mathematische Gleichung verwendet, um die Köpfe in der Frontalansicht zu "drehen". Um den Unterschied im Maßstab zu berücksichtigen, wurde jedes Bild auf eine Standardgröße vergrößert oder verkleinert, wobei die Referenzmetrik der Abstand zwischen den Pupillen war.

Die Aufgabe des Systems bestand darin, sich eine Version jeder Person zu merken und damit die andere zu identifizieren.

Woody und Hart boten dem Auto eine von zwei Abkürzungen an. In der ersten, als Gruppenübereinstimmung bekannten Methode teilte das System das Gesicht in Merkmale ein - linke Augenbraue, rechtes Ohr usw. - und verglich die relativen Abstände zwischen ihnen.

Fotograf: Dan Winters Der

zweite Ansatz basierte auf der Bayes'schen Entscheidungstheorie, bei der die Maschine 22 Dimensionen verwendete, um eine allgemein fundierte Vermutung anzustellen.

Infolgedessen haben beide Programme die Aufgabe ungefähr gleich gut gemeistert. Und erwies sich auch als besser als menschliche Rivalen. Als Woody und Hart drei Personen aufforderten, Untergruppen von 100 Personen zuzuordnen, dauerte selbst die schnellste sechs Stunden. Der CDC 3800 erledigte eine ähnliche Aufgabe in etwa drei Minuten und erzielte eine 100-fache Zeitverkürzung. Menschen waren besser im Umgang mit Kopfdrehungen und schlechter Fotoqualität, aber der Computer war bei der Bestimmung altersbedingter Veränderungen "weit überlegen".

Die Forscher kamen zu dem Schluss, dass die Maschine die Person "dominiert" oder "fast dominiert". Dies war Woodys größter Erfolg bei seinen Forschungen zur Gesichtserkennung.

Es war auch seine letzte Arbeit zu diesem Thema, die nie "im Interesse des Staates" veröffentlicht wurde, was Woody und Hart sehr bedauerten.

1970, zwei Jahre nach dem Ende seiner Zusammenarbeit mit Hart, erklärte ein Robotertechniker namens Michael Kassler gegenüber Woody, Leon Harmon von Bell Labs plane eine Studie zur Gesichtserkennung. "Ich bin empört darüber, dass diese zweite Art von Studie veröffentlicht wird und am Ende das beste Mensch-Maschine-System sein wird", antwortete Woody. Jahr. “Woody muss enttäuscht gewesen sein, als Harmons Forschung einige Jahre später auf das Cover von Scientific American kam - während seine eigenen fortgeschritteneren Arbeiten in Lagerräumen aufbewahrt wurden.

Verwendung der Woody Bledsoe-Methode in der modernen Gesichtserkennungstechnologie

In den folgenden Jahrzehnten gewann Woody Auszeichnungen für seine Beiträge zum automatisierten Denken. Ein Jahr lang war er Präsident der Vereinigung zur Entwicklung der künstlichen Intelligenz. Aber seine Arbeit zur Gesichtserkennung blieb weitgehend unerkannt und fast vergessen, während andere Lorbeeren sammelten.

1973 machte der japanische Informatiker Takeo Kanade einen großen Sprung in der Gesichtserkennungstechnologie.

Basierend auf einer Datenbank mit 850 digitalisierten Fotografien von der Weltausstellung in Sweet (Japan) im Jahr 1970 entwickelte Kanada ein Programm, mit dem Gesichtszüge - Nase, Mund und Augen - ohne menschliches Eingreifen extrahiert werden können. Kanada ist es gelungen, Woodys Traum zu erfüllen, den Menschen vom Mensch-Maschine-System auszuschließen.

Woody hat sein Wissen über Gesichtserkennung im Laufe der Jahre einige Male genutzt.

1982 wurde er als Experte in einem Strafverfahren in Kalifornien hinzugezogen. Einem mutmaßlichen Mitglied der mexikanischen Mafia wurde vorgeworfen, eine Reihe von Raubüberfällen im Contra Costa County begangen zu haben. Der Staatsanwalt verfügte über mehrere Beweisstücke, darunter Videoüberwachungsaufnahmen eines langhaarigen Mannes mit Bart, Sonnenbrille und Wintermütze. Aber auf den Fotos schien der Angeklagte ein glatt rasierter Mann mit kurzen Haaren zu sein. Woody maß das Gesicht des Räubers, verglich es mit Fotos des Angeklagten und stellte fest, dass die Gesichter aufgrund der unterschiedlichen Nasenbreite zwei verschiedenen Personen gehörten. Trotz der Tatsache, dass der Mann immer noch ins Gefängnis ging, wurde er in vier Punkten freigesprochen, in denen Woody Zeuge war.

„In den letzten 10 Jahren hat die Gesichtserkennungstechnologie gelernt, mit Unvollkommenheiten umzugehen“, sagt Anil K. Jain, Software-Wissenschaftler an der Michigan State University und Mitherausgeber des Handbuchs zur Gesichtserkennung.

Fast alle Probleme, mit denen Woody konfrontiert war, sind verschwunden. Heute gibt es ein unerschöpfliches Angebot an digitalisierten Bildern. "Über soziale Medien können Sie so viele Gesichtsaufnahmen machen, wie Sie möchten", sagt Jane. Dank der Fortschritte beim maschinellen Lernen, beim Speicher und bei der Verarbeitungsleistung lernen Computer, effektiv zu lernen. Mit ein paar einfachen Regeln können sie große Datenmengen analysieren und Vorlagen für fast alles erstellen, vom menschlichen Gesicht bis zum Beutel mit Chips - es sind keine weiteren Messungen mit einem RAND-Tablet oder der Bertillon-Methode erforderlich.

Selbst wenn man bedenkt, wie weit die Gesichtserkennung seit Mitte der 1960er Jahre fortgeschritten ist, hat Woody Bledsoe viele der Herausforderungen identifiziert, die in diesem Bereich noch zu bewältigen sind.

, - . , , , .

Obwohl der Programmierer moderne Deep-Learning-Systeme nicht explizit anweist, Nasen und Augenbrauen zu identifizieren, gab Woodys Wendung in diese Richtung im Jahr 1965 die Richtung der Branche für Jahrzehnte vor. "In den ersten 40 Jahren dominierte die Merkmalsextraktion", sagt Takeo Kanade, jetzt Professor am Carnegie Mellon Institute of Robotics.

Bis zu einem gewissen Grad sind sie heute zu dem zurückgekehrt, was Woodys ersten Versuchen ähnelt, ein menschliches Gesicht zu "figurieren", als er eine Variation der Tupelmethode verwendete, um Muster ähnlicher Merkmale in einem riesigen Feld von Datenpunkten zu finden. So komplex moderne Gesichtserkennungssysteme auch sind, Anil Jane sagt, sie vergleichen einfach Bildpaare und weisen ihnen eine Ähnlichkeitsbewertung zu.

Aber vielleicht am wichtigsten ist, dass Woody Bledsoes Arbeit den ethischen Ton für die Gesichtserkennungsforschung festgelegt hat - sowohl relevant als auch problematisch. Im Gegensatz zu anderen weltverändernden Technologien, deren katastrophale Fähigkeiten im Laufe der Jahre offensichtlich wurden - Social Media, YouTube, Drohnen - war der potenzielle Missbrauch der Gesichtserkennungstechnologie fast von dem Moment an offensichtlich, als sie bei Panoramic geboren wurde.

Viele Vorurteile, die auf die Überreste der Zeit von Woodys Forschung zurückzuführen sind - die Anziehungskraft fast nur weißer Menschen auf Experimente, das scheinbar nachlässige Vertrauen in die Regierung, der Wunsch, Gesichtserkennung zur Diskriminierung aus rassistischen Gründen einzusetzen - all dies ist dem modernen Bereich der Gesichtserkennung eigen.

Beim Testen der Rekognition-Software von Amazon im Jahr 2019 wurden 28 NFL-Spieler fälschlicherweise als Kriminelle identifiziert. Einige Tage später reichte die American Civil Liberties Union beim US-Justizministerium, dem FBI und der Drug Enforcement Administration eine Klage ein, um Informationen über den Einsatz von Gesichtserkennungstechnologien von Amazon, Microsoft und anderen Unternehmen zu erhalten. In einem Bericht des Nationalen Instituts für Standards und Technologie aus dem Jahr 2019, in dem der Code von mehr als 50 Entwicklern von Gesichtserkennungssoftware getestet wurde, heißt es, dass weiße Männer weniger wahrscheinlich als Kriminelle bezeichnet werden als andere Gruppen. Im Jahr 2018 äußerten sich einige Wissenschaftler scharf: "Wir glauben, dass die Gesichtserkennungstechnologie der gefährlichste Überwachungsmechanismus ist, der jemals erfunden wurde."

Im Frühjahr 1993 verschlechterte sich Woodys Sprache aufgrund einer degenerativen ALS-Erkrankung. Aber er unterrichtete weiter an der Universität von Texas, bis seine Rede unleserlich wurde. Er setzte seine Forschungen auf dem Gebiet des automatisierten Denkens fort - bis er aufhörte, den Stift zu halten. Bis zum Ende machte sich Woody als Wissenschaftler Notizen über seine Rede, um die Entwicklung der Krankheit zu verfolgen.

Woody Bledsoe starb am 4. Oktober 1995. Der Nachruf erwähnte seine Arbeit in der Gesichtserkennung nicht. Auf dem Nachruffoto starrt der grauhaarige Woody mit einem breiten Lächeln direkt in die Kamera.

Kommentar von Elena Gerasimova, Leiterin Analytics and Data Science bei Netology

Woody Bledsoes Ideen waren kommerziell nicht erfolgreich, vielleicht weil ihre Zeit auf einen der "Winter der künstlichen Intelligenz" fiel. Es gab wenig Vertrauen in die Technologien, es gab nicht genügend Kapazitäten, um beeindruckende Ergebnisse zu demonstrieren, und die Technologien zur Rekonstruktion des menschlichen Gehirns wurden hauptsächlich von Enthusiasten eingesetzt - dem Akademiker Andrei Nikolaevich Kolmogorov, dem amerikanischen Mathematiker George Tsibenko und anderen.

Dank dieser Forschung sind jedoch moderne Durchbrüche möglich geworden, die auf leistungsfähiger Rechenleistung, Wolken und Mikrochips basieren.

Im Jahr 1998 perfektionierte Yang LeCun Ansätze zur Erkennung handgeschriebener Zahlen in seinem LeNet - dank der Entwicklung der Rechenleistung, die während der Forschung von Woody Bledsoe nicht verfügbar war.

Die Gesichtserkennungstechnologie grenzt an eine fortschrittlichere Gesichtserzeugungstechnologie, die beispielsweise zum Erstellen von Deepfakes und zum Generieren von Gesichtern von Erwachsenen und Kindern sowie von Katzen und Hunden verwendet wird. Es scheint einfacher zu sein, ein Foto einer Person aufzunehmen und es unter bestimmten Bedingungen in einen elektronischen Kleiderkatalog hochzuladen. oder ein süßes Video mit einem Baby und Spielzeug drehen; oder einem neuronalen Netzwerk beibringen, ein Bild eines Kindes in Kleidung, Innenausstattung oder mit einem Spielzeug zu erstellen, das wir in den Katalog aufnehmen und damit demonstrieren möchten? Die Antwort wird sich aus den Investitionen in Unternehmen ergeben, die Technologien zur Erstellung fotorealistischer Bilder entwickeln. Allein in den USA belief sich die Gesamtinvestition im Jahr 2019 auf mehr als 500 Millionen US-Dollar.

Erzeugung fotorealistischer Bilder von Menschen

Wenn Sie an der Arbeit mit Daten und neuronalen Netzen interessiert sind, bieten wir Ihnen an, sich mit unseren Programmen vertraut zu machen, deren Ausbildung auf wissenschaftlichen Grundlagen und Forschungsergebnissen basiert:

Beruf " Data Scientist ". Auszeichnung " Quality Mark " in der Nominierung "Training of Digital Industry Professionals" (2019).
Deep Learning Kurs . Auf der Zielseite des Kurses können Sie Beispiele für Projekte innerhalb des Kurses sehen und sehen, wie das Training verläuft.

Und für diejenigen, die nach Ansätzen zur Implementierung von künstlicher Intelligenz, maschinellem Lernen und "digitalem Neustart" suchen, empfehlen wir die Informationen zum Kurs " Business Transformation: Einführung künstlicher Intelligenz ". Die Studierenden entwickeln eine Strategie zur Implementierung künstlicher Intelligenz und erarbeiten unter Anleitung ausländischer und russischer Experten reale Business Cases.

Gesichtserkennungstechnologie: eine geheime Geschichte

: