Reconnaissance Faciale

Tout le monde se souvient de la mésaventure liée au logiciel de reconnaissance faciale de google :

Ce dérapage aurait pu être évité très simplement. Il suffit de regarder la photo en question. La machine ne sait pas reconnaître des êtres humains! Cherchez l’erreur… Des gorilles portent-ils des vêtements par exemple ? Non. Ce constat souligne la faiblesse de l’algorithme qui ne prend pas en compte une information majeure liée au contexte. Et montre nos carences dans l’analyse et la construction algorithmique qui en résulte. Quelles sont-elles ?

Première carence, l’identification. Faut-il utiliser un nombre important de données élémentaires pour identifier un visage humain ? Non. Mais il faut utiliser des informations pertinentes. Une petite démonstration ci-dessous.

Extrait de Stargate

Cette courte vidéo montre six plans de référence pour identifier une destination. Ces six plans constituent chacun une donnée indispensable à l’identification du lieu. Ils sont représentatifs de ce qui est décrit comme « champs conceptuels » dans mon bouquin (cf chapitre 1, page 20). De là à dire que six caractéristiques pertinentes suffisent à identifier une inconnue de façon certaine, il n’y a qu’un pas que je franchirais volontiers… La justesse de l’identification ne repose pas sur le nombre de caractéristiques utilisées mais sur la pertinence  de celles-ci. Cette identification correspond à une analyse au moyen des champs conceptuels. C’est  le « x » de x+y=z

Deuxième carence,  l’absence de confrontation/ comparaison/vérification avec ce que l’on sait déjà. Ce qui est stocké dans nos mémoires, nos bases de données, c’est ce que l’on sait déjà. Dans le cas de données inconnues ou ignorées, nous allons a la recherche de compléments d’informations endogènes ou exogènes. C’est la fonction clef de notre fonctionnement cérébral, décrite comme un processus d’arbitrage au chapitre 10, page 119. Cet arbitrage  nous permet l’adaptation avec le monde extérieur ; il nous permet de nous contenter de ce que l’on sait déjà, ou au contraire,  nous propulse vers ce que nous ignorons. C’est cette fonction qui constitue l’intelligence. C’est elle qui façonne notre pensée, qui nous fait évoluer, infirmer ou confirmer nos certitudes. C’est elle qui nous permet la construction de la représentation. C’est  aussi la dimension qui manque à l’intelligence dite artificielle en général, le « y » de notre modèle x+y=z.

Troisième carence, la représentation, ou plutôt la restitution d’une image projetée, sa reconstruction. Elle est l’aptitude à l’expression, correspond à la faculté d’exprimer un résultat. C’est le « z » de notre modèle x+y=z, et sans doute l’élément qui sera le plus compliqué à mettre en œuvre dans le cadre d’une intelligence artificielle véritable : Une machine capable d’expression. Le résultat est le « z » de notre modèle, tel que décrit au chapitre 8, page 97 et suivantes. Parce qu’il faut être réaliste : la machine n’identifiera que ce pour quoi elle est programmée. Bêtement. Automatiquement. Elle ne créera pas de représentation personnelle. Elle exprimera logiquement, rationnellement les erreurs de ses concepteurs, telles que celle-ci.