Atténuer l’incertitude : comment détecter et maitriser les "unknowns unknowns"

Image générée par Midjourney à partir du prompt : « /imagine an illustration of something we don’t know that we don’t know »

Dans toute situation, il y a les inconnues qui peuvent être repérées, et il y a celles que l’on ne soupçonne même pas. Ce sont les « unknown unknowns », potentiellement très nombreuses avec l’IA. Pour mieux cerner les risques et maîtriser l’IA, le professeur Bernard Sinclair-Desgagné a mis au point une méthode capable de les appréhender.

Par Kevin Erkeletyan

Prenez une carte du monde dessinée par des géographes européens du 17e siècle. Sur cette carte, la forme et la taille de l’Europe de l’Ouest correspondront assez bien à la réalité. Grâce à de nombreux récits vérifiables, les cartographes européens savaient qu’ils connaissaient le paysage du continent, il était « known to be known ». À l’inverse, les représentations de l’Inde, de la Sibérie, de la Chine, du Japon, de la Californie et du Mexique sont plus incertaines. Étant donné la nouveauté et la relative rareté des données fiables, les hommes de l’époque ne pouvaient faire que des conjectures éclairées, combinant souvent plusieurs paysages envisageables. Ce qui restait inconnu de ces régions pouvait malgré tout être décrit ; « les inconnues étaient connues ». Quelques régions, enfin, étaient laissées blanches : l’Arctique, le Nord-Ouest de l’Amérique et l’Antarctique. Les scientifiques européens ne se risquaient pas à esquisser ces zones. Ces régions appartenaient au royaume des « inconnues inconnues », les « unknown unknowns ».

Les « unknown unknowns » désignent des éléments dont nous ne soupçonnons même pas l’existence. Divers récits issus de toutes les sphères de l’activité humaine – tels que la science et la technologie, les arts, la stratégie d’entreprise et la politique publique – révèlent que des gains ou des pertes considérables auraient pu être obtenus ou évités si les « unknown unknowns » avaient été anticipés à temps. Pourtant, il reste difficile d’appréhender ces éléments. L’analyse de risque conventionnelle aide peu car elle se concentre sur les « inconnues connues » (les « known unknowns »), des situations dans lesquelles tous les résultats potentiels (même les « black swans », les événements imprévus) peuvent au moins être repérés.

PENSER « OUT OF THE BOX »…

Dans une publication récente, je propose une méthode pour appréhender les « unknown unknowns ». Cette approche repose sur l’analyse formelle des concepts (AFC), une branche de la théorie mathématique de l’ordre de plus en plus utilisée dans le Data mining. Elle semble largement applicable, car elle permet d’intégrer divers types de données – quantitatives et qualitatives, objectives et subjectives, financières et non financières. Sa mise en œuvre est enfin facile d’accès, car elle se résume à utiliser des tableaux et des feuilles de calcul.

Je pars du principe que, si la description de tout ce qui pourrait survenir correspond à une structure semblable à celle utilisée pour communiquer les connaissances actuelles, alors des indices tangibles sur les « unknown unknowns » devraient se trouver dans les données disponibles. Ces indices peuvent être dévoilés en réfléchissant « out of the box, hors des sentiers battus », puis en revenant « in the box, dans le cadre habituel » de manière méthodique.

Dans l’AFC, un « contexte », dans sa forme la plus simple mais la plus répandue, désigne un ensemble d’objets, un ensemble d’attributs, et une relation indiquant quels objets possèdent quels attributs. La principale manière d’organiser les données consiste ensuite à utiliser des « concepts ». Un concept consiste en une liste O d’objets et une liste A d’attributs, de sorte que les objets de O sont précisément ceux qui partagent tous les attributs de A, et les attributs de A sont précisément ceux partagés par tous les objets de O.

Supposons que les connaissances actuelles puissent être représentées comme un contexte ; appelons-le le contexte existant. À terme, et à mesure que les inconnues connues et les inconnues inconnues seront révélées, ce contexte s’étendra en un contexte plus grand ; appelons-le le contexte final.

Afin de repérer les indices que les données actuelles pourraient révéler concernant les « unknown unknowns », il nous faut introduire la notion de préconcept. Dans un contexte donné, un préconcept est un concept partiellement défini, c’est-à-dire que sa liste d’objets peut comporter davantage d’attributs que ceux actuellement indiqués ou que sa liste d’attributs peut correspondre à des objets supplémentaires.

…PUIS « INSIDE THE BOX »

Maintenant, à partir du contexte final, éliminez toutes les relations déjà spécifiées dans le contexte existant. Il en résulte un troisième contexte qui comprend uniquement les relations actuellement inconnues impliquant des objets existants ou que nous ne savons pas que nous ne connaissons pas, ainsi que des attributs existants ou que nous ne savons pas que nous ne connaissons pas ; appelons cela le contexte de découverte. On peut d’abord affirmer qu’aucun préconcept du contexte existant ne peut être un préconcept du contexte de découverte. Cela nous incite à regarder au-delà du contexte existant, autrement dit à sortir du cadre habituel.

Comment s’y prendre ? Considérons le contexte complémentaire existant (CCE), c’est-à-dire le contexte dans lequel toutes les relations connues entre les objets existants et les attributs sont inversées : un attribut est lié à un objet dans le CCE uniquement s’il ne l’est pas dans le contexte existant. Le CCE désigne précisément la zone hors des cadres habituels à laquelle nous devons nous intéresser. Une proposition fondamentale est que, si le contexte de découverte contient des préconcepts constitués d’objets et d’attributs existants, alors ces préconcepts doivent également être des préconcepts du CCE. Par conséquent, une première approche pour rechercher des indices sur les concepts que nous ne savons pas que nous ne connaissons pas du contexte de découverte consiste à examiner méthodiquement les préconcepts du CCE.

Une fois cette recherche terminée, de sorte qu’il n’y ait plus de relations (que nous savions que nous ne connaissions pas) à découvrir entre les objets et attributs existants parmi les préconcepts du CCE, nous devrions penser à nouveau « inside the box ». Ce cadre habituel devient alors le contexte initial existant, actualisé en y ajoutant toutes les nouvelles relations trouvées entre les objets et attributs existants. Un autre résultat important est que les projections des concepts que nous ne savons pas que nous ne connaissons pas du contexte final dans le contexte existant mis à jour doivent être des préconcepts dans celui-ci. Ainsi, des indices supplémentaires sur le contexte final pourraient maintenant être obtenus en examinant les préconcepts du contexte existant mis à jour.

Ce processus ne nous révélera pas quels objets, attributs ou relations « unknown unkwnowns » se manifesteront. L’important est que, quelle que soit l’issue finale, la structure du contexte commun offre des pistes pour atténuer l’incertitude en explorant de manière systématique les données disponibles.