Les poissons de l'intelligence artificielle
L'intelligence artificielle est un thème qui fait le buzz.
A juste titre, en raison des démonstrations spectaculaires dans lesquelles l'homme a été vaincu par la machine.
Depuis, on trouve de l'IA partout : dans les logiciels de comptabilité, dans nos outils de gestion de la relation client, … . Il n'y a plus un outil SaaS sur le marché dont la page commerciale ne vante les performances grâce aux algorithmes d'IA.
Ce qui est très intéressant dans l'IA, c'est que l'on ne programme pas directement la machine par un jeux d'instructions. On ne code pas de la façon habituelle :
si l'utilisateur clique sur le bouton "commander" alors ajouter l'article au panier d'achats.
Au lieu de cela, on apprend à la machine. On l'entraine à classer/répondre/jouer à partir d'un jeu de données.
Des chercheurs de l'université Eberhard Karl de Tübingen (Allemagne) ont travaillé sur la reconnaissance d'images. C'est un domaine classique dans l'IA qui consiste à entraîner un modèle pour identifier le contenu (objet, animal, personne) d'une image.
Les chercheurs ont instrumenté le modèle afin de connaître les éléments graphiques qui pèsent le plus lourd dans la reconnaissance de certains animaux.
Et devinez ce qui compte le plus pour reconnaître une tanche (oui le poisson) ?
Ceci :
Des doigts...
🤔 Quel rapport avec le poisson ?
Et bien en regardant les images qui ont servi à entrainer le modèle d'IA à reconnaître le poisson, on comprend vite ce qu'il s'est passé :
Dans les photos utilisées pour mettre au point la reconnaissance d'images, la plupart de celles qui contiennent ce poisson représentent des pêcheurs qui le tiennent dans leur main !
Du coup, pour le modèle d'intelligence artificielle du 21è siècle, entraîné sur les serveurs les plus puissants jamais construits jusqu'à maintenant, une tanche est un poisson avec des doigts humains. C'est ainsi qu'on la reconnait...
Cet exemple illustre deux points intéressants :
- Il faut se méfier du côté un peu "magique" de certains algorithmes d'IA. Mieux vaut bien comprendre comment ils fonctionnent dans le détail. Ils sont en général assez difficiles à débugger, compte tenu du volume de données qu'ils manipulent.
- Ce qui fait "l'intelligence" des modèles, ce sont les données qui ont servi à les mettre au point. En pratique, 80% du temps d'un data-scientist qui conçoit des modèles d'IA est consacré à la constitution des jeux de données.
On comprend pourquoi les données sont devenues les pépites que tout le monde cherche. Et particulier les données qui expriment le comportement humain. Parce que l'IA fonctionne uniquement par l'exploitation d'un grand volume de données.
Certaines entreprises comme Google ont compris cet enjeu. Elles proposent leurs services "gratuitement" en échange de vos données, car c'est ce qui leur permet de vendre des fonctionnalités innovantes.
Mais dans votre entreprise aussi vous avez des données. Parfois d'énormes volumes. Et qu'en faîtes-vous ?
J'observe plusieurs niveaux de maturité sur l"utilisation des données dans les entreprises :
- Niveau 1 : l'inventaire est fait. On sait ce dont on dispose, en raison des obligations légales (RGPD, exigences fiscales, ...) ou parce qu'il faut les archiver.
- Niveau 2 : il existe un outil pour les centraliser et les recouper. Par exemple, à partir d'un numéro d'affaire, on retrouve l'origine de la prise de contact, le devis, les plans, les compte-rendus de chantier, la facture, le nb d'heures travaillées,... Les données ne sont plus éparpillées dans plusieurs bases.
- Niveau 3 : on analyse ses données. Il est possible de construire des tableaux de bord à partir des données entreposées. Ils donnent des indications sur le fonctionnement global de l'entreprise. Il est aussi faisable d'étudier les données pour répondre à des questions précises et transverses. Ex : quelle marque de produits a généré le meilleur taux de conversion (nb de ventes rapportées au nb de visites physiques ou numériques) sur le dernier trimestre ?
- Niveau 4 : on enrichit ses données à l'aide de celles des autres. Par exemple, en ajoutant les données météo à ses ventes pour quantifier leur caractère saisonnier. Ou les prix pratiqués par les concurrents d'une même zone de chalandise.
- Niveau 5 : on prédit. L'IA commence ici. Les données seront exploitées pour automatiser certaines tâches. Exemple : le classement automatique de documents, la constitution de campagnes de communication sur son site, ... .
En y allant progressivement, avec une feuille de route réfléchie, vous apprivoiserez vos données pour en tirer le maximum de valeur. Elles deviendront claires, leurs potentiels et leurs biais seront identifiés.
En y allant progressivement sans brûler les étapes, ça évite de croire que les tanches ont des doigts humains.
Bonne semaine !
— Hervé
PS : pour en savoir plus sur les bizarreries de l’IA, voici le lien vers l’article relatant l’histoire de la tanche.