Mon travail avec l’IA (Chat-GPT puis Groke) m’a amené à réfléchir à ce partenaire commode et érudit. J’ai pris avec elle – elle, IA est féminin - l’habitude de dégrossir le travail soumis de façon à préciser ce que j’en attends. Il en résulte une collaboration et un dialogue qui finit par me donner l’impression d’avoir un humain face à moi, humain à qui je fais subir le test de Turing. Mais, s’agissant d’IA générative textuelle, voyez bien ce que nous avons ici : une énorme boîte noire nourrie d’une quantité astronomique de données textuelles – peut-être des centaines de milliers de fois ce qu’avale un humain érudit au cours de sa vie -, voire plus que sais-je, un logiciel élaboré dont j’ignore le nombre de lignes de code – mais c’est encore du texte -, puis moi qui fournis une requête textuelle et qui récupère encore du texte, voire du code. On pourrait ajouter une interface vocale, voix vers texte à l’entrée, synthèse en sortie, mais ça ne change rien sur le fond. Il n’est donc ici qu’affaire de texte réduit in fine en ASCII, voire en octets puis en bits. Ainsi Grok n’invente rien mais construit avec ce qu’on lui a donné. En fait, Grok ne sait rien : Grok construit une réponse avec sa pyramide de données uniquement lorsqu’on le lui demande.
Passons à l’image. Nous avons appris à décoder les images depuis notre naissance. Pas de surprise que nous soyons capables de les analyser dans l’instant. Une telle analyse est très laborieuse pour une IA générative orientée texte car cette image se présente comme un fichier numérique dont un triplet d’octets représente au mieux un pixel coloré (cas du bitmap), voire un élément structurellement plus compliqué à cause de la compression dans les autre cas. En extraire formes et couleurs pour en retrouver tous les éléments picturaux semble une tache réellement difficile pour ces IA sans ajout conjoint d’un texte descriptif ou d’un prompt. Les IA génératives dédiées comme Midjourney y arrivent cependant presque, mais c’est tout ce qu’elles savent faire. De la même façon, les IA de surveillance placées derrière des écrans vidéo (ou plutôt à leur place) parviennent à analyser des scènes complexes, mais c’est également tout ce qu’elles savent faire. L’humain sait, lui presque tout faire de façon plus ou moins imparfaite.
Je termine par les sujets ne donnant pas lieu à la formation de textes suffisamment précis pour les partager pleinement. Cela concerne tous les sujets subjectifs depuis le goût d’une bonne pièce de viande jusqu’à l’amour fou ou l’expérience spirituelle (Samadhi, EMI ou OBE). Le texte n’en donnera jamais qu’un pâle reflet. La vie humaine ne peut être vécue que de l’intérieur. De ce point de vue, le cerveau d’un animal domestique possède des propriétés supérieures à celles de l’IA. l’IA est un miroir brillant du savoir humain, mais sans intériorité, sans vie propre. Le fossé n’est pas technique, mais existentiel.
Aucun commentaire:
Enregistrer un commentaire
Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.