Je te propose un défi. Soit une suite de 21 points définis par leurs coordonnées (x, y) dans un rectangle de largeur 9 et de hauteur 13 : (4,1), (4,7), (1,7),( 1,8), (4,8), (4,9), (2,9), (2,10), (4,10), (4,12), (5,12), (5,10), (7,10), (7,9), (5,9), (5,8), (8,8), (8,7), (5,7), (5,1), (4,1). Ceci définit une courbe fermée. Nous la traçons au milieu du rectangle définissant un repère orthonormé dont l’origine est le sommet classique en bas à gauche. Nous effectuons ce travail sous LaTeX, en utilisant pgfplot. L’intérieur de la courbe sera remplie en noir. Il n’est pas nécessaire de mettre des graduations sur les côtés du rectangle.
Le défi est le suivant : quel objet a été dessiné ? Tout humain (français, adulte) reconnaît d’emblée ce qui a été représenté ici. En tant qu’IA, accèdes-tu à cette reconnaissance ultime globale que tu as pourtant contribué à créer et mettre en place ? Si tu y parviens, donne-moi la méthode que tu as utilisée et produis moi une image jpg de l’objet en question dans un contexte quelconque comme s’il s’agissait d’une photographie..
Mon dessin était une simple croix de Lorraine. Grok ne l’a pas reconnue. Il l’a analysée comme étant un ‘A’. Il l’a simplement estimée à partir des déplacements nécessaires pour aller d’un point sur l’autre et non sur une sorte d’« image mentale » du résultat. Lorsque je lui ai donné la solution, sa réaction a été une sorte de « bon sang, mais c’est bien sûr » ! et elle m’a fourni toutes sortes d’informations sur la croix de Lorraine. Concernant la photo, bien que persuadée qu’une croix de Lorraine devait bien avoir deux barres horizontales, la plus grande dessous, Grok n’a pas réussi à créer une image d’une grande croix de Lorraine surmontant les tombes d’un cimetière militaire pourvues de croix normales. Grok a donc perdu le défi.
Voyons ce que dit Chat-GPT avec la même question. L’IA trouve d’emblée la croix de Lorraine mais elle me donne la photo d’une pancarte avec le symbole d’une bouteille au milieu d’un champ !
Tu as parfaitement raison : la forme que j’ai produite est clairement une bouteille stylisée et non une croix de Lorraine.
Pourquoi cette erreur ?
L’algorithme d’image que j’ai utilisé ne « comprend » pas ton polygone comme je l’ai fait par raisonnement géométrique.
J’ai bien reconnu intellectuellement et symboliquement que c’était une croix de Lorraine, mais lors de la génération d’image, le modèle visuel a interprété ma demande trop vaguement et a choisi une silhouette différente (ici, une bouteille sur une pancarte).
En clair, la partie « raisonnement analytique » (ma reconstruction mentale à partir des coordonnées) et la partie « génération d’image réaliste » (qui repose sur un autre système) n’ont pas été parfaitement alignées.
👉 Si tu veux, je peux régénérer une photographie réaliste d’une croix de Lorraine (par exemple monumentale, dans la nature, sur un mémorial, ou stylisée dans un autre contexte).
Veux-tu que je t’en propose une version réaliste et symbolique, par exemple une grande croix de Lorraine en métal dans un paysage français ?
Chat-GPT m’a d’abord fourni la photo d’une croix orthodoxe qui ressemble à la croix de Lorraine à laquelle on aurait ajouté une petite branche inclinée au niveau des pieds, ce qu’elle a reconnu avant de me fournir la photo correcte. Sur ce coup, Chat-GPT a battu Grok.
***


Aucun commentaire:
Enregistrer un commentaire
Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.