Chapitre B3: Le projet " Stéréo-explication ".

- la fabrication des outils d'authoring et la navigation dans un faisceau discursif -

Le cadre

Mon prochain changement de posture a été facilité par l’invitation de travailler dans le cadre du projet SAFARI qui regroupait un nombre important de chercheurs et d’étudiants. SAFARI visait la fabrication d’un système complet d’instruments de composition d’objets explicatifs " intelligents ", utilisable en formation. En raison de mon expertise variée, la direction du projet a considéré que je pouvais aider le groupe par des suggestions sur le comportement que les instruments devaient pouvoir soutenir. L’occasion m’était donné de comprendre la problématique de la fabrication des instruments de composition et de suivre plus profondément la piste de l’intelligence artificielle en la confrontant avec ma vision sur le processus de l’explication.

On avait construit dans le cadre de SAFARI plusieurs agents " assistants " ayant diverses comportements. Pour agrandir le potentiel d’adaptation de l’environnement, il fallait d'abord définir la marge des réglages. La variation du mode de coopération était un des paramètres intéressants à modifier. C’est pour cette raison qu'on regardait avec intérêt ma formule d’intégration des modes d’assistance dans un " tutoriel " unique qui permettrait à tout moment le changement du mode interactif, pour satisfaire une hypostase d’utilisation variable. Le début de mon activité pour SAFARI a consisté dans l’amélioration du projet précédent, pour mettre d'avantage en évidence la " métamorphose ". Puis, j’ai voulu passer de l’expérimentation de " l’authoring " à l’expérimentation de la fabrication d’instruments " d’authoring ".

Le projet

J’ai abordé le problème de l’assistance de l'auteur d'un didacticiel dans la gestion du discours sur plusieurs pistes, problème qui me paressait pressant, vu le nombre élevé de situations qui exigeaient une présentation dans plusieurs fenêtres. Influencé par mes méditations sur l’équilibre entre le parallélisme et la sérialité, j’ai appelé ce projet "stéréo-explication ".

Pour dépasser les limites de l’environnement " d’Hypercard " dans la gestion des messages sur plusieurs fenêtres ("stacks"), j’ai dû concevoir une bibliothèque de programmes en langage " HyperTalk ". Les programmes que j’ai mis au point permettaient: 1. De concevoir et d’utiliser une démonstration en " HyperCard " distribuée sur plusieurs fenêtres présentées simultanément. 2. De corréler les " fenêtres-pistes " de sorte que l’avancement dans une d’elles amène les autres dans les états correspondants (la synchronisation du faisceau discursif). 3. De modifier à tout moment la répartition des fenêtres sur l’écran, en changeant la position et la dimension de chaque fenêtre sans affecter sa fonctionnalité. 4 De " propager " la situation des fenêtres tout au long de la démonstration (jusqu’à une réorganisation explicite de la formule de distribution des fenêtres). 5. De permettre à l’auteur et à l’utilisateur de partager le droit de modifier la géographie de l’écran et de négocier cette modification selon un protocole et avec l’aide d’une interface spéciale. 6. De permettre à l’auteur d’aider l’utilisateur à diriger son attention sur la réception optimale du " stéréo-discours " en indiquant les pistes actives et les références croisées.

Après avoir mis au point une première version de mon instrument, j’ai préparé une démonstration ayant comme sujet... la problématique de la " stéréo-présentation " (mon obsession de la récursivité). Cette démonstration illustrait les situations typiques qui exigeaient l’organisation du discours sur plusieurs pistes (angles différents sur un sujet unique, des parties complémentaires d’un sujet complexe, des manières différentes d’expliquer, des niveaux différents de détail, des auteurs ou des versions différentes etc.). J’ai montré aussi quelques " spécialisations " possibles des pistes " d’action "- pour effectuer l’opération démontrée, de " modèle " pour représenter métaphoriquement des structures ou des processus, de " théorie " pour expliquer les concepts impliqués dans chaque étape, de " plan " pour saisir la position de l’étape dans l’ensemble des opérations, de " commentaires " pour toutes sortes d’informations supplémentaires, " d’indications " pour les conseils du guide, de " dialogue ", de " négociation ", etc.

Par la suite, la démonstration expliquait explicitement et exemplifiait directement (étant elle-même conçue sur plusieurs pistes) les problèmes de la perception d’un tel discours, dus aux limites de l’attention distributive. J’ai démontré aussi les difficultés de composition dues à la distribution complexe de la sémantique et aux incertitudes sur la trajectoire réelle de la perception. J’en ai déduit la nécessité d’une modélisation perceptive de l’explication.

J’ai donné quelques exemples de situations où l’utilisateur ou l’ordinateur mandaté par l’auteur avaient besoin de modifier la distribution des fenêtres. J’en suis venu à la conclusion de l’opportunité d’instruments spécialisés pour faciliter ce genre de manœuvres.

Ma démonstration se terminait avec une " méta-présentation " du projet antérieur, accessible dans une fenêtre " application " entourée par d’autres fenêtres, dédiée au " méta-commentaires ". La suggestion de cet exercice était que la stéréo- présentation est une solution naturelle quand on veut démontrer l’utilisation d’une application informatique par des commentaires attachés à une exploration directe.

Les observations sur la composition du discours pluri-piste

Sur le plan du rapport fabrication-composition-utilisation, l’expérience a été d’une expressivité frustrante. Après avoir conçu ma démonstration sur un ordinateur avec moniteur de 21’’, j’ai passé dans un autre laboratoire sur un ordinateur avec un moniteur de 17 ’’. Les neuf fenêtres de ma présentation sont sorties de l’écran! Pour retrouver ma composition, j’ai dû refaire toutes les pages sur toutes les pistes. Même si j’ai pu (heureusement) utiliser mes propres " sous-routines " de modification des fenêtres, l’opération a consommé inutilement mon temps. Ce n’est qu’un exemple qui montre l’importance des restrictions techniques dans l’industrie des instruments explicatifs.

Sur le plan des principes, la difficulté majeure que j’ai rencontrée a été l’adaptation du contenu du discours à la variation dynamique de la structure des pistes. Je retrouvais mon vieux problème de la dialectique liberté–cohérence. Je pouvais laisser à l’utilisateur la liberté de fermer certaines pistes mais à ce moment je ne pouvais plus garantir la complétude et l’efficacité de la démonstration. Je devais suppléer à la disparition de pistes en récupérant leur sémantique sur les pistes ouvertes ou en signalant à l’utilisateur les informations perdues. L’acte de composition s’enfonçait ainsi dans l’explosion combinatoire et compliquait beaucoup le mécanisme de négociation de l’ouverture et de la fermeture des pistes.

Quand les informations de deux fenêtres étaient équivalentes sur le plan sémantique et étaient différentes seulement par la forme des messages, je pouvais les substituer sans le risque de rompre la cohérence. Je pouvais renoncer pour un temps à une piste si elle était dédiée à une dimension auxiliaire de la démonstration. Celui qui ne voulait pas observer le modèle métaphorique des opérations pouvait se contenter par exemple de la piste de l’application ou de la réalité simulée, appuyée par la piste des commentaires. Un autre cas d’organisation versatile était le chargement des pistes avec le même sujet traité à des niveaux différents de profondeur, par exemple la piste 1 pour les idées principales , la piste 2 pour les explications complètes, la piste 3 pour les détails fins. Pour une telle structure discursive " multi-strate ", la signification de la fermeture d’une piste était claire, de même que dans d’autres cas, comme la présentation de deux versions, de deux points de vue, etc. L’utilisateur peut changer la distribution des pistes (fils) du faisceau discursif s'ils ont des rôles clairs, stables, autonomes ou redondants.

Les références croisées entre ces pistes (fils) posaient un problème plus délicat. Ne pas en recourir pour sauvegarder l’autonomie de chaque fil et ainsi permettre des formules variées d’entrelacement dynamique, c'était ne pas profiter de leur présence simultanée; utiliser la "co-présence" c'était risquer l'incohérence si une piste était fermée! Un geste explicatif inter-pistes suppose l'observation des deux fils entre lesquels il signale un rapport. Il fallait donc prévoir les situations pour lesquelles un certain tronçon du faisceau discursif demandait la présence de certaines pistes pour garantir la recomposition du sens distribué par l’auteur entre les pistes. D'autre part, il fallait préparer les situations qui permettaient l’absence de certains fils, sans compromettre la compréhension. Il fallait découvrir surtout comment simplifier la gestion d’un tel discours complexe, soit par l’utilisateur autonome, soit par un présentateur.

Même dans l’hypothèse que toutes les pistes étaient à leur place, une autre question se posait. Il s’agissait de savoir comment s’assurer que les pistes étaient observées dans le bon ordre ( simultanément ou dans une séquence qui assurerait une certaine fusion psychologique). La lecture recommandée ou réelle établissait entre les pistes des rapports de perception différents des rapports sémantiques. Voilà quelques rapports possibles de perception: 1. A et B sont perçus simultanément. Exemples: le détail sur le fond; le son et l'image des films sonores ou des diapositives commentées; le message sonore et les gestes d'un présentateur; les signaux sonores marquant les actions importantes. 2. B est perçu après A, mais encore sous l'influence de celui-ci Exemples: l'explication sonore suivie d'une démonstration visuelle; les paroles qui suivent à l'écriture sur le tableau noir. 3. A et B sont accessibles pour passer librement de l'un à l'autre Exemples: le texte et le graphique d'une page illustrée; un texte à plusieurs colonnes; le passage de la vue entre divers personnages d'une image. 4. A et B sont perçus de manière " vibratoire " mais l'attention balaie entre les deux et donne l'impression d’une perception simultanée. Exemple: le film et la bande écrite du titrage.

Comment alors pouvais-je concevoir l’interface pour suivre et aider l’utilisateur dans des processus comme le regard fugitif alternant, la double vision détail- fond, le parallélisme son- image, dont la perception est capable et qu’un professeur stimule avec des gestes si simples? Comment pouvais-je éviter les "embouteillages " où pouvaient me conduire des activités cognitives parallèles et comment pouvais-je exploiter l’attention distributive de celui que je ne rencontrais pas face à face?

Ce sont des questions difficiles mais incontournables pour un ingénieur de la communication explicative pour qui l’organisation de l’interface est un problème central. Ce sont aussi des questions provocatrices pour les technologues "cognitivistes ". Arriveraient-ils à soutenir une construction déductive rigoureuse des interfaces, basée sur l’étude des mécanismes cognitifs? Après de longs efforts dans cette direction ambitieuse, ma conclusion fut que, pour passer ce test " d’applicabilité ", ils devraient dépasser la "statique cognitive " et se pencher davantage sur les processus.

Pour la " stéréo-explication  asynchrone ", j’ai conclu donc qu’elle imposait une simplicité raisonnable à la structure des pistes et de leur gestion. Le compositeur d’une "symphonie explicative " qui sera observée sans interprète devrait disposer d’un instrument " d’authoring " avec des fonctions d’organisation " pluri-pistes " pour l'aider à concevoir un " stéréo-discours ". Il devrait aussi pouvoir indiquer à l’utilisateur le parcours de lecture pour lequel il a optimisé l’explication.

Comme méthode de composition, il peut concevoir les pistes complètes, l’une après l’autre. D’abord il prépare le fil de la démonstration principale, l’application manœuvrée , puis le fil de la modélisation, puis le fil des commentaires etc. Ainsi les fils ont une certaine autonomie ou s’appuient l’un sur l’autre dans une pyramide explicative bien déterminée, par exemple le fil 2 complète ou explique le fil 1, etc.. L’auteur définit les nécessités, les dépendances, les libertés de lecture et puis il impose, recommande ou négocie avec le lecteur la physiologie de réception pour laquelle il a conçu son discours symphonique.

Une autre méthode que l’environnement de "stéréo-authoring" doit permettre est la composition "étape après étape ". L’auteur compose chaque "tronçon" du faisceau de manière complète, finissant parallèlement toutes les pistes (fils) que le tronçon courant utilise. Cela lui permet de trouver la formule de distribution optimale pour chaque étape du discours. Les variations de la formule des pistes sont indiquées au lecteur. Des mécanismes fins de négociation peuvent entrer en jeu. Mettre au point des mécanismes automatiques pour saisir et orienter l'attention du lecteur n'est pas du tout facile, même en utilisant la technologie moderne.

La synchronisation

Une " stéréo-explication " reste difficile à synchroniser à cause des phénomènes complexes liés à l’exploration sérielle et parallèle des messages explicatifs. La présence simultanée de deux protagonistes (le professeur et l’élève) permet le meilleur réglage de la synchronisation. La " stéréo-explication " synchrone (présentation avec l’ordinateur) poursuit la technique des exposés à diapositives qui démontre les possibilités d’interprétation symphonique du présentateur humain. La piste des diapositives déjà préparées est entremêlée avec la piste orale et des gesticulations qui guident la réception. C’est une formule puissante, car l’effort de composition est bien distribué entre la conception des messages préparés - qui sont difficiles à composer en ligne - et la génération des messages ad hoc - qui sont difficiles à préparer d'avance.

Le bon présentateur connaît les choix effectués déjà et ceux qu’on peut effectuer à tout moment et a une vision éclairée de leurs implications. Il sait ce que l’autre doit observer pour comprendre et observe s’il l’a fait et s’il le fait bien. D'autre part, l’élève sait ce qu’il a observé et se rend compte de ce qu’il observe, de ce qu’il a compris, comprend et l’intéresse. Il sent rapidement ses difficultés perceptives et cognitives. Ce sont deux processus complémentaires d'observation. Quant la structure du discours est complexe, laisser au récepteur seul la tâche d’adaptation est aussi inconvenant qu’obliger l'émetteur d’imaginer les réactions du récepteur. Le récepteur s’égarera dans un univers de possibilités de continuation mal comprises, tandis que l'auteur épuisera son énergie à prévoir des alternatives et les expliquer. Seul un dialogue direct permet aux deux acteurs d’adapter facilement une présentation pluri-pistes partiellement préparée.

Ces observations m’ont donné l’idée d’une " stéréo-explication mixte ": asynchrone durant la plus grande partie du temps mais synchronisée de temps en temps par dialogue direct. J’ai saisi l’intérêt des "systèmes de présentation assistée par ordinateur ". J’ai passé ainsi de la fabrication de modules de gestion du discours sur plusieurs pistes à la production d'instruments qui permettent aux acteurs la négociation du travail avec ces pistes.

Ce passage était inévitable, car, pour moi, l’explication n’est pas seulement un rapport entre un homme et un sujet développé par la médiation d'un autre homme. Elle est aussi un rapport entre deux hommes centré sur un sujet. Le processus explicatif suppose le partage des actions et des informations portant sur les entités expliquées, sur les instruments de communication et sur la négociation. Cette condition bipolaire de l'explication me demandait d'entreprendre une étude attentive du partage de l’initiative entre l’expert présentateur, le novice utilisateur et l’ordinateur intermédiaire.