Chapitre B5: Le projet "Instruction à triple contrôle"

- la négociation et le mixage synchrone-asynchrone -

Vision et buts

Pendant l’automne de 1996, j’ai abandonné le paradigme de l’explication asynchrone basé sur la séparation composition- utilisation. Il ne me paraissait pas seulement rigide, mais aussi trop éloigné de la résonance bipolaire qui soutient l’acte explicatif. Après l’étude de l’ergonomie pédagogique de l’interface homme- machine, je voulais revenir à l’interface homme- homme.

J’assistais aux virages reflétés dans la littérature de l’éducation utilisant l’ordinateur. On revenait vers la communication éducative avec l’ordinateur. Cette tendance avait été provoquée probablement plutôt par la spectaculaire rencontre entre les technologies informatiques et celles des télécommunications que par la conscientisation de la bipolarité et de la consonance explicative. Pourtant, ce fut une réorientation fertile, qui remettait en course mes efforts d’analyser le phénomène de l’instrumentation de l’explication.

Dans un article rédigé en collaboration avec André Morin, présenté en 1997 au Colloque CIPTE dans le cadre du congrès ACFAS, nous avons expliqué notre vision :

" En effectuant une recherche dans la base de données ERIC sous les termes CAI, CBT, CAL, ICAL et ITS, nous constatons que l'immense majorité des articles qui s'occupent de l'utilisation de l'ordinateur en éducation ne parlent pas de l'intervention du professeur dans l'utilisation du " didacticiel ". Le professeur est rarement considéré dans l'objectif de recherche et, quand on en tient compte, il est perçu comme l'auteur du didacticiel ou le gestionnaire de son utilisation. On trouve par ailleurs beaucoup de recommandations sur l’" authoring " et de multiples conseils pour la gestion de la salle de cours. Mais presque jamais on ne donne de détails sur la relation pédagogique triangulaire entre le professeur, l'élève et l'ordinateur, c'est-à-dire sur la didactique des didacticiels. Il est notoire de constater qu'on a peu de critères pour concevoir des didacticiels qui seraient utilisés comme interface entre l'élève et le professeur. […]

ll y a aussi, pourtant, un prix à payer dans cette séparation des deux partenaires du dialogue que nous croyons essentiels à toute pédagogie: l'absence du feed-back immédiat et raffiné qui assure la synchronisation continuelle d'un système à " deux centres " de décision. L'ensemble enseignant- élève a deux pôles de décision. Ils sont complexes, car chaque pôle a son espace cognitif. Ils sont spécialisés, l'un contrôlant le contenu et sa pédagogie et l'autre contrôlant l'évolution de ses propres connaissances. Enfin, ils sont capables de spontanéité parce qu'ils peuvent réagir continuellement dans un contexte partiellement imprévisible. Les deux partenaires disposent d'une " interface " (prédisposition, habitude) naturelle pour le dialogue.[…]

Essentiellement nous affirmons que le dialogue ne peut être coupé en deux étapes distinctes, car les deux partenaires du processus de communication pédagogique fonctionnent simultanément et synchroniquement. L'action dialogale ne peut se décrire comme un processus de cause à effet. Le système de connaissance progresse grâce à l'atmosphère ou à l'état d'ensemble. C'est ce que les adeptes du " situated cognition " sont en train de redécouvrir. C'est la présence de l'autre qui oblige à un continuel changement du discours .

Même les moments de monologue qui s'enchaînent composent un dialogue global; l'essence dialogique veut que pendant que l'un parle, l'autre écoute. Quand le tour de parler viendra à celui qui écoute, son discours sera influencé par ce qu'il aura entendu. L'interférence des discours des deux partenaires se base sur le changement successif des rôles dans le couple parler- écouter. Si on néglige le caractère dialogique fondamental du monologue et de l'écoute, on peut s'étonner des effets d'un discours bien adapté. Mais si on tient compte du caractère dialogique caché d'un monologue adapté, on saisit que pour parvenir à cette adaptation, le partenaire de l'élève doit pouvoir l'écouter et le comprendre. On perçoit dès lors la limite de ce qu'un ordinateur peut faire. Le professeur peut émettre pertinemment, parce qu'il écoute aussi continuellement.[…]

On s'est penché encore très peu sur le mixage entre les étapes asynchrones et synchrones d'un processus d'enseignement. En conséquence, la fusion entre les outils d'instruction fabriqués en ITS (CAI) et en CSCW (CMC) tarde à voir le jour. Nous sommes partisans d’un système où l'élève est assisté simultanément par un ordinateur, qui englobe l'instruction préfabriquée, et par le professeur, qui ajoute les indications nécessaires ad hoc. Il s’agit d’un système de formation à triple commande, comprenant le professeur, l'ordinateur et l'apprenant, dont le fonctionnement mixte, synchrone et asynchrone permet une importante flexibilité. Il nous faut un modèle commun pour la coopération instructive synchrone et asynchrone afin de parvenir à déduire un module opérationnel capable de les combiner de diverses façons. [...]

Une application qui pourrait s'inscrire dans cette direction consisterait dans un système qui permette la coopération formative à distance sur un réseau informatique.

Figure B5 Le mixage synchrone - asynchrone

[…] Le professeur peut intervenir en temps réel ou préparer l'ordinateur pour une réaction pendant son absence. Une fenêtre graphique peut donc être utilisée comme page de livre ou de cahier. Le professeur, l'élève et l'ordinateur interagissent pendant la formation, respectant un protocole qu'ils choisissent, grâce à la négociation, parmi plusieurs protocoles disponibles. Ainsi, le professeur démontre pendant que l'apprenant observe, opère et peut intervenir; l'auxiliaire d'enseignement, s'il existe, surveille; l'ordinateur présente une démonstration préparée, l'élève apprend par découverte guidée par l'ordinateur, etc. Le protocole peut changer en cours de route et l'ordinateur contribue aux adaptations nécessaires (métamorphose). L'authoring (composition du message), la communication, le monitoring (assistance par ordinateur) et la collaboration (travail coopératif en triangle) sont des hypostases qui déterminent les bases de fonctionnement du système ".

La coopération explicative assistée par ordinateur

Je me suis proposé de concevoir un système capable de passer aisément d'un mode synchrone à un mode asynchrone de communication, selon les nécessités, sans perdre la continuité de la démarche explicative. Le professeur devrait pouvoir passer du rôle d’auteur d’une leçon destinée à une lecture autonome à celui de présentateur, utilisant une démonstration préparée comme matériel pédagogique. L’élève pourrait passer de la posture d’explorateur de l’objet explicatif à celle de partenaire du professeur intervenu pour l’aider. L’ordinateur soutiendrait ces changements de rôles (ou d’hypostases) dans le cadre du mandat préparé par l’auteur. Celui-ci disposerait d’une méthodologie de composition, d’un langage de modélisation et d’un instrument " d’authoring " adéquats pour gérer le changement dynamique de la topologie du système explicatif.

Au début, le fonctionnement décrit plus haut était purement imaginaire. Je ne partais pas d'une observation immédiate, mais d'une synthèse comportementale. Je voulais utiliser ces spécifications physiologiques pour bâtir un système réel. J’étais donc devant un cas de synthèse instrumentale.

Quant aux situations qui auraient pu profiter d’une telle physiologie, j’envisageais surtout l’apprentissage des procédures par travail coopératif. J’avais conservé ma fascination pour la manière qu’on avait employé pour m’apprendre à piloter en partageant les commandes avec l’expert (voir le chapitre A1 ). Je voulais mieux comprendre et utiliser le formidable mécanisme de transfert d’expertise par l’entrée progressive dans la peau de l’expert. L’idée de voyager à deux dans une exécution commentée était d’autant plus tentante que l’ordinateur apportait la possibilité supplémentaire de l’apprentissage par simulation. En combinant la coopération synchrone avec l’expert pilote et la coopération asynchrone avec la simulation enrichie par lui, les possibilités d’explication s’amplifiaient fortement.

Mais un tel fonctionnement demande une communication multimédia riche et un partage cohérent du contrôle sur l’application dont on expliquait le fonctionnement. L’immersion dans l’aventure de l’autre suppose l’observation de ses gestes extérieurs et doit aussi permettre de comprendre ses observations, ses raisonnements. Pour que le partenaire rende explicite son aventure intérieure, il a besoin de pistes secondaires, attachées à la piste principale du travail coopératif, qui reflètent un modèle mental utilisé ou recommandé, des explications textuelles, des sélections appropriées dans la documentation, des exemples et des considérations supplémentaires, des messages ad hoc visant la négociation et la synchronisation du dialogue etc.

La gestion de toutes ces pistes pose le problème du faisceau discursif. La stéréo-explication est nécessaire pour suivre l’expert qui agit sur sa cible en coordonnant des processus parallèles comme l’action, l’observation, la documentation, le raisonnement, la communication avec l’élève. On a besoin d’un mécanisme de négociation de la structure des fenêtres graphiques et de la modalité des messages, c’est-à-dire d’un mécanisme d'adaptation de la communication. L’accès aux objets partagés peut se faire conformément à une vaste gamme de protocoles (" floor control ") pouvant aussi faire l’objet d’une négociation.

Les applications CMC (chat, mail, news, audio et vidéo-conférences, whiteboard, etc) utilisent le mode synchrone ou asynchrone et parfois leur combinaison, sans se lancer dans l’ingénierie sémantique. Elles exploitent le potentiel de la communication bipolaire en percevant l’ordinateur seulement comme une interface émancipée. Des domaines comme le GUI (grafical user interfaces) et le HCI (human computer interaction) étudient intensément encore aujourd’hui le mixage des modalités d’expression et de coopération, à la recherche d’une bonne ergonomie. Ils cherchent des formalismes de modélisation des interfaces et des interactions qui apparaissent pendant une session de communication ou pendant une série de sessions à objectif unitaire. Ce sont des études d’un grand intérêt pour la technologie de l’éducation.

La communication coopérative en groupe dispose d’instruments de plus en plus sophistiqués. Par exemple, les vidéoconférences permettent le dialogue entre un grand nombre d’acteurs et offrent des mécanismes évolués pour la gestion de la participation (floor- control). Cela m'a conduit vers le domaine qui offrait les instruments théoriques et pratiques les plus propices pour le traitement de mon projet, c’est-à-dire le CSCW (computer supported cooperative work). Celui–ci est axé sur la conception d’instruments de coopération entre plusieurs acteurs pour effectuer une tâche en commun.

Toutefois, j’ai trouvé dans le CSCW peu d’observations sur la particularisation des mécanismes coopératifs dans le cas d’objectifs explicatifs. Les instruments de " groupware ", tout en ayant un indiscutable potentiel formatif, n’étaient pas conçus spécialement pour faciliter le transfert de l’expertise. C’était probablement aux Sciences de l’éducation que revenait cette étude spécifique.

.

La littérature de la Technologie éducationnelle a accueilli le CSCW surtout en réactivant la problématique de l’apprentissage par coopération entre les étudiants. Dans les applications courantes du CSCW, quand l’expert intervient, il le fait pour des actions certes très utiles, mais auxiliaires par rapport au phénomène central de l’explication: faciliter la coopération entre les étudiants, gérer l’utilisation des ressources, corriger la composition des cours, etc. Cela ne répondait pas à mon problème: comment organiser avec les nouveaux outils la coopération explicative novice-expert?

La relation asymétrique professeur- élève demandait la conception de rituels, de protocoles et d’instruments de coopération spécifiques. Les outils de "groupware " facilitent en général la coopération par la division du travail. Les partenaires ont des tâches séparées et les accomplissent isolement. Ce sont les résultats qui doivent fusionner. Le cas de la coopération explicative est diffèrent, parce que les deux partenaires doivent travailler sur la même tâche, de la manière la plus entremêlée possible et avec la meilleure visibilité réciproque. Ce sont les processus qui doivent fusionner. Même avec les outils de type "shared application ", les besoins signalés plus haut n’étaient pas encore satisfaits. Il fallait trouver de nouveaux modèles, des stratégies et des instruments de composition pour faciliter le " faire ensemble, pendant qu'on en discute ". J’ai baptisé cette voie CSCE (computer supported cooperative explanation).

Le projet

J’ai continué mon étude sur la négociation triangulaire élève- ordinateur- professeur dans le projet "Explication à triple contrôle ". Pour l’implantation de la coopération explicative à distance, j’ai choisi le contexte d’un réseau local, parce qu’il permettait une transmission à bande large et en temps réel (sans délai). J’ai profité des facilités des réseaux " AppleTalk " de MacIntosh qui permettait à une certaine gamme d’applications (notamment " HyperCard ") d'être contrôlées à distance à l'aide du langage " AppleScript ". Ces possibilités étaient très intéressantes, mais je me suis heurté là aussi à des limitations importantes.

Les commandes données à l’ordinateur A pouvaient déclencher des ordres, envoyés à l’ordinateur B, qui exécutait des actions en conséquence. Mais on ne pouvait pas voir le geste originel (le déplacement de la souris, l’appui du clavier, la gesticulation, la direction du regard, l’attitude du corps, l’expression de l’acteur). En m’inspirant de la littérature sur l’" awareness " (la perception de l'autre) dans les " shared windows " (fenêtres partagées), j’ai testé diverses astuces pour représenter le mouvement de la souris du partenaire et ses autres gestes démonstratifs. J'essayais de m’approcher ainsi de l’impression que les utilisateurs auraient eue s’ils avaient pu s’observer directement.

En revanche, les gestes opérationnels ou explicatifs en dehors de l’ordinateur ont été difficiles à capter et à reproduire, faute d'une technique vidéo. Mais celle-ci aurait occupé (souvent inutilement) une large bande de transmission. Le mouvement de la main vers la souris, le geste de montrer un point ou d’encercler une zone, pouvaient aussi être simulés pour être reproduits à distance sans un surcoût trop important, mais cela demandait une analyse subtile des métaphores. Je suis arrivé à un compromis en prévoyant, sur mes interfaces couplées, des personnages qui représentaient les acteurs (expert, novice, ordinateur). Les utilisateurs étaient obligés d’agir par l’intermédiaire de ces personnages, comme dans la technique des " avatars ", largement utilisée dans les jeux et dans la réalité virtuelle coopérative. Je réussissais ainsi à offrir aux partenaires une image commune sur le monde partagé.

Pour faciliter la synchronisation entre les commandes données en parallèle, qui posaient d’importants problèmes ergonomiques et techniques, il est utile de bien percevoir l'autre. En effet, il n’est pas évident de fabriquer une automobile avec deux bords de contrôle, de manière à pouvoir être conduit par deux pilotes simultanément!

Si les deux partenaires agissent simultanément, des conflits (des "collisions") peuvent survenir. Pour les résoudre ou les éviter, des mécanismes de " floor control " sont nécessaires. Les désynchronisations produisent d’autant plus de perturbation qu’il existe un retard significatif dans la transmission des ordres à distance. C’est pour cela que dans un intranet (ou dans des sous- réseaux Internet à haut débit) on peut réaliser des mécanismes de coopération que le grand Internet ne peut pas encore soutenir.

J’ai conçu des mécanismes de synchronisation entre deux modules démonstratifs " HyperCard " couplés par " AppleScript ". J’aurais voulu résoudre de manière générique le problème de la synchronisation, pour assurer l’accès coopératif à n’importe quelle application MacIntosh, mais l’environnement de programmation ne le permettait pas. Pourtant, les résultats ont été prometteurs. J’ai réussi à montrer comment un expert et un novice pouvaient conduire ensemble une démonstration répliquée entre deux ordinateurs spécialement préparés pour supporter la communication et la négociation. L’expert, le novice et les ordinateurs mandatés par l’auteur de l’application distribuée pouvaient appuyer sur des boutons, indiquer des zones, communiquer verbalement et textuellement, faire des annotations, modifier la structure des fenêtres de présentation et négocier les droits d’intervention.

Ce dernier point m’a obligé à reprendre la modélisation des formes de distribution de la décision, au cours d’une démonstration. Mon ancien modèle (déjà compliqué...) devait être raffiné dans le nouveau contexte, car les trois acteurs avaient une gamme très large de possibilités pour le partage des décisions. J’ai trouvé des dizaines de façons d'appuyer pédagogiquement sur un seul bouton! Qui décide le passage au pas suivant? Qui observe, s’informe, se rappelle, raisonne et déduit ce qu’il faut faire? Qui énonce et explique la tentative d’action proposée ? Qui intervient pour la valider ou la contredire? Qui a le droit de faire le geste effectif, qui a le droit de le bloquer ? Qui fait les commentaires pendant ou après l’action?

Il n’était pas facile d’extraire, de toutes les combinaisons possibles, le groupe des formes significatives pour un rituel utilisable ou utilisé à un point précis de la démonstration. Par exemple : " le professeur demande la continuation, l’ordinateur fait des suggestions, l’élève agit, le professeur valide et commente "; " l’élève demande la continuation, l’ordinateur recommande, l’élève sollicite la médiation de l’expert, celui-ci n’étant pas disponible, l’ordinateur enregistre la question ", etc., etc.

Il fallait considérer les choix imaginables et caractériser les séquences de choix potentiels et effectifs. Si les acteurs changent le rituel (en profitant des alternatives accessibles dans le cadre d’un protocole), la trajectoire de la démonstration dans l’espace des types de coopération devient sinueuse et la caractérisation du processus démonstratif, difficile. Si, en plus, ils changent en cours de route le protocole de coopération, il devient difficile de caractériser la structure démonstrative. Ainsi la description formelle de la coopération est difficile. Mais, si on veut que l'ordinateur participe de manière active à la négociation et au déroulement de tous ces rituels, il est nécessaire de les modéliser minutieusement! J'ai investi beaucoup dans l'analyse de ce problème, parce qu'il représentait un pas vers la modélisation du processus explicatif.

Revenant au plan pratique, il est fort probable que j’aurais avancé beaucoup plus dans la direction des démonstrateurs à triple commande si je n’étais pas entré sur une nouvelle piste de recherche, à savoir la reproduction des comportements étudiés auparavant dans les applications éducatives d’Internet... Cette réorientation technologique, provoquée par " la vague Internet ", était aussi une investigation nécessaire pour compléter mon étude du mixage synchrone- asynchrone. Ce nouveau pas me plaçait au milieu d'un phénomène complémentaire au dialogue: l’organisation d’une structure d’informations, en vue de leur exploration.