Nous tenons à remercier Marc BUI pour son suivi, Victor LARIOS-ROSILLO 1 et Béatrice LAFON pour leurs références, et Liliane VEZIER pour ses conseils qui nous ont permis de mener à bien l'écriture de ce mémoire.
``L'objectif de cette IR est de dresser le panorama des NTIC (Nouvelles Technologies de l'Information et de la Communication) qui sont mises au point dans les laboratoires de recherches et qui commencent a être diffusées. On étudiera leur impact sur le travail collaboratif (CSCW - Computer Supported Collaborative Work -) notamment sur des plates-formes de type Web. Une attention toute particulière sera portée aux interfaces manipulant la réalité virtuelle/3D dans la consultation et la recherche de documents multimédias sur le Web.''
Cette IR se place dans l'objectif d'une application de groupware proposant une
interface en réalité virtuelle sur le Web. On y fera donc état des
technologies mises en jeux, des systèmes et des logiciels en proposant de
nombreuses références. Un travail particulier a été fait sur la
réalité virtuelle, mais aussi sur la visioconférence afin de
l'intégrer, dans l'optique d'un prototype de ce type d'application.
Les deux premières parties de ce mémoire ont pour but de présenter les
NTIC concernées par le sujet : la communication en temps réel sur Internet
et la réalité virtuelle. Elles répondent à la question : ``Avec
quelles technologies allons-nous travailler ?''.
Les deux dernières parties ont pour but de faire l'état des recherches et
des applications visées par le sujet : le travail collaboratif sur Internet,
en réalité virtuelle ou non. On exposera donc comment sont utilisées
ces technologies dans le cadre de travail collaboratif (CSCW).
La première partie portant sur la communication sur Internet est volontairement restreinte pour ne pas doubler des passages du mémoire de Béatrice LAFON qui porte sur ce sujet et ses aspects sociologiques.
Les documents qui ont permis d'élaborer ce mémoire sont de trois types :
Les travaux qui sont faits sur l'application finale du sujet de ce mémoire
sont peu nombreux. C'est pourquoi le Web fût la seule source en mesure de
nous fournir des renseignements les concernant, les chercheurs n'ayant pas
encore publié les résultats de leurs recherches.
Le Web nous a aussi permis de tester divers moyens de communication - comme le
Chat ou la téléphonie - et des technologies telles que le groupware, le
langage VRML ou les interfaces 3D.
Le sujet d'IR de Béatrice LAFON étant proche de certaines parties de notre rapport, nous avons été amenés à échanger des références. Certains des tests furent réalisés lors des rencontres avec Marc BUI (suiveur de l'IR) et Victor LARIOS-ROSILLO, avec lesquels nous avons aussi échangé des références et idées.
Une fois le sujet et les objectifs bien définis, nous avons commencer les
recherches. Nous avons utilisé pour les recherches sur le Web des sites
généraux sur le CSCW ([1], [2] et [3]) ainsi
que des sites traitant des nouvelles technologies du Web ([4],
[5] et [6]).
Les données recueillies ont été classées par thèmes afin de
construire un plan. Une fois le plan validé, d'autres recherches sont venues
compléter les premières pour répondre avec précision au travail
demandé et nous avons commencer la rédaction du mémoire.
Au cours de la rédaction du mémoire, l'actualité a évolué et nous
avons été amené à ajouter des notes de dernière minute dans le but
de rester le plus proche possible de létat des recherches.
L'existence de tous les sites Web référencés dans ce mémoire ont été testés fin décembre 1997.
Talk est un protocole issu du monde Unix qui permet à deux utilisateurs
d'écrire sur leur terminaux simultanément. Les utilisateurs peuvent être
connectés au même sytème ou bien sur des machines différentes.
Après avoir lancé la commande Talk, chaque terminal est séparé en deux parties qui contiennent les messages envoyés l'un à l'autre. C'est un outil de communication très primaire qui fait office de ``forum temps réel'' pour deux participants.
IRC est l'acronyme de ``Internet Relay Chat'', conversation par Internet
interposé ([7], p. 209). IRC s'apparente à Talk puisqu'il
permet à un nombre quelconque d'utilisateurs d'écrire des messages sur une
console visible par tous. Chaque message est précédé d'un ``Nickname'',
pseudonyme associé à chaque utilisateur.
IRC fonctionne selon une architecture Client/Serveur. Un serveur IRC fournit
le service sous forme de ``Channels'' (des forums) dédicacés à des
sujets particuliers. Ainsi les communications sont classées par canaux et un
utilisateur peut changer de canal comme s'il changeait de lieu afin de
discuter avec d'autres utilisateurs (intervenants) connectés.
Plusieurs utilisateurs peuvent s'envoyer des messages privés et se retrouver
sur un canal privé dont ils se donnent le nom (et éventuellement le mot de
passe) par message privé. Ainsi plusieurs utilisateurs peuvent avoir une
discussion privée simultanément de celles se déroulant publiquement sur
le canal.
IRC est donc un système de forum amélioré puisqu'il permet à l'utilisateur d'avoir un environnement personnel (des scripts de commandes par exemple), de changer de forum et d'utiliser Internet comme réseau de communication. L'IRC nécessite un client IRC et un l'accès à un serveur IRC.
Les Web Chat s'apparentent au système IRC mais utilisent la technologie Web
([7], p. 210). Un utilisateur se connecte sur un serveur Web qui
met à jour une page contenant le forum. L'intérêt réside dans le fait
que l'utilisateur peut envoyer ses messages en utilisant la richesse du
langage HTML.
Les Web Chat peuvent exploiter la technologie Java [8] pour permettre de mettre à jour automatiquement le contenu du forum sans que l'utilisateur ait à recharger la page [9].
Le Chat graphique fonctionne sur le même principe que le Chat simple, il
s'agit de communication écrite en temps réel. Mais il y a en plus une
représentation graphique des participants et de leur environnement.
Le Chat graphique se fait directement sur le Web ou par le biais d'un logiciel propriétaire, en 2D ou en 3D [10]. Les utilisateurs forment parfois des communautés virtuelles . Les environnements sont le plus souvent des salles de discussion et les participants sont le plus souvent représentés sous la forme d'avatars (voir chapitre 9, p. pageref).
Les tableaux blancs consistent en un espace de dessin partagé par plusieurs
personnes au travers d'un réseau. L'identification des personnes
connectées peut par exemple se faire par la couleur du crayon utilisé. Des
personnes éloignées peuvent ansi expliquer un plan ou construire un
schéma en commun.
Ce mode de communication graphique est tout de même difficilement
exploitable seul. C'est pourquoi les fonctions de tableau blanc sont souvent
intégrées dans des logiciels proposant un mode de communication écrite
en temps réel qui permet d'expliquer, de se synchroniser, etc.
C'est le cas de PowWow ([11], p. 82) qui est un logiciel de Chat et
qui propose des fonctions de tableau blanc. On dispose ainsi de serveurs de
discussions publiques et il est aussi possible de tenir des conversations
privées ``autour'' d'un tableau blanc.
Les logiciels de téléphonie proposent aussi souvent des fonctions de tableau blanc : Conference (Netscape), Netmeeting 2.0 (Microsoft) et Internet Phone 4.5 (VocalTex).
Téléphoner sur Internet ([12], p. 74) permet - dans la plupart
des cas - de limiter le coûts des communications à de simples appels
locaux, le prix de la connexion au fournisseur d'accès Internet. On passe
par exemple de 2,95 F/min pour une communication Paris/New York avec France
Télécom à 0,25 F/min sur Internet.
L'utilisateur doit tout de même posséder un équipement informatique adapté :
Les limites de ce moyen de communication sont surtout liées à
l'utilisation d'Internet. En effet, le débit n'est pas fixe (ce qui peut
provoquer des coupures) et il y a toujours un délai non négligeable pour
échanger les données vocales sur le réseau (ce qui engendre souvent un
petit décalage). De plus, il existe de nombreux logiciels de téléphonie,
mais ils sont incomptatibles. Les deux interlocuteurs doivent donc posséder
le même logiciel. Il n'y a pas non plus d'annuaire commun à tous les
logiciels.
La plupart des logiciels permettent en plus des fonctions de téléphonie, des fonctions de tableau blanc, de transfert de fichiers et de Chat. Il est aussi intéressant de noter que des passerelles vers le réseau téléphonique sont en train d'être mises en place et devraient permettre d'appeler n'importe quel poste téléphonique.
La visiophonie rajoute à la téléphonie l'image de l'interlocuteur avec
lequel on est en communication. En se connectant avec plusieurs personnes
simultanément, on a alors des systèmes capables de faire de la
visioconférence.
Il existe des systèmes fonctionnant sur des lignes numèriques
spécialisées, RNIS par exemple. Ces systèmes de vidéoconférence
permettent d'obtenir des images en plein écran avec un taux de
rafraîchissement de cinq ou six images par secondes. Il faut pour
cela un débit d'environ 120 Ko/s.
Des systèmes analogues sont maintenant disponibles sur Internet et il est ainsi possible de faire des visioconférences avec un simple MODEM à 28,8 Kbps. Mais dans ce cas, l'image est le plus souvent réduite à une fenêtre de 160 sur 120 pixels.
La norme H323, ratifiée par l'UIT 2, est une recommendation qui définie la manière
dont les systèmes de visioconférence communiquent entre eux, les
algorithmes de compression qu'ils utilisent en utilisant différents types de
support, etc.
Les logiciels suivant sont compatibles H323 : Internet Video Phone (Intel) et Netmeeting 2.0 (Microsoft). Par contre, Internet Phone 4.5 (VocalTex) ne l'est pas. Conference de Netscape est aussi compatible H323, mais il ne gère pas la visioconférence.
L'objectif de la réalité virtuelle [13] est de créer des
scènes à l'aspect réaliste (ces scènes n'existent pas, elles sont donc
virtuelles). Pour cela, elles doivent être compréhensibles par l'homme à
l'aide de sa vision mais aussi de ses cinq autres sens. On parle alors
d'immersion totale. Lorsque seuls quelques uns des sens sont ``captés'' ou
stimulés, on parle d'immersion partielle.
La réalité virtuelle nécessite donc un rendu temps réel des scènes, et des interfaces comportementales [14] entre la machine et l'homme telles que le visiocasque qui rend l'effet de relief ou le gant qui capte les mouvements de la main.
Les champs d'application de la réalité virtuelle sont très nombreux et
c'est un outil généraliste qui peut se révéler utile dans une
multitude de domaines différents [15].
Dans le domaine médical, la réalité virtuelle peut servir à
l'enseignement. Ainsi, on peut ``naviguer'' à l'intérieur d'un corps
humain et y apprendre son anatomie. Les étudiants peuvent aussi opérer des
corps virtuels pour s'entraîner. On peut aussi faire de la rééducation
avec un gant spécial ou soigner des phobies tel que le vertige. Au niveau de
la recherche, on peut faire de la biotechnologie ou construire des molécules
dans l'espace.
Les deux domaines phares de la réalité virtuelle sont le domaine ludique
(voir section suivante), et le domaine de l'insdustrie. Le ``virtuel'' permet
dans ce dernier cas de faire de la conception, de la simulation et de la
télérobotique (commande de robot à distance).
Dans le domaine militaire et de l'espace, on trouve beaucoup de simulation
d'engin, par exemple pour les avions ou les tanks, mais aussi pour les
batailles ou les opérations en apesanteur.
Les arts ne sont pas en reste puisqu'il est possible de visiter des musées
virtuels. La réalité virtuelle devient aussi un instrument de musique
quand on peut jouer sur des instruments virtuels avec tout son corps.
Le monde des affaires s'intéresse aussi à la réalité virtuelle
[16]. On peut l'utiliser pour faire de la présentation de projet
(en architecture par exemple) ou pour faire de la vente de maison ou de
mobilier. On peut aussi étudier le comportement humain dans des magasins
virtuels ou faire de la manipulation de données commerciales.
Mais les champs d'application de la réalité virtuelle s'étendent de jour en jour. Récemment, des systèmes de ``télésexe'' [17] ont même été créés.
Les technologie de réalité virtuelle commence par un point technique
important qui consiste à effectuer du rendu 3D en temps réel. Plus le
réalisme et la qualité des images rendues est bonne plus ils nécessitent
de la puissance de calcul. Un premier élement de réalisme utilisé de
manière ``optimisée à l'extrême'' fût le mappage de texture.
Ce sont en fait les jeux vidéo sur micro qui ont lancé l'idée qu'il
était tout à fait possible de faire de la 3D exploitable en temps réel
avec une interface utilisateur moyennant des astuces de programmation savament
dosées. C'est le cas du jeu Wolfestein 3D puis de son successeur le fameux
Doom. Ce jeu basé sur la navigation à travers un labyrinthe 3D avec
mappage de texture, fût programmé de manière extrêmement optimisé de
sorte qu'il était possible de plaquer des textures sur un PC de type Intel
486 à 66 Mhz sans coprocesseur graphique dédié avec une fluidité de 50
images par seconde. Le jeu lui même permettait à 4 joueurs de jouer
simultanément en s'affrontant ou en équipe contre les enemis situés dans
le labyrinthe. De ce point de vue ces jeux fûrent les pionniers de la
réalité virtuelle (au sens de l'interface de visualisation).
La démonstration de technique de programmation a montré qu'il suffisait
d'attendre l'évolution des processeurs pour pouvoir fournir des moteurs 3D
de qualité sans pour autant devoir ajouter un équipement matériel
dédié. Le marché créé par ce type de jeu a donc développé les
productions de logiciels de visualisation temps réel et les techniques de
programmation pour obtenir des rendus ``réalistes'' suffisament rapides. Ces
techniques utilisés proviennent en partie des passionnés, développeurs
de démonstrations graphiques sur micro.
Conjointement aux développements des cartes graphiques pour micro
(principalement PC) demandé par les applications graphiques PAO et de calcul
3D, les constructeurs ont produits des équipements possédant des
accélérateurs 3D et décompresseurs vidéo pour le temps réel à
moindre coût. L'arrivée de VRML a permis de démocratiser la technologie
3D temps réel et par exemple, Silicon Graphics a fourni un des premiers
visualisateur VRML complétement logiciel.
Enfin, avec la relance du marché des consoles de jeux, des constructeurs s'y sont intéressés et notamment Sony qui a sorti la ``PlayStation'' équipée d'un processeur Risc R4000 et de coprocesseurs 3D. Ont suivi Sega avec la Saturn, basée sur deux processeur 64 bits RISC en parallèle comme moteur de calcul 3D puis Nintendo avec la N64 utilisant des coprocesseurs 3D de Silicon Graphics (dérivés de la ``Reality Engine'', présentée en 1992 à Imagina). Les jeux sont donc moteurs de développements professionnels puisqu'ils montrent qu'on peut faire du rendu 3D réaliste, interactif et donc temps réel à moindre coût d'une part, et démocratise l'interface et l'évolution dans des environnements 3D d'autre part.
VRML signifie Virtual Reality Modeling Language. Ce langage permet de
concevoir des mondes virtuels interactifs et tridimensionnels sur le Web
[18]. Il a été penseé en 1994 dans le but de fournir un
standard multi-plateforme. Il existe maintenant deux spécifications
officielles du langages (1.0 de mai 1995 et 2.0 d'août 1996) et une
troisième est en cours d'élaboration.
Il s'agit de VRML 3.0 ``Living Worlds'' qui permettra le partage d'univers. Plusieurs utilisateurs (représentés par leur avatar) pourront ainsi se retrouver dans un même monde.
VRML 1.0 permet décrire des scènes statiques dans lesquelles on peut se
déplacer librement et activer des hyperliens affectés à des objets. Les
fichiers de données qui décrivent les scènes VRML sont des fichiers de
type ASCII, ayant comme extension .wrl.
Ces fichiers se décomposent en noeuds qui noeuds peuvent être :
VRML 2.0 permet en plus de la version 1.0 d'animer des objets, d'avoir du son
spatialisé et des scripts pour attribuer des comportements à des objets.
VRML 2.0 est aussi dynamique, on y trouve des capteurs divers (proximité, toucher, temps, etc.), la détection de collision, des nouveaux éléments de base (extrusion, fonds de scène, brouillard, terrain), la gestion des évènements et la définition de types de données.
En combinant VRML 2.0 et Java, on peut déjà obtenir des ``Living Worlds''.
Ils existent d'ailleurs des sites de spécification pour cet usage
([19] et [20], voir chapitre 9,
p. pageref).
Une réalisations de ce type a été faite à l'EPFL 3 [6]. C'est le projet Khepera on the Web
[21]. Le but de ce projet est de faire de la télérobotique
virtuelle sur le Web. On dispose d'une interface de commande en Java qui
permet de déplacer un robot et une caméra. La vue 3D est affichée dans
la page grâce à VRML 2.0.
Pour pouvoir commander une scène VRML en Java, il faut que l'applet soit dans la même page que la vue de la scène. Ainsi, les deux pourront communiquer. Ensuite, il faut utiliser des packages Java particuliers : netscape.javascript.JSObject (communication applet/VRML) et vrml.external (classes VRML 2.0 pour Java) [22].
Après le passage des interfaces informatiques en mode texte constituées
uniquement de caractères aux interfaces en mode graphique basées sur le
principe des fenêtres, on aurait pu imaginer que les interfaces évoluent
vers la troisième dimension.
Des travaux ont été effectués dans ce sens, mais aucune application
commerciale n'en a réellement été faite au niveau de l'utilisation
courante des micro-ordinateurs.
Des recherches menées au Palo Alto Research Center de Xerox
([23], p. 74) avaient pourtant montré la faisabilité de
telles interfaces graphiques. On y trouvait par exemple un gestionnaire de
fichiers où les fichiers de même niveau étaient ``enroulés'' autour
d'un cylindre ou un mur en perspective affichant des informations
chronologiques qui permettait de voir ``au loin''.
On peut aussi noter la présence d'un gestionnaire de fichier sur certaines
stations de travail Silicon Graphics où l'architecture des répertoires est
visualisée sur un plan et où d'autres informations telles que la taille
des fichiers peuvent être visualisées en hauteur.
Malgré ces expérimentations, déjà assez anciennes pour le monde de
l'informatique, ce type de technologie n'a pas encore séduit. Il semblerait
que la cohabitation des deux modes de fonctionnement ne satisfasse pas les
utilisateurs et qu'ils voient ces interfaces comme des gadgets. Le mode de
visualisation 3D apporte souvent plus de réalisme qu'en 2D alors que
l'utilisateur souhaite plutôt une vue schématisée qui simplifie la
lecture des informations.
Néanmoins, de nouveaux types d'interfaces 3D sont récemment apparues
grâce au langage VRML et des recherches sont en cours sur le sujet
[24]. On peux notamment constater que de nombreux sites
proposent leur plan en VRML.
Par exemple, le site de recherche Yahoo [25] permet de faire des recherches dans une interface en VRML. Et Computer Associates propose aussi Unicenter TNG FrameWork ([26], p. 224) qui permet de faire de l'administration de réseau et qui dispose d'une vue en trois dimensions.
Lorsque l'on est plusieurs dans le même univers virtuel, il faut pouvoir
se reconnaître. On utilise pour cela des avatars [27]. Ce
sont des représentations 2D ou 3D (une tête ou un petit personnage) dont
on peut personnaliser l'appareance (sexe, couleur des cheveux, barbe, etc.).
On peut ainsi se marier virtuellement [28] et il existe des fanzines pour se retrouver dans toutes les communautés virtuelles du Web [29] (Virtual Places par exemple [30]).
Dans l'histoire d'Internet, les communautés virtuelles sont apparues sur
Usenet [31] 4. On y retrouve des
milliers de newsgroup, chacun dédié à un thème bien particulier et
fonctionnant grâce au courrier électronique. Les utilisateurs de Usenet
peuvent lire les newsgroup et s'y inscrire. Ils peuvent aussi ``poster'' leurs
messages et donc s'investir dans un newsgroup. Ils forment de cette manière
des communautés virtuelles.
Avant Usenet, d'autres communautés virtuelles sont nées sur des réseaux
tels que Well, Twics, Cix ou CalvaCom [32]. Une communauté
virtuelle est donc un regroupement socioculturel suffisament important pour
qu'il émerge du réseau sur lequel ses discussions ont lieu. Les liens
entre les participants peuvent devenir très intimes alors qu'ils ne se sont
jamais vus [33].
Les communautés virtuelles peuvent maintenant se développer dans des mondes virtuels en 2D (par exemple WorldsAway [34]) ou en 3D (comme Community Place [35] ou Blacksun [36]). Les participants sont représentés par leur avatar et en 3D, on utilise VRML et Java (voir section 7.4, p. pageref).
On pourrait définir les mondes virtuels comme des univers 3D où l'on peut
faire bien plus que discuter, des univers où l'on peut avoir une vie
communautaire parallèle à la vie réelle. Les communautés virtuelles
ont donc de ce fait un monde qui leur est propre, où leurs participants
peuvent se développer et avoir une vie sociale au delà du simple débat
d'idées.
On trouve sur Internet de tels mondes (par exemple Utopia ou Active Worlds [37]), mais le système le plus abouti en France est sans aucun doute Le Deuxième Monde.
Utopia [38] est un des mondes virtuels que l'on peut trouver sur
Internet et qui utilise la technologie VRML. Utopia est basé sur le logiciel
Traveler 2.0 qui permet d'explorer les mondes VRML, d'envoyer des messages
publics et privés, et de créer ses propres salles de discussion.
Utopia propose de nombreuses activités : une station spatiale, un bar, une salle de concert et des points de rencontre pour les communautés virtuelles.
Le Deuxième Monde [39] est un produit de Canal+ Multimédia qui
remporte un certain succès en France. Il s'agit d'un monde virtuel qui
mêle discussions, navigation 3D et vie en communauté. C'est au départ un
jeu, auquel on ne peut pas participer sans être connecté. Il faut en plus
avoir acheté le CD-ROM et payer un abonnement.
On est représenté dans le Deuxième Monde par un avatar que l'on peut personnaliser avec les caractéristiques suivantes :
Chaque avatar habite dans un appartement de Paris à partir duquel il peut mener sa ``vie parallèle'' :
Comme la réalité virtuelle a été largement utilisée pour des jeux,
le travail collaboratif sur Internet est utilisé à des fins ludiques (on
ne compte plus le nombre de jeux jouables sur le réseau). En effet, Internet
permet à ses utilisateurs d'oublier les distances et par exemple d'écrire
des romans virtuels. Chaque utilisateur peut lire ce qui est déjà écrit
et envoyer la suite suivant sa propre imagination.
Cela permet aussi aux musiciens de faire des ``rencontres musicales virtuelles''. Par exemple dans les studios virtuels de Res Rocket ([40], p. 16 et [41]). On se déplace dans un immeuble virtuel dans lequel se trouvent des salons de discussion, un bar et des studios d'enregistrement. Le logiciel est composé d'un séquenceur MIDI sur lequel chaque piste correspond à un utilisateur sur le réseau. Un groupe peut ainsi composer un morceau de musique en étant dispersé aux quatres coins du monde.
Les systèmes présentés ci-dessous sont composés d'une mini-caméra couleur, d'un micro, d'une carte d'acquisition vidéo et d'une carte d'interface pour une ligne de communication spécialisée.
Ce système semble être de conception ancienne et pose des problèmes d'installation. Les cartes ne sont pas Plug and Play et ne sont compatibles qu'avec quinze cartes graphiques. De plus, l'image est de mauvaise qualité, même en 640 sur 480 pixels et 256 couleurs avec un taux de rafraîchissement de dix images par seconde.
Ce système est d'excellente qualité. Les deux cartes sont réunies en une seule qui est Plug and Play. Le son et l'image sont aussi excellents, le taux de rafraîchissement se situe entre dix et quinze images par seconde.
Ce système est aussi de très bonne qualité. Il supporte la norme T120 pour le ``data-conferencing''. Le logiciel d'exploitation, Intel ProShare Premiere 2.0 est très complet et possède une interface graphique très pratique. Le taux de rafraîchissement est de huit ou dix images par seconde.
Ce système possède d'excellentes performances mais pose certains problèmes à l'installation. Le taux de rafraîchissement peut dépasser les vingt images par seconde. Le logiciel Intel ProShare Premiere peut être ajouter en option mais le système est déconseillé pour le ``data-conferencing''.
Les principaux produits qui permettent de faire de la visioconférence sur Internet sont : CU-SeeMe (Cornell University), Internet Video Phone (Intel), Internet Phone 4.5 (VocalTex), et Netmeeting 2.0 (Microsoft). Ce sont plus généralement des logiciels de communication qui proposent souvent de nombreuses autres fonctions.
CU-SeeMe est le logiciel de visioconférence le plus utilisé, il est distribué gratuitement par la Cornell University. Malgré cela, il ne dispose pas d'autres fonctions vraiment intéressantes (outre le Chat qui est aussi très utilisé sur ce logiciel) comme le tableau blanc ou le partage d'applications.
Netmeeting de Microsoft est un produit plus complet. Il permet de faire de la téléphonie, du tableau blanc, des transferts de fichiers, du Chat et de partager des applications. Il s'intègre aussi dans la messagerie et il utilise des annuaires standards (protocole LDAP). De plus, Netmeeting supporte les standards H323 (voir section 5.5.2, p. pageref) et T120 qui lui autorisent des connexions multipoints.
Lors des dernière semaines, des nouveaux systèmes de visioconférence
plus accessibles sont apparus à différents niveaux d'utilisation. Cela
semble indiquer un réel intérêt pour cette technologie de la part des
constructeurs et des utilisateurs.
Basée sur une carte RNIS, Cybermod ISDN Visio de SAT ([42], p.
212) est une solution de visioconférence pour Internet et réseaux locaux.
Elle propose en plus des services tel que l'accès à Internet ou le tableau
blanc, son prix est de 3 000 F HT.
Toshiba propose par ailleurs un nouveau modèle de portable, le Tecra 750 CDT
([42], p. 52). Outre le fait qu'il dispose d'une accélération
graphique 3D et de la possibilité de se brancher sur une télévision, il
est intéressant de noter que Toshiba propose en option un kit de
visioconférence comprenant le logiciel d'exploitation, un logiciel de
capture vidéo et une caméra couleur qui se fixe sur le bord de l'écran.
Ce portable coûte environ 38 000 F HT, auxquels il faut rajouter le prix du
kit et celui de la carte MODEM ou Ethernet PCMCIA. Le prix reste donc
élevé, mais la visioconférence est maintenant accessible aux ordinateurs
portables.
Pour les utilisateurs d'ordinateurs de bureau ayant de petits budgets, de
nombreuses solutions sont apparues. C'est le cas de la Video Blaster WebCam de
Creative Labs ([42], p. 68). Elle est destinée à
la visioconférence sur Internet et son prix est d'environ 1 000 F HT. La
caméra est connectée à l'ordinateur par le biais du port parallèle, ce
qui limite le débit de la transimission vidéo à 15 images par seconde
avec une image de 160 sur 120 pixels. Son utilisation sur un ordinateur
portable est possible mais peu partique : il y a la prise du cable parallèle
à l'arrière et la caméra doit être posée à côté du portable.
Ces trois solutions montrent bien l'expansion de cette technologie qu'est la visiophonie. On peut donc penser que la visioconférence sur Internet tendra à remplacer le téléphone, que ce soit à partir d'un micro-ordinateur, d'un Network Computer ou d'un terminal dédié. L'apparition de la visiophonie sur les ordinateurs portables laisse d'ailleurs envisager des ``visiophones'' portables dans un futur proche.
AB Soft présente dans son catalogue d'accessoires pour portables de 1998 un kit de visioconférence sur port PCMCIA ZV-Port. Ce système permet d'obtenir 30 images par seconde en 320 sur 240 pixels avec une connexion rapide. De plus, la caméra se fixe sur le bord de l'écran grâce à une petite pince. On se rapproche donc des ``visiophones'' portables.
Le téléenseignement [43], aussi appelé
téléformation, se décompose en deux phases. L'élève travaille tout
d'abord seul, puis il entre en contact avec un professeur. Cette seconde phase
peut être synchrone (communication en temps réel, par Chat ou
visioconférence par exemple) ou asynchrone (communication de type courrier,
par e-mail ou site Web par exemple).
Dans les deux cas (synchrone ou asynchrone), la communication peut être textuelle ou multimédia.
Les premiers systèmes de téléenseignement asynchrone existent depuis
très longtemps. En fait, ils existent depuis que la correspondance papier
est apparue. Le passage à des modes de communication informatique a permis
des échanges beaucoup plus rapides. Un e-mail met le plus souvent moins de
cinq minutes pour parvenir à son destinataire alors qu'un courrier postal
met au moins une journée.
Le Web est donc un espace de formation très convivial et accessible à un
nombre d'étudiants de plus en plus important. Les cours sont le plus souvent
présentés sont la forme de pages HTML et les échanges
professeurs/étudiants se font par e-mail.
Aux Etats Unis, le réseau K12 permet aussi ce type d'enseignent. Les étudiants ont à leur disposition une base de données contenant des cours et une liste de professeurs pour chaque domaine qu'ils peuvent contacter par e-mail en cas de difficulté.
L'intérêt principal des systèmes de téléenseignement synchrone est
leur grande interactivité. Une question posées obtient immédiatement sa
réponse et on a ainsi de véritables conversations.
Les outils les plus utilisés sont le Chat et la visioconférence. Mais on peut facilement imaginer qu'un outil tel que le tableau blanc ait une grande utilitée dans le téléenseignement.
Il y a en France de nombreux centres de téléenseignement. Seize sont
référencés [44] et on en trouve dans presque toutes les
grandes universités.
Par exemple, l'Université de Provence (Aix-Marseille I, Lettres et Sciences Humaines) propose comme disciplines : l'Allemand, l'Anglais, l'Histoire, l'Italien, LEA, les Lettres Modernes et la Philosophie.
De nombreuses expériences sont aussi menées pour faire du
téléenseignement avec des systèmes de visioconférence. C'est le cas
à l'EPFL 5 [6].
Les expérimentations ont commencé en 1995 avec des partenaires européens et une plate-forme de communication ATM. Depuis, de nombreuses vidéconférences ont eu lieu et des présentations de thèses ont même été présentées avec succès.
Les technologies offrant des solutions groupware [45] se caractérise par des outils mis à disposition dans un environnement partagé :
Lotus Notes est un outil de type groupware. C'est l'outil leader du marché.
Il est intégré autour d'un système de gestion de base documentaire et
d'une messagerie, des applications de partage de documents. Lotus Notes est un
outil basé sur une architecture client/serveur propriétaire utilisant son
propre protocole de communication. Les serveurs Notes ainsi que les programmes
clients peuvent répliquer (copie incrémentales) des bases de données
(applications et données) entre eux. Ainsi Notes permet de répartir les
informations et les applications en utilisant les ressources de toutes les
machines impliquées dans le système.
Notes est un outil de CSCW essentiellement asynchrone (par la réplication).
Un serveur peut être connecté à des SGBD externes, à un serveur de
Fax, etc.
Les applications standards de Notes regroupent :
La gestion documentaire de Notes assure le partage de l'information grâce
à la réplication et aux serveurs.
Tous ces outils reposent sur le protocole de Notes qui permet de partager les informations et les applications, ceci avec un contrôle d'accès basé sur l'appartenance des utilisateurs à des groupes. Chaque utilisateur, serveur ou groupe peut avoir des accès de six niveaux différents en plus de rôles spécifiques définis par chaque application. Les données transitant sur le réseau peuvent être cryptées en utilisant des clés de cryptage propres à chaque utilisateur, serveur et organisation. Le système de contrôle d'accès de Notes permet de modéliser la structure de l'entreprise sous forme d'organisation, d'unité d'organisation et d'utilisateurs. Le système de groupe permet ensuite d'affiner la hiérarchie. Le système de contrôle d'accès permet la signature électronique autour de la messagerie pour assurer les fonctions de workflow. Notes possède enfin un serveur Web intégré permettant d'utiliser les bases de données Notes sur le Web ou bien de réaliser des applications Intranet spécifiques.
Chez Novell un outil équivalent existe : ``Groupwise''. Regroupant la plupart des fonctionnalités de Notes, il est cependant moins performant. La technologie de réplication étant très pratique pour répartir la charge d'utilisation des machines n'est correctement implémentée que dans Notes. Groupwise exploite le réseau bureautique Netware mais n'est proposé que sur plate-forme micro (W95/NT et MacOS).
Microsoft propose Exchange, un outil groupware simple à utiliser s'intégrant très facilement aux environnements Microsoft Windows 32 bits (exclusivement). Basé sur le client Outlook 97, Exchange permet d'accéder aux outils groupware de base. Le partage d'applications n'est cependant pas aussi évolué que celui fourni par Notes.
La solution de groupware de Netscape exploite les protocoles standards du Web auxquels s'ajouttent quelques fonctionnalités non-standards. Les solutions Netscape sont multi-plateforme mais la multiplicité des protocoles font de SuiteSpot une suite de serveurs indépendants conversant avec leur client Communicator. Le développement en devient lourd car le code est spécifique à chaque serveur.
GroupLab [46] est un laboratoire de recherche en groupware et de
CSCW situé au département Informatique de l'Université de Calgary.
Voici les principaux projets dont ce laboratoire s'occupe :
GroupKit [47] est la boîte à outils groupware écrite à
l'aide de Tcl/Tk et distribuée par GroupLab. On y retrouve de très
nombreuses applications : un outil de brainstorming, un outil de visualisation
de fichier, un tableau blanc et d'autres applications de dessins, un outil de
type PostIt, des éditeurs de texte, un Chat et des jeux.
Dans l'outil de visualisation de fichier par exemple, chaque utilisateur peut
consulter librement les documents. Mais il vois aussi les ``ascenseurs'' des
autres utilisateurs et peut ainsi savoir quelle partie ils sont en train de
lire.
Il y a deux types d'éditeur de texte. Dans le premier, un seul utilisateur
écrit dans le document, puis il passe son tour (``Turnaking''). Dans le
second, tous les utilisateurs peuvent écrire en même temps et ils ont
chacun un curseur différent.
Dans un environnement multi-tâche, l'utilisation de ces outils simultanément procure sans aucun doute une grande liberté dans le travail collaboratif. Une équipe, même dispersée dans le monde entier, peut ainsi être efficace et rapide.
wOrlds [48] est un projet de l'Université de l'Illinois. Il s'agit
d'un environnement de CSCW sur lequel trois thèses et de nombreuses
conférences ont été faites.
wOrlds est constité d'utilisateurs qui se regroupent en fonction de leur
travail (ou de leur loisirs) pour former des communautés. On appelle ces
communautés des locales. Les locales sont donc caractérisés
par leurs participants, leur raison d'être (le thème) et leur contenu.
wOrlds est en fait une collection de locales qui fournissent chacun des
outils particuliers. Le bureau de travail est constitué d'un contrôleur de
niveau sonore, d'une barre d'outils et d'un panneau du locale de
l'utilisateur.
La barre d'outils contient un autre panneau du locale pour faire du
glisser-déplacer (un courrier par exemple), un panneau représentant
l'utilisateur qui a le même usage et les icônes pour appeler les outils
groupware (historique, courrier, un constructeur de document, un outil de
visualisation de document, un outil de type PostIt, un navigateur, un
terminal) et d'autres outils (un outil de conférence Web par exemple).
Le panneau du locale permet de visualiser ses visiteurs (avec leur
vidéo en visioconférence), ses participants, son contenu, sa description
et des sous-locales.
Le navigateur accessible depuis la barre d'outils permet d'explorer les
locales. On peut aussi obtenir des informations sur leurs utilisateurs
et accéder à leur page personnelle.
L'intérêt principal de wOrld est qu'il s'agit d'un environnement complet
de groupware. On a l'administration des groupes, le bureau de travail et les
outils de groupware accessibles avec la même interface. Maintenant, on peut
très bien imaginer que cette interface soit en réalité virtuelle, mais
cela ne semble pas être encore la direction des recherches du projet.
TeamWave [50] est un outil de groupware intégré pour les
plates-formes MacOS, Windows et Unix sur le réseau Internet qui propose un
tableau blanc, des salles de discussion et divers outils de groupware.
Les membres des équipes de travail peuvent travailler en temps réel (de
manière synchrone) dans des salles de discussion. Mais ils peuvent aussi
travailler de manière asynchrone, en laissant des choses dans les salles
(``Any-Time Collaboration''). Ces salles de travail peuvent être
personnalisées en y ajoutant des nouveaux outils ou bien des objets.
Les outils de groupware disponibles sont la visioconférence, un agenda, des bases de données, le partage de documents, des outils Web, etc. Mais il est aussi possible d'écrire ses propres outils pour TeamWave grâce à des API groupware.
BSCW [49] signifie Basic Support for Collaborative Work. Il s'agit d'un
système gratuit d'espaces partagés sur le Web, basé sur un serveur sous
Unix (et bientôt sous Windows NT).
Les espaces partagés de BSCW permettent l'envoi de document, la
spécification d'évènement ou le gestion de groupe. On y accède avec un
simple navigateur Web.
Ce système est très simple par rapport aux précédents mais il a l'avantage certain d'utiliser directement le Web comme interface. On pourra ainsi l'utiliser depuis n'importe quel navigateur Web, sur n'importe quelle plate-forme matérielle et n'importe où.
OnLive! Audio Conferencing Server [51] est un système de OnLive!
Technologies qui permet de faire des conférences audio sur Internet et qui
répond à la norme H323 (voir section 5.5.2, p.
pageref).
L'intérêt majeur de ce système par rapport à la téléphonie est qu'il offre la possibilité de tenir des conférences jusqu'à 225 utilisateurs.
Le CSCW Research Department du GMT's FIT institute [52] compte
35 chercheurs qui travaillent sur trois thèmes : Basic Cooperation Support,
Computers as a social medium et Simulation and Data Mining.
Dans le thème Basic Cooperation Support se trouve le projet BSCW (voir
section 15.4, p. pageref) et d'autres projets dont
certains poursuivent ce dernier. C'est de le cas de CoopWWW (BSCW est en fait
son noyau).
CoopWWW propose en plus des activités synchrones et asynchrones (voir
section 15.3, p. pageref), la production de
document distribuée (avec le contrôle de version et la conversion de
format), la décision coopérative, le partage de document (outils écrits
en Java) et l'interface vers divers systèmes.
Dans le thème Computers as a social medium, on trouve comme projet : VR &
CSCW. C'est un projet très récent qui offre encore des travaux aux
étudiants. Son but est de créer des systèmes de CSCW avec une interface
en réalité virtuelle.
A l'heure actuelle, les recherches se font d'une part sur les standards à utiliser (le CSCW Research Department a par exemple proposé des extensions au langage VRML) et d'autre part sur l'intégration de projets de groupware dans une nouvelle interface en réalité virtuelle.
Le Dr David ENGLAND [53] fait partie du département informatique
de l'Université de Liverpool et il fait actuellement des recherches sur les
systèmes de CSCW, sur la réalité virtuelles et sur les interactions
homme-ordinateur.
Il a démarré le 22 juillet 1997, un séminaire virtuel qui se passe dans
la réalité virtuelle. Pour y participer, il faut posséder un navigateur
multi-utilisateur spécial (Community Place Browser de Sony) sur un PC avec
Netscape Navigator sous Windows 95 ou Windows NT. Il faut ensuite s'inscrire
et on peut ouvrir la scène VRML du séminaire. On se retrouve alors dans
un monde virtuel partagé.
Basé sur le projet POLITeam du CSCW Research Department du GMT's FIT institute (voir chapitre 16, p. pageref), on trouve sur la page du Dr David ENGLAND, un bureau de travail virtuel. La scène est composée d'un bureau partagé par les utilisateurs et d'un système de dossiers consultables par les utilisateurs de POLITeam.
Dans ce texte [54], le Dr David ENGLAND montre que l'on peut utiliser
la réalité virtuelle pour faire autre chose que jouer, en l'occurrence
pour travailler, et notamment avec les projets BCSW et POLITeam.
BSCW (voir section 15.4, p. pageref) est un système de
CSCW simple sur le Web. Il nous décrit dans ce texte ce que pourrait être
BSCW-VR, le même outils avec une nouvelle interface en réalité
virtuelle, et il nous explique ce que cela pourrait nous apporter.
Tout d'abord, on peut représenter plus d'attributs des données avec une
troisième dimension. On a les trois axes (x, y, et x), la couleur, la forme
et l'animation. Ensuite, on peut utiliser des métaphores (le bureau par
exemple) pour représenter des concepts. On peut aussi exploiter les
capacités de l'homme à se repérer dans un espace en trois dimensions.
Etc.
Si on utilise au mieux les possibilités de la réalité virtuelle, celle-ci peut nous rendre de grands services dans le travail collaboratif. Dans une discussion, on peut par exemple éclairer le participant qui a la parole et lors d'une manipulation de document partagé, on peut visualiser le déplacement du document et comprendre immédiatement qui est en train de le modifier.
Dans ce document [55], le Dr David ENGLAND nous explique comment
obtenir des mondes virtuels multi-utilisateur avec les spécifications
actuelles de VRML dans le but de faire des applications de CSCW.
Il montre comment étendre les serveurs HTTP et les navigateurs VRML pour que
cela soit possible avec des script CGI et il expose une seconde approche
``Multicast''. Ensuite, il compare les deux méthodes dans les usages des
mondes virtuels pour le CSCW.
Mais, il semblerait qu'avec les nouvelles spécifications de VRML 3.0 ``Living Worlds'' (voir section 7.1, p. pageref), le problème ne se pose plus.
Après avoir fait le point sur la réalité virtuelle et les Nouvelles
Technologies de l'Information et de la communication, nous avons explorer le
Computer Supported Collaborative Work. D'abord d'un point de vue générale,
puis en s'intéssant aux interfaces en réalité virtuelle.
Prendre du recul sur ce dernier thème qui est la cible du sujet de ce
mémoire n'est pas aisé. C'est un domaine très récent et il est
aujourd'hui difficile d'apporter une réponse claire et précise à la
question ``Est-ce l'avenir ?''.
En fait, on trouve beaucoup d'outils de CSCW, mais pour l'instant aucun ne
dispose vraiment d'une interface en rélité virtuelle. Les réalisations
qui proposent ce type d'interface sont encore à l'état de prototype. Mais
les recherches sont bien là et on peut imaginer que la frontière entre les
outils de groupware et les communautés virtuelles en 3D s'effaceront très
vite face à des standards tels que VRML 3.0 et les travaux menés au niveau
des interfaces pour réunir ces deux mondes.
On ne peut pas dire si c'est l'avenir du travail collaboratif, mais on peut
en revanche reveler de fortes tendances qui en dessinent les grandes lignes.
Tout d'abord, on peut noter une première tendance à l'intégration des
outils de CSCW. Les systèmes les plus aboutis (wOrlds, TeamWave) proposent
ce genre d'intégration où tous les outils sont accessibles à partir de
la même interface. Il n'y a qu'un pas (de taille, certes) pour la modifier
et passer en réalité virtuelle.
Ensuite, la tendance Web semble elle aussi très marquée. Elle a fait en
partie le succès de projets tels que BSCW ou CoopWWW. Il faut noter
d'ailleurs que BSCW est utilisé comme noyau pour CoopWWW. On utilise donc
un noyau de CSCW en y appliquant une autre interface. C'est justement ce que
fait le CSCW Research Department du GMT's FIT institute avec la réalité
virtuelle dans son projet VR & CSCW. Les premiers résultats sont attendus
avec impatience.
Qui dit Web, dit VRML et Java. Ces deux technologies ont elles aussi un rôle
capital à jouer dans la ``virtualisation'' du CSCW.
VRML avec sa spécification 3.0 ``Living Worlds'' permettra la navigation
dans des mondes partagés entre les utilisateurs et éliminera de ce fait de
nombreux problèmes techniques. Les recherches en seront alors allégées
et les travaux sur le travail collaboratif plus productifs.
Java comblait les lacunes de VRML. Donc, il reste maintenant à savoir si
l'équation suivante est correcte dans notre contexte :
VRML 2.0 + Java = VRML 3.0 (?)
Cette équation serait probablement correcte pour de simples commautés
virtuelles, mais en fait Java sera certainement utilisé pour la majeur
partie du développement des applications de travail collaboratif qui seront
intégrées dans des interfaces 3D sur le Web.
Le langage Java devrait donc continuer à connaître le succès qu'il rencontre actuellement en rencontrant ce nouveau domaine qu'est le CSCW-3D. Mais comme le fait VRML 3.0, Java devra vite corriger ses défauts de jeunesse pour ne pas rebuter les développeurs.
1 Etudiant faisant une thèse à l'UTC
2 Union Internationale des Télécommunications
3 Ecole Polytechnique de Lausanne
4 Nancy K. BAYM, The emergence of community in computer-mediated communication, p. 138
5 Ecole Polytechnique de Lausanne