Pour une évolution majeure du format des nouvelles
qui s'appellerait, par exemple le NXML, News XML
Ce document est constitué de deux parties, écrites à un mois d'intervalle (janvier et février 1999). La première (Exposé) se veut technique et objective, la seconde (Réticences) exprime subjectivement mon point de vue face aux réactions rencontrées par ce projet.
Version 2.12 23/2/99 8 h
Sommaire
1. Exposé
1A. Introduction
Lire ou écrire un article d'un forum n'est pas aujourd'hui analogue à la lecture et l'écriture habituelle d'un article par traitement de texte, en voici les principales raisons.
- Pour la plupart des logiciels lecteurs, les lignes du textes ne sont pas plus longues que 80 caractères. En conséquence, le texte ne s'adapte pas à la largeur de la fenêtre qui le contient.
- Le formatage des caractères (gras, italique...) est inexistant dans la plupart des logiciels.
- Une symbolique rudimentaire permet de distinguer les éléments principaux de formatage, ">", ">>" pour les citations, parfois "*...*" pour la mise en gras; "/.../" pour l'italique.
- Certains messages sont affichés de façon tellement atrophiée (par exemple présences de lignes de moins de 40 caractères), que la lecture en devient difficile.
Nous allons voir qu'un tel état de faits a des raisons historiques, nous allons montré que, plus que les logiciels et les utilisateurs, les formats et formatages utilisés sont en cause, ce qui nous permettra, ensuite, de conclure.
1B. Historique
- 1B1. Débuts
Usenet commence en 1979. Les messages de ses forums sont véhiculés à travers un format très simple constitué de lignes de 80 carcatères, ce qui correspondait à la largeur des écrans en mode texte d'alors.
Ce format est toujours le seul à être utilisé sur Usenet fr.*. Toutefois, si le source véhiculé est identique, il n'en demeure pas moins que des symboles de formatages, inexistants en 1979, sont désormais véhiculés.
- 1B2. Nouveaux formatages
Les plus répandus de ces symboles sont ">" et ">>" qui permettent de reconnaître ces citations. On remarquera que dans le texte de présentation GNKSA de ce format (http://prope.insa-lyon.fr/miroirs/usenet-fr.news.eu.org/fr-chartes/gnks
a.html), il n'est pas encore question de ces symboles en 1995 (alors qu'ils existaient déjà ; ils y ont été introduits depuis).
Parallèlement est apparu en 1996, avec les versions 3 de Netscape et Internet Explorer, le format HTML calqué sur celui des pages Web. Il enlevait, notamment, la coupure des lignes à 80 caractères, mais apportait un certain nombres d'inconvénients qui le fit rejeter, notamment, des forums Usenet fr.*. Il est couramment employé dans les forums microsoft.* et dans certains forums alt.*, où il cohabite avec le format texte, qui reste prédominant.
Le format "texte coupé" fut alors utilisé au maximum de ses possibilités par quelques logiciels, notamment Gnus, afin de recoller les lignes coupées et de colorier les citations, ce qui, comme le HTML, permet une visualisation plus habituelle des textes (par rapport aux éditeurs de texte graphiques).
Nous distinguerons dans ce texte le format/formatage d'origine, que nous appellerons "Texte coupé" et le même format (au sens strict du mot) enrichi de symboles, avec le recollage et coloriage des lignes, que nous appellerons "Texte amélioré". Il s'agit d'un formatage, plus que d'un format. Toutefois, ses utilisateurs en arrivent à oublier des symboles tels que ">", ">>", "*", gérés de façon cachée, et, en cela, on peut estimer qu'il s'agit d'un format différent de celui de 1979.
- 1B3. Confusion
Les formatages "Texte coupé" et "Texte améliorés" travaillant sur le même source, leur compréhension par les logiciels s'avère très disparate. L'absence d'un symbole peut-être très accessoire chez l'un et peut casser le coloriage de citation chez l'autre. De plus, les utilisateurs qui passent du "HTML" au "Texte" (coupé ou amélioré), ou réciproquement, le font souvent de façon confuse, simplement, souvent, pour éviter des manipulations ou par leur méconnaissance.
Comme il semble peu probable que les éditeurs de logiciel utilisent de la même façon un format à la fois "texte coupé" et "texte amélioré" (lequel n'est défini par aucun texte reconnu de tous), comme il est peu probable que l'on puisse éduquer les utilisateurs à respecter scrupuleusement des symboles situés au milieu de leur texte, une évolution vers un nouveau standard peut apparaître comme une excellente chose.
1C. Formatage "Texte coupé"
- 1C1. Avantages
- Il est condensé, ce qui permet son acheminement rapide à travers le réseau.
- A cause de son ancienneté, il est lisible par tous les lociciels lecteurs.
- 1C2. Inconvénients
- Les lignes apparaissent coupées (80 caractères maxi) et ne s'adaptent pas à la largeur de l'écran graphique. Toutefois, le texte, en mode création, n'est pas coupé.
- Quand on modifie le texte (après sauvegarde ayant coupée les lignes), les corrections sont fastidieuses, car insérer un mot dans une ligne existante revient à la faire déborder des 80 caractères. Il faut alors réordonnancer en cascade toutes les fins de lignes (peu de programmes ont une routine permettant de l'automatiser).
- Commencer une citation en milieu de ligne procoque la création d'une demi-ligne, à moins d'effectuer le fastidieux réordonnancement en cascade des fins de ligne.
- Le texte n'a qu'un formatage basique (pas de gras, d'indentation...).
1D. Formatage "HTML"
- 1D1. Avantages
- Il bénéficie d'un riche formatage du texte, à commencer pas des lignes qui ne sont pas coupées.
- Il apparaît très adapté à certains types de forums, notamment ceux faisant appel à des images et/ou du son (ne concerne pas la hiérarchie fr.*). Ou des tableaux statistiques (que le format texte le permet, de façon plus rigide, avec une police non proportionnelle).
- 1D2. Inconvénients
- Les messages sont trois fois plus gros, en moyenne, qu'un format texte (coupé ou amélioré). D'où encombrement et lenteur d'acheminement.
- Le format HTML est trop riche, ce qui laisse la porte ouverte à des abus, le plus important étant le postage d'images (ce qui augmente sensiblement le facteur 3 présenté ci-avant, qui est seulement appliquable à des textes formatés simplement).
- Tous les logiciels lecteurs ne lisent pas les messages à ce format. Toutefois, il y en a peu, car le source en texte brut est généralement transporté avec le source HTML (ce qui explique le facteur de 3...). Ce sont donc, davantage, les deux inconvénients précédemment cités qui sont apparus rédhibitoires à la communauté Usenet fr.*, laquelle a mis en place des moteurs qui rejettent les messages formatés en HTML.
- Il est difficile de moduler l'usage du HTML selon les types de forums (ceux considérés comme étant "multimédia" et autres. Il est plus simple de mettre en place une interdiction globale.
- Le HTML est inadapté pour le traitement des citations (tout du moins dans sa version 3.2, qui ne contient pas une balise de type <QUOTE> qui pourrait convenir).
1E. Formatage "Texte amélioré"
- 1E1. Avantages
- En lecture et écriture, il permet de traiter le texte comme dans un traitement de texte classique, avec pour formatage les citations, le gras, l'italique, le soulignement et la signature (ainsi que les URL aussi prise en compte par les autres formats).
- Les messages générés reposent sur un source du même type que le "texte coupé", ce qui permet sa lecture par tous les logiciels lecteurs.
- Pour la même raison, les messages sont aussi condensés que le "texte coupé".
- 1E2. Inconvénients
- Très peu de logiciels, en 1999, utilisent ce formatage et ce ne sont pas les plus utilisés(Gnus, Outlook Express 4.5 pour Macintosh avec complément...).
- Le formatage reste relativement rudimentaire. En particulier l'indentation des lignes n'est pas traité.
- Le recollage des lignes est délicat et peut ne pas être fidèle à ce qu'avait voulu l'auteur du texte. Il est en particulier difficile de distinguer un "vrai" passage à la ligne, après une fin de phrase située en fin de ligne, de deux phrases se continuant sur la même ligne.
- Les symboles de formatage du source sont modifiables par les utilisateurs de logiciels travaillant en "texte coupé". Ils peuvent donc modifier leur arrangement (par exemple en réorganisant des lignes trop longues), ce qui restitue un texte mal formatés. Les utilisateurs de tels logiciels peuvent alors être vindicatifs sur la destruction de leur formatage.
- Aucun texte de référence ne réglemente cette utilisation du format de 1979, enrichi de symboles. Sa généralisation rapide semble donc exclue.
1F. Nouveau formatage
- 1F1. Principes
Compte tenu de la confusion qui a été décrite, l'utilisation d'un nouveau format est naturellement à envisager. Or il s'avère qu'il en existent qui peuvent être retenus. Deux ont été évoqués sur le forum fr.usenet.divers, sans qu'y soient dénoncés des inconvénients majeurs. Ce sont le OOB SGML définis sur la page http://www.templetons.com/brad/oob.txt, et le XML, dans des spécifications qui restent à précisés (le XML étant une variante du SGML).
Tous les deux reposent sur le principe de conserver la partie texte actuelle, en lui rajoutant une partie de formatage, dans une nouvelle partie du message multi-part. Autant qu'un nouveau format, on peut donc considérer qu'il s'agit d'une évolution du format de 1979.
- 1F2. Exemple
Cette exemple provient de la page OOB SGML citée ci-dessus, avec quelques arrangements (il ne s'agit pas de préciser le formatage, mais d'en montrer un principe).
- 1F3. Formatage logique
Plutôt qu'un formatage physique (gras, italique, police, couleur...) , c'est un formatage logique qui est préconisé : ceci est un titre, est un paragraphe, est important, est une référence bibliographique, doit être représenté tel quel...
Ce sont les logiciels lecteurs qui feraient, de façon paramétrable, un rapprochement entre formatage logique et physique (ex: important --> gras).
- 1F4. Avantages
- La taille du message subit un accroissement faible. Peut-être pas aussi faible que ne l'indique l'auteur du OOB SGML (2%), mais 5% semble raisonnable.
- Le message en format texte reste présent et du même type que celui existant (conservation des symboles).
- Le formatage du texte peut être plus riche que celui du "texte amélioré", notamment en ce qui concerne les indentations et numérotations de paragraphes (correspondance avec les balises <UL>, <OL>, <LI>).
- La cohabitation avec les logiciels de formatage en texte "amélioré" apparaît simple avec des processus d'interprétation d'un format à l'autre (hormis les formatages ignorés par le "texte amélioré").
- Comme avec le "texte amélioré", mais de façon plus complexe, la cohabitation avec les messages HTML pourra être renforcée par des processus de "traduction". Au pire le passage de l'un à l'autre s'appuiera seulement sur la partie texte du message.
- Les passerelles avec les textes formatés (RTF, HTML) permettront de conserver l'essentiel de la mise en forme du texte.
- L'actuelle évolution des logiciels libres (notamment avec le parti qu'en a pris Netscape) est favorable pour le lancement et l'adoption d'une nouvelle norme.
- Si ce format est précisémment décrit et fait l'objet d'une norme (RFC) auxquels se conforment les logiciels, les éléments seront en place pour sortir de l'actuelle confusion.
- 1F5. Inconvénients
- C'est une évolution. Bien que ce soit une règle générale dans l'informatique pour sortir d'une situation confuse, cela comporte des risques (mésentente sur le format à choisir, difficulté de mise en oeuvre, de propagation, effets pervers etc.)
- La cohabitation avec le "texte coupé" (à symboles "améliorés" modifiables) sera du même ordre que l'actuelle cohabitation entre celui-ci et le "texte amélioré", donc pas très facile.
- Il y a le risque d'ouvrir la porte à un formatage qui s'enrichira de gadgets, au delà de la structuration du texte lui-même. Toutefois l'exemple ci-dessus montre que la façon de mémoriser le formatage ne permet pas de définir des formatages aussi riches qu'en HTML.
- La présence du formatage dans une nouvelle partie du message multi-part peut poser problème à de vieux logiciels lecteurs. Il est envisageable de corriger le message par logiciel serveur ou client amont.
1G. Conclusion
A moins qu'une véritable norme de "texte amélioré" ne voit le jour et permette rapidement d'éliminer le "formatage coupé", à moins que des inconvénients techniques apparaissent dans la définition et la mise en place du nouveau format, à moins qu'un consensus ne se fasse pas sur ses caractéristiques techniques, il est souhaitable que le format de 1979 subisse une évolution majeure qui adjoigne à son texte un formatage adapté au confort des logiciels que nous utilisons en mode graphique.
2. Réticences
2A. Débat difficile
Avant d'évoquer le débat qui a eu lieu, il convient de rappeler que ça a commencé quand un dinosaure m'a viré (transféré) d'un forum vers vers celui des dinos (fr.usenet.divers), parce qu'il estimait que je formattais mal mes messages. Je me suis rebiffé en disant que mon formatage était très bon pour la majorité des usenautes, ceux qui utilisent Netscape-Messenger et Microsoft-Otlook-Express (70% sur fr.rec.arts.bd, d'après un rapide sondage que j'avais fait). Que n'avais-je point dit là ! Formater pour ces logiciels pourris était ignomineux, alors que la crême des logiciels faisait ça merveilleusement sous Unix/Linux ! Même qu'il y a de la couleur, que les lignes sont recollées... Ouah, j'étais vraiment nul...
J'ai discuté un peu pour dire que tout le monde pouvait aller vers de tels logiciels comme ça, que le conflit entre le format texte et le format Html ne menait à rien, parce que ces deux formats étaient mal fichus. Et c'est là que j'ai commencé à prôner un nouveau format... M'enfin, les dinosaures ce sont eux qui gèrent le Usenet français, ils ont l'expérience, et puisque tout est bien pour eux...
C'était en décembre. Un mois plus tard, je vois un dinosaure qui en engueule un autre parce que son texte était mal formaté... Là, j'ai été héberlué, j'avais compris que tout était super avec leur "Gnu-Emacs" qui coloriait et recollait... Eh ben non, il fallait parfois faire des manips pour aider à recoller... C'est là que je suis revenu en leur disant "Salut les Shadocks !", faudrait voir à ne pas refuser de faire simple quand vous faites compliqué ! Craac, ils me sont encore tombés sur le dos en me montrant une "mini-FAQ" qui disait que le format Html (celui des méchants Microsoft et Netscape) étaient abominable, mais qui ne disait rien du tout des lacunes et complications du format "texte coupé" de 1979...
Alors comme je n'étais pas d'accord du tout avec ce texte, ils m'ont demandé d'y participer ou de faire une FAQ moi aussi. J'ai dit chiche ! Et j'ai fait un super truc. J'ai d'abord approfondi ce qui se passait, j'ai trouvé dans la mini-FAQ Html deux adresses qui m'ont permis de savoir qu'il était possible de mettre en place un nouveau format qui avait plein d'avantages et qui était compatible avec le cher format "texte coupé" des dinosaures. C'en était même une évolution.
Mon texte, avant tout technique (c'est l'exposé qui est présenté ci-avant), rencontra peu d'opposition technique. Mais davantage de la mauvaise volonté...
2B. Florilège
Pour mieux comprendre les échanges qui ont eu lieu, voici quelques propos de dinosaures (appelés aussi barbus, certains appartenant au "Canal Usenet Historique"...).
- Quel confort? Quels logiciels graphiques? Écrire un si long texte et attendre la conclusion pour y introduire de nouveaux concepts, c'est gaché. Pendant que j'y pense, ce serait bien de ne pas mettre de texte 8 bits dans les en-têtes...
--(celui-là, il me reprochait (dans son langage) d'avoir mis des accents dans mon titre !)
- Permettre aux gens de formatter au petit bonheur leur texte implique que les gros lecteurs (les habitués des groupes et autres dinos) vont perdre un peu plus de temps alors que je considère que ce sont les personnes à qui il faut faciliter la vie (ce sont eux qui font vivre un groupe).
- Arrêtez de vous regarder le nombril et pensez à tous ceux qui ne veulent ou ne peuvent pas utiliser un logiciel « graphique » (le terme est déjà absurde). Vous donnez une « solution » à un problème qui n'existe pas (sauf peut-être pour vous). J'utilise un lecteur en mode texte et je refuse d'utiliser un browser ouèbe pour lire des articles.
- En quoi le fait de vouloir ou pouvoir reformatter un texte a-t-il rapport avec un mode graphique ou pas ??? Vous avez déjà vu Lynx ? C'est un navigateur ouèbe en mode texte...
- Les gens qui lisent les news (et qui y postent), *ici*, c'est des babasseurs. Des gens qui utilisent des logiciels rapides et performants et pas des usines à gaz avec des icônes qui chantent et qui dansent dans tous les coins. Les gens qui lisent leur courrier avec Netscape ne connaissent pas l'existence des forums de discussion (malgré une campagne de pub assez musclée).
Il est bien évident que *je suis conscient* que ces chiffres sont locaux. Mais le principe me semble applicable : peut-être que je ne lis pas les bons forums, mais sur chacun de ceux que je lis je ne vois pas une hénooorme quantité de posteurs. Qu'on se rende à l'évidence :
M. X, qui s'abonne à Internet, se moque comme de la sandalette gauche de Moïse des forums de discussion. Il veut le ouèbe, il accepte le courrier électronique, mais il n'a que faire des news. Usenet est quand même un peu un monde de dinosaures, ou au moins d'initiés.
- vos "arguments" sont aussi techniques que ceux exposés dans les pubs pour lessive ou pour crêmes qui-transforment-en-mannequin-suédois.
- désolé d'introduire un peu de réalité dans le conte de fées qui te tient lieu de pensée, mais tu es un abruti fini.
- Tu peux râler auprès de Netscape ou de Microsoft pour que leurs logiciels fassent correctement le boulot pour lequel ils sont vendus, mais les autres informaticiens ne te doive ne te doivent strictement rien.
-- (ici, un dinosaure, par mégarde indique qu'il fait des manipulations (M-q) pour formater son texte. Ce genre de truc est tellement naturel chez eux qu'ils oublient qu'ils le font et croient que ça ne peut être que naturel aussi chez les autres)
Au fait, j'ai utilisé trois fois M-q en écrivant ce message, pour reformater les citations pour éviter de les commencer par une ligne trop courte. C'est tout.
- Mais dites... Vous n'avez pas l'impression depuis le début de cette discussion complètement stérile qu'il n'y a que vous qui désirez vous battre contre ces standards préalablement établis par des personnes qui ont conçu Usenet bien avant que vous n'y mettiez les pieds ???
- Le fait d'avoir à intervenir dans les citations (pour recouper les lignes) me paraît plutôt une bonne chose. Et justement parce qu'il est un peu agaçant de recoller des bouts de phrases, on peut espérer que ça oblige (oui, "oblige", je sais c'est pas facile et agréable) à plus de soin et de réflexion quand on rédige des réponses.
-- (lui, c'est Cédric, un pote, une sorte de renégat des dinosaures qui s'est battu avec eux il y a longtemps et qui est revenu pour me soutenir, y'en a aussi trois au quatre autres qui ont compris ce que je voulais dire et qui ont été en mon sens)
Je n'en reviens pas de devoir démontrer que la majorite des posteurs de Usenet n'utilisent pas un lecteur en mode texte...
(ces messages proviennent des enfilades "Salut les Shadocks !", "Nouvelle mini-FAQ: le HTML dans les new" de début janvier, "Pour une évolution majeure du format des nouvelles [long]" et "NXML [Re: Nouveaux formats]" de fin janvier, ils sont consultables sur le site Dejanews>. Le 20 février 1999, un message "Format de news et logique d'élite" a été posté, en guise de conclusion)
2C. Logique d'élite
Alors qu'avant d'avoir présenté ce texte, on me reprochait de parler et de ne rien faire , on me reproche, après, de "vouloir faire quelque chose"... Si on semble me prendre un peu plus au sérieux du point de vue technique, si je reçois un certain soutien, surtout Cédric et John (en direct des USAà), c'est sur un autre plan qu'on enlise le débat. Pour les dinosaures, tout ça n'est pas bien sérieux, car ça ne vise qu'à faciliter la vie des adeptes d'interfaces graphiques (Windows, Mac, X-Window...), alors que ce qui prime dans les news, c'est le texte.
Ils s'entendent sur le fait qu'il faut que la vie soit dure sur les forums, et qu'il faut garder ce format rugueux (et son pendant mal fichu, le Html) comme une barrière, pour ne pas que les "abêtis" viennent trop nombreux.
Bref, à part Cédric qui n'a pas trop le temps, personne n'a voulu être moteur dans la mise en place du nouveau format. Et comme je n'y connais rien dans leurs habitudes formelles, et que c'est tout de même pas facile (faut convaincre les autres Usenet nationaux etc), eh bien j'ai laisse tomber, bien sûr...
J'aurais certes pu insister, montrer ces dessinateurs de BD qui essayent de participer au forum sur la BD et qui ont des difficultés à cause de problème de format (« Hé, les mecs, quand vous achetez nos albums, c'est facile à lire, même pour des %%+%+=: d'informaticiens, alors démerdez vous pour que lorsqu'on vient chez vous, dans vos ::;k;=:=:; d'ordinateurs, ce soit facile aussi, sinon on viendra plus, na! »). Mais, les dinos diront que c'est encore la faute à Microsoft et Netscape. Y'en a marre de tourner ça toujours en guégerre contre les méchants logiciels commerciaux qui font les choses de façon dégueulasse (selon leur point de vue). Y'en a marre de cette gueguerre qui dure depuis 3 ans (date de l'apparition du format Html dans les news), sans qu'une amélioration ne puisse être crédible. Pourtant, ça embête tous les novices et même les habitués, ceux qui ne sont pas compétents en informatiques mais qui le sont dans d'autres domaines...
J'ai montré qu'un nouveau format peut naître et que les conditions sont plutôt favorables à ce qu'il emporte un consensus et relègue les deux formats existants. Aucun dinosaure n'a été capable d'argumenter solidement contre mes propos ! On en peut pas les obliger à bouger, ils ne nous doivent rien, c'est évident. Mais ils pourraient au moins montrer de la compréhension, de la solidarité envers la nouvelle et immense vague des internautes qui arrive depuis deux ans.
Parallèlement, le n°168 de SVM (février 1999) montre un sondage qui est ainsi commenté : « Demandez aux français qui n'utilisent pas Internet si on va tous devoir se mettre à l'informatique, la réponse est unanime : 93% disent oui. Posez la même question aux internautes. Pour eux aussi, mais à 40%... Logique d'élite qui reviendrait à dire que les bonheurs de l'informatique, il faut vraiment les mériter et tant pis pour les autres ? »
J'estime que c'est cette logique qui n'a pas permis de lancer un nouveau format qui rendrait l'utilisation des forums plus simple pour tous.
Alain Beyrand, les 17 janvier et 20 février 1999