Une idée en chemin sur un demi-siècle

De la subjectivité à l’ objectivité partagée
samedi 13 décembre 2008
par  Jean-François Doucet
popularité : 13%

Bien souvent, l’ apparition d’idées dans les institutions de production de connaissances (Universités, Grande Ecole, Instituts etc) apparait fortuite à l’observateur superficiel. Or, pour qu’une idée, qui s’exprime sous forme d’organisations signifiantes nouvelles, fasse son chemin jusqu’à sa mise en oeuvre réelle, de nombreuses années obscures sont nécessaires. Un exemple est ici donné du cheminement d’un souhait durant un demi-siècle.

Tout commence dans les années 60

Un jeune lycéen souhaite qu’on puisse un jour obtenir par une simple commande la réponse à une question telle que : "Quelles sont les villes francaises de plus de 10000 habitants". Sans que les machines de traitement électronique du signal soient encore répandues dans le grand public - nous sommes alors dans les années soixante [1] - il pense que si l’ on enregistre toutes les villes francaises et leur nombre d’ habitants, - une liste doit bien se trouver quelque part, pense-t-il alors - on pourra trier facilement celles qui ont plus de 10.000 habitants. Il rêve de presser sur un bouton pour obtenir le tri mais à cette époque, l’information est loin d’être disponible comme l’électricité de nos jours de telle sorte que son accès est réservée à une élite disposant des ressources nécessaires. C’ est la belle époque des bibliothèques et des centres de documentations et des méthodes artisanales ou manuelles de tri.

Le jeune lycéen fait des études scientifiques mais son goût va tout autant à l’étude des langues au point qu’il obtiendra une bourse pour un cours d’été dans une université allemande. Une fois entré dans une grande école francaise, il cultive son penchant pour les langues par des stages à l’étranger. Finalement il s’expatriera à la fois pour apprendre une langue à fond et pour se confronter à une autre culture que la sienne propre.

Mots ou chiffres ? (dans les années 70)

Mais revenons à cette période où le jeune élève d’une grande école francaise s’intéresse à la fois aux langues et au savoir scientifique : lors d’un stage en entreprise, il lui est demandé de rassembler des documents pour une équipe de planification dans les pays en voie de développement. Il prend alors conscience dans le processus de décision de l’ importance des données fiables. Il entre pour la première fois en contact avec le traitement électronique des données utilisées pour la planification d’usines livrées clef-en-main. Un peu plus tard, dans un département de l’école dont il sort diplomé, une étude de faisabilité d’une banque de données lui est confiée. Il s’ engage alors dans l’étude de l’informatique documentaire. [2] Nous sommes dans les années 70 où les opérations de tri, en particulier de documents, sont longues et fastidieuses. Quelques systèmes de tri de documents sont mis au point comme les aiguilles fichées dans des cartes perforées pour trier des données organisées en matrices. Mais le fichier typique des centres de documentation et des bibliothèques est constitué, pour quelque temps encore, de 2 registres : le fichier "Auteurs" et le fichier "Matières".

JPEG - 2.2 ko
l’âge d’or des cartothèques
Les fichiers "auteurs" et matières " représentation des livres s’alignaient dans les couloirs des bibliothèques

Ainsi chaque document est enregistré dans ces 2 fichiers pour, dans une bibliothèque ou un centre de documentation, pouvoir être consulté facilement. Naturellement l’ informatique documentaire apportera des possibilités nouvelles dans cette organisation simple des documents. Grâce à la capacité de traitement des signaux électroniques, les 2 fichiers " Auteurs " et "Matières" consignés sur fiches de bristol, une fois enregistrés sur des machines électroniques pourront être consultés par d’autres entrées. L’utilisation de l’ enregistrement électronique rend possible une organisation plus souple - et le tri ultérieur - de données comme les villes d’éditions des livres, les annexes bibliographiques etc. Pour décrire les documents, il existe non plus seulement les "auteurs" et les " matières" mais aussi les mots-clefs qui peuvent cerner le contenu du document. De plus, le développement de l’ algèbre de Boole permet des recherches bien plus fines des documents que la simple consultation des "auteurs" ou des "matières". Avec la technologie récente des banques de données, on peut affiner quasiment à l’ infini les recherches documentaires et demander, par exemple, à une collection de documents non plus seulement la liste des villes francaises de plus de 10 000 habitants mais tous les documents dont les titres contiennent un nom de ville particulier (par ex. Paris) ou bien les livres traitant plus généralement des villes francaises. Avec l’informatique documentaire, deux monstres sont nés : les classifications ( plus ou moins universelles pour toutes les connaissances) et les thésaurus. Les classifications répondent au besoin de classer AVANT les documents dans une hiérarchie préétablie. Dans les thésaurus, les relations entre les mots qui décrivent les documents sont répertoriées de manière à ajuster APRES la formulation de la demande d’un utilisateur aux descriptions des documents enregistrés dans la collection.

JPEG - 4.2 ko
Une propriété des langues de pouvoir se décrire elles-mêmes
Un livre (ici planté au beau milieu de la collection ) peut décrire en abrégeant d’autres livres

L’existence de ces 2 monstres de l’informatique documentaire introduit le jeune ingénieur d’étude dans les propriétés des langues de se décrire elles-mêmes (on peut parler d’une langue comme on indexe un document) et de ne jamais décrire de manière bi-univoque les objets quelle évoque quelque soit la précision des descripteurs. De plus, il est confronté, non pas à la différence entre théorie et pratique, mais à la différence entre contenu et contenant de la banque de données qu’il planifie.

Dans une université allemande

Un voyage dans une université allemande lui fera connaître une figure pouvant complèter son étude de faisabilité : un chercheur décrit par ses collègues comme difficile mesure des grandeurs physiques précieuses pour les travaux de laboratoires de ses collègues. C’ est une figure très appréciée pour ne pas dire courtisée dans le milieu puisqu’il fournit les données souvent fastidieuses à obtenir par mesure en laboratoire. Au milieu des chercheurs théorisant quasiment à l’infini, c’ est un homme de pratique mais dont les travaux sont de portée très générale. Le jeune ingénieur constate à l’étranger l’attrait des connaissances utilisables, les grandes écoles francaises n’étant pas nécessairement concentrées sur l’utile. Elles s’intéressent également à l’ agréable suivant ainsi le précepte de Th. Gautier " En général dès qu’une chose devient utile, elle cesse d’être belle ". [3] et fait l’objet d’une publication scientifique.

Obtenir les documents eux mêmes

A cette époque, s’il était (relativement) aisé d’obtenir des références bibliographiques au travers des réseaux de banques de données, les documents eux-mêmes étaient plus difficiles d’accès. Aussi le jeune ingénieur, après son expatriation pensait, pour lui-même, non pas à une banque de données bibliographiques mais à une banque de citations. Ainsi, sans les documents eux-mêmes, les citations extraites des documents pouvaient, sans l’aide de résumés, guider le chercheur dans la masse d’informations disponibles. Pour compléter son étude de la recherche et du stockage des documents, le jeune ingénieur envisage l’utilisation des erreurs introduites par l’utilisation de la langue pour l’indexation des documents. Ces erreurs inévitables, pensait-il, faute de pouvoir être réduites pouvaient inspirer le chercheur à plus d’imagination. Pour complèter son tour d’horizon de la recherche et du tri des documents, il aborde la recherche intuitive des informations dans l’atmosphère si caractéristique des bibliothèques. Il aborde ainsi la découverte "par un heureux hasard " [4] De retour en France pour une courte période, il monte un département de documentation scientifique et technique qui profite du prodigieux développements des Sciences de l’Information. En particulier, il exprime son enthousiasme dans une publication internationale de voir l’information devenir dans un proche avenir aussi disponible que l’électricité. Il ne pensait pas alors que son rêve deviendrait réalité plus vite qu’il ne le pensait ! Un autre aspect de l’ informatique documentaire était apparu lorsque les banques de données se développaient au cours des années 80. Les langages dans lesquels étaient indexés les documents ne correspondaient pas à ceux des demandeurs d’information. La question, souvent, pour recevoir une réponse pertinente devait être traduite dans le langage utilisé lors de l’ indexation des documents. Dans ces conditions, le rêve de tous les documentalistes était l’interrogation de leurs banques en langue naturelle, une sorte de terre promise qui perdure dans cet espoir de parler aux machines de traitement du signal comme à un être humain. Naturellement les années 80 allaient balayer toutes ces difficultés en réduisant considérablement la part indexée des documents et donc l’intervention humaine. [5] [6] Désormais, la capacité grandissante des mémoires électroniques permettaient de numériser le texte d’un document entier et non plus seulement les caractéristiques bibliographiques. L’ apparition de liens hypertextes portait alors le coup de grâce aux systèmes de documentation traditionnels.

Dans une université norvégienne

Malgré le développement d’outils informatiques incomparablement plus performants, organiser des collections de données sous forme de banque restait subordonné aux caractéristiques linguistiques utilisées. Il existait toujours une différence entre la collection de données et la représentation que les systèmes informatiques en donnait pour la consultation. Cela quelque soit la minutie des enregistrements ou la rigueur des outils informatiques adoptés. Somme toute, le problème des stocks gérés par ordinateurs dont le nombre de pièces ne correspond jamais tout à fait aux informations enregistrées en mémoires des machines restait irrésolu parce qu’insoluble. Dans une collection donnée, il existait toujours des redondances tandis que certaines données échappait à l’ enregistrement : [7] Cette caractéristique des grandes collections de devoir offrir sur l’ autel de l’ordre une certaine perte d’information est particulièrement visible sur la banque de données mycologiques dont la constitution est confiée à notre ingénieur d’étude. Il écrit alors l’ analogie :

livre = échantillon de champignons

JPEG - 2.5 ko
Un champignon_commun
Un champignon commun parmi le million d’espèces inconnues

=

JPEG - 2.7 ko
Un livre : objet de collection
Les représentations codifiées des livres ou documents sont l objet des banques de données

et applique les mêmes principes pour constituer la banque de données. Autrement dit, champignons et livres sont objets de collections.

JPEG - 3.4 ko
Collection de livres
Livres et champignons ont en commun d’ être objet de collections

=

JPEG - 6.1 ko
Quelques champignons connus
Livres et champignons sont analogues pour être objets de banques de données

L’analogie s’écrit alors : "Les bibliothèques sont aux herbariums mycologiques ce que les livres sont aux champignons"

JPEG - 237.1 ko
Herbarium mycologique
A la différence des livres, les champignons changent souvent de noms

Mais à la différence des livres, les champignons sont des organismes vivants dont une représentation est donnée par le mycologue. De plus, le règne des champignons, nouvellement crée met la mycologie dans une position de pionnière. Plus de 90 % des champignons de la planète sont encore à découvrir - à cet égard, on connait certainement mieux les étoiles dans le ciel que les champignons sur terre - et les quelques centaines d’espèces connues du grand public ne représentent qu’une faible quantité par rapport aux (environ) 70.000 espèces connues des mycologues. C’est dire que l’incertitude régnant en mycologie oblige à de nombreuses révisions après d’âpres discussions dans les commissions de taxonomie guidées par la cladistique. Dans ces conditions, les collections de spécimens des banques de données mycologiques, tirent un bien plus grand profit des programmes de traitements électroniques de données que les bibliothèques peu enclines à changer les enregistrements des livres. L’utilisation de l’informatique a rendu possible l’enregistrement des nombreuses révisions ainsi que des méthodes de détermination des espèces par les scientifiques. Le prix à payer, toutefois, de la gestion améliorée des grandes collections est une certaine incertitude. La collection physique des spécimens n’ est jamais enregistrée exhaustivement de telle sorte que certains spécimens demeurent invisibles aux recherches ultérieures. Il existe d’autre part des spécimens enregistrés plusieurs fois (doublets) et quelques spécimens correctement enregistrés sont irrémédiablement perdus parce que remisés à une autre place que la leur. [8] [9]

Des champignons aux rats de laboratoire

Une autre tâche allait être confiée à cet ingénieur maintenant confirmé :
des livres pure mémoire papier de connaissances aux champignons matière vivante observable, il lui était donner de passer à des collections de données expérimentales.

JPEG - 3.9 ko
Données expérimentales
Des champignons aux rats génétiquement modifiés

Ainsi, l’ingénieur confirmé se voyait confier la tâche d’organiser les données d’un laboratoire expérimentant sur les rats. Au contraire des banques de données précédentes, la banque de données était à bâtir à l’ aide de chiffres expérimentaux mesurés après différentes injections. Contrairement aux champignons également, où les données sont fournies par les observations des mycologues, les données sur les rats sont le résultat d’ un montage expérimental dynamique concu par un savant où il s’ agit de détecter des relations entre les différentes variables mis en scènes après géométrisation de la réalité.

JPEG - 1.5 ko
Expérimentation sur les rats
Des rats transgéniques fournissent des données numériques transposables aux humains

Est-ce la question sous-jacente du modèle expérimental mis en place sur des rats dans l’ impossibilité d’ expérimenter sur des humains qui inspire alors à l’ ingénieur d’étude ? Ou bien la relation sujet/objet qui avait déjà été mise en question depuis des décennies ? Ou bien encore la méthode scientifique elle-même garante des découvertes ? Nul ne peut le dire avec certitude, mais la situation expérimentale lui rappelle celle du chercheur allemand produisant des données également expérimentales.

Chercheur allemand

=

expérimentateur norvégien

De plus, les sommes consacrées aux animaux génétiquement modifiés lui font penser à épargner les animaux. Une simple critique également, lui fait entrevoir l’importance des outils de calculs sur la méthode de recherche elle-même . [10]

JPEG - 201 ko
Expérimentation sur les rats
Après géométrisation de la réalité, une expérimentation fournit des données pour la banque

Par un heureux hasard, l’ Université norvégienne développait des modèles mathématiques de simulation susceptibles de pallier un autre manquement. Bien des découvertes scientifiques, en effet, ont pour origine une anomalie dûement constatée par le savant : or le protocole expérimental correspondait, à première vue, à la répétition si rigoureuse de conditions expérimentales qu’ aucune anomalie ne pouvait s’immiscer dans le dispositif et ainsi stimuler l’ imagination, seule capable de laisser apparaître des voies nouvelles d’approches du problème et ainsi ouvrir à une réponse possible à la question posée. De plus, l’équipe de recherche, loin de la masse critique en nombre et en qualité de chercheurs, n’avait aucune chance de trouver une réponse à cette énigme. L’espoir d’obtenir des résultats engloutissait des sommes considérables dépensées en (presque) pure perte.

JPEG - 69.8 ko
Dispositif expérimental
Après géométrisation de la réalité, un dispositif expérimental est mis en place

Dans ces conditions, un objectif " a minima " devenait plus réaliste et moins prétentieux à atteindre si l’ on préparait les données susceptibles de donner la réponse à la question posée par les expérimentations. Un peu comme si, dans l’impossibilité de trouver la réponse, on pouvait offrir sur un plateau les données bien organisées à celui qui voudrait bien - et pourrait - les exploiter. Il devrait alors poser la question des relations entre les données expérimentales et l’objet de l’expérience, en l’occurence les rats auxquels la science arrachent les secrets de la physiologie humaine.

Mots_clés : Analogie, Vécu créatif


Ainsi, pour qu’un souhait d’adolescent de pouvoir trier des listes sur de multiples critères de sélection soit réalisé, un demi-siècle avait été nécessaire. Non seulement ce souhait a été réalisé mais le traitement électronique des signaux débouche sur une remise en question de la réalité traitée dans la méthode expérimentale. Aux savants expérimentant avec un marteau et des clous, le traitement électronique du signal faisait passer à une expérimentation fournissant des chiffres incompréhensibles autrement que par de nouveaux traitements électroniques des données, à croire que l’ esprit humain, à partir d’un dispositif expérimental insufflant des variables dans la réalité ne comprenait pas les données qui, tel un boomerang, lui étaient renvoyées.


[1Pour fixer les idées, rappelons que l’ENIAC, le premier ordinateur ne comportant plus de pièces mécaniques est créé grâce à J.Mauchly et J.Presper Eckert en 1943 : l’ENIAC (Electronic Numerical Integrator And Computer). Il est composé de 18000 lampes à vide, et occupe une place de 1500 m2.

[2L’informatique documentaire est née dans les années 60 dès l’instant où les informaticiens se sont apercus que le traitement électronique du signal ne concernait pas seulement les chiffres.

[3L’étude de faisabilité est présentée devant un parterre de spécialistes lors d’ un congrès en 1974 Pour situer l’étude de faisabilité publiée en 1974, rappelons que la première banque de données MEDLINE, dès 1972, était interrogée en direct depuis Paris, grâce à la liaison transatlantique TYMNET, l’ordinateur de la NLM situé à Bethesda aux États-Unis

[4Que D. N. soit ici remerciée de m’avoir précisé cette notion couverte par l’anglais "serendipity"

[5Il semble bien que, paradoxalement, bien des progrès ont été faits pour remplacer l’intervention purement humaine par une mécanisation substitutive

[6Les méta-données ou données sur les données cfs le langage sur la langue

[7On reconnaitra les notions anglo-saxonnes de " Recall " et de " Précision " qui servent à mesurer l’ efficacité des systèmes de tri

[8On remarquera ici la notion de Bruit et de Silence des systèmes de gestion des bibliothèques

[9Il est évidemment exclu, dans la pratique, de balayer tous les specimens des herbariums contenant des milliers d’exemplaires voire des millions comme au Muséum d’ Histoire Naturelle de Paris ou de Kew.

[10Ainsi aux d’astuces développées par les savants calculant " à la main à l’aide de tables (trignonométriques, logaritmiques etc ) succèdaient les méthodes informatiques peu regardantes sur l’espace mémoire utilisé ni sur les calculs répétitifs (ou par itération) que les machines électroniques réalisent sans peine.


Commentaires

Brèves

1er mai 2015 - L’imprimante 3D du pauvre

On dit que l’imprimante 3D sera la machine à vapeur du XXIème siècle.
Sénamé Koffi Agbodjinou, (...)

10 juillet 2013 - La part de mystère aux sciences les plus dures !

Après J. Hadamard ou H. Poincaré , Cédric Villani Médaille Fields 2010 se penche sur le processus (...)

13 janvier 2013 - L’analogie remise à l’honneur ?

Question de définition
On le sait, en science, la valeur épistémologique de l’analogie est faible. (...)

7 novembre 2012 - Sur la sublimation

Jean-baptiste Beaufils m’autorise à publier
Lettre ouverte à Jean-François DOUCET,
SUR LA (...)

21 juin 2012 - Supprimer le problème, c’est le ... boire !

Depuis longtemps, le sur-emballage des produits agro-alimentaires a été montré du doigt sans que, (...)