Projets ITINERA ELECTRONICA - HODOI ELEKTRONIKAI - HELIOS

Actu' ITINERA+ (Actualités - Nouvelles)


  Accueil     Liste des actualités     Recherche     Actualité     Administration  

Date :     16-08-2005

Sujets :
Projets HELIOS et HODOI ELEKTRONIKAI : La Fiche du vocabulaire (GREVOC 1.0 et COMPARAISON.PHP);

Notice :

Projets HELIOS et HODOI ELEKTRONIKAI : La Fiche du vocabulaire (GREVOC 1.0 et COMPARAISON.PHP) :

Pour établir la Fiche du vocabulaire d'une oeuvre ou d'un extrait textuel il faut trois outils / procédures de travail:

  • Le Lexique grec-français que nous vous avons présenté dans l'Actualité du 12 août 2005; ce lexique est en construction (8 lettres de l'alphabet sont traitées, une neuvième (lettre sigma) vient de nous être transmise);

  • l'application PC/Windows hors ligne GREVOC 1.0 que Boris MAROUTAEFF vient de développer : à partir d'une oeuvre ou d'un extrait est construit la Liste du vocabulaire qui renferme à la fois les occurrences du texte traité ainsi que les formes différentes munies de leur fréquence d'attestation; les résultats de cette application sont à la fois un ficheir "LISTE" au format EXCEL ainsi qu'un fichier "CODES" au format .TXT.

    Adresse de l'application (fichier - grevoc.zip - compressé (.ZIP) à télécharger, à décompresser (via WINZIP, par exemple) et à installer (via SETUP.EXE) sur le poste de travail PC de l'utilisateur (enseignant ou étudiant) :

    GREVOC 1.0

  • une procédure de comparaison en ligne, mise au point également par Boris MAROUTAEFF, pour comparer les formes d'un extrait à celles contenues dans le Lexique : en cas de correspondance, la description lexicographique (lemme, temps primitifs, traduction, catégorie grammaticale, famille française, famille grecque) de l'entrée du Lexique est ajoutée à la forme de l'extrait étudié; la Fiche du vocabulaire ainsi construite affiche, en noir, les formes sans correspondance (trouvée) et, en rouge, les formes munies d'une description tirée du Lexique.

    Adresse de la procédure:

    COMPARAISON.PHP

Nous avons appliqué le programme hors ligne et la procédure en ligne à l'oeuvre suivante : PLUTARQUE, Oeuvres morales, Le démon de Socrate, oeuvre pour laquelle nous venons de terminer la préparation de l'environnement hypertexte.

Les fichiers résultants sont disponibles aux adresses suivantes:

  • Liste du vocabulaire (au format EXCEL) :
    http://helios.fltr.ucl.ac.be/exercices/Grevoc/plutarque_demon_formes.XLS
  • Liste des CODES (formes représentées par leur adressage numérique; le fichier "CODES" est l'entrée de la procédure de COMPARAISON) :
    http://helios.fltr.ucl.ac.be/exercices/Grevoc/plutarque_demon_codes.TXT
  • Fiche du vocabulaire (lettres A et B) :
    http://helios.fltr.ucl.ac.be/exercices/Grevoc/plutarque_demon_vocA-B.TXT


Au titre d'illustration, nous présentons ci-dessous le déroulement de l'ensemble des deux procédures sour la forme de vignettes au format WORD (saisies d'écran):

  • Démarrage de l'application GREVOC 1.0

  • Choix de l'extrait ou de l'oeuvre à traiter (option "OUVRIR FICHIER UNICODE" du menu "FICHIER"); exemple : PLUTARQUE, Le démon de Socrate; ATTENTION : le fichier à traiter doit renfermer des caractères grecs polytoniques au format UNICODE;

  • Affichage du fichier ou de l'extrait textuel une fois qu'il est chargé dans l'application

  • Lancement du traitement (option "LISTE DU VOCABULAIRE" dans le menu "APPLICATION")

  • Extraction des formes (OCCURRENCES): en cours

  • Extraction des formes terminée - DÉTERMINATION des Formes DIFFÉRENTES : en cours

  • Détermination des formes terminée : 11.569 occurrences et 4.561 formes différentes : INSERTION d'un intitulé -référence;

  • Création du premier fichier résultant : la liste des formes différentes au format EXCEL (.XLS)

  • Affichage du premier fichier résultant

  • Affichage, après création, du 2e fichier résultant : les formes sous forme de CODES (représentation numérique); fichier nécessaire à la comparaison avec le Lexique;

  • La procédure de comparaison (en ligne) ; le fichier "CODES" se trouve sur le disque dur du poste local de l'utilisateur;

  • Démarrage de la procédure de comparaison

  • Affichage du résultat de la comparaison : la Fiche du vocabulaire : en noir, les formes non reconnues - en rouge : les formes pourvues d'une description lexicographique


Nous sommes conscients que pour la mise en oeuvre de ces deux procédures une séance d'initiation pratique devrait donner de meilleurs résultats que ceux à espérer en suivant la présentation ci-dessus.

Au fil du temps nous avons essayé plusieurs formules : descriptions simples, présentations HTML, présentations POWERPOINT, visioconférences, manuels d'utilisation et séances d'initiation. Cette dernière formule, incontestablement, a donné les meilleurs résultats auprès d'un grand nombre d'utilisateurs. Mais, dans la situation où se trouve le Projet HELIOS, est-elle applicable ? Il y a la distance entre Grenoble et Louvain-la-Neuve. Nous sommes ouverts à toute proposition pour autant qu'elle tienne compte de l'exiguité des ressources humaines disponibles.

Par contre, un chacun d'entre vous, enseignant comme étudiant, peut aider à la construction du Lexique pour le rendre le plus performant possible. Il faut savoir que toute graphie d'une entrée donnée, - peu importe ses possibilités d'accentuation, que la forme soit élidée ou non, qu'elle se présente en majuscules ou en minuscules ... -, bref, toutes les graphies attestées d'une forme et/ou d'un lemme donné constituent des entrées dans le Lexique. Ce qui est de nature à accroître considérablement la taille de ce dernier.

L'examen d'un extrait ou d'une oeuvre, en l'occurrence Le démon de Socrate, entraîne inévitablement la découverte de formes non reconnues puisqu'aucune correspondance n'a pu être trouvée dans le Lexique. Mais, parfois, ces formes non reconnues se situent alphabétiquement dans l'environnement immédiat de formes reconnues et qui, de ce fait, se sont vues adjoindre une description lexicographique.

Exemple :

Lettres A et B du démon de Socrate

Nous communiquer ces formes au travers d'un fichier TXT au format UNICODE, annexé à un courrier électronique, nous permettrait d'accroître, à faible coût, le Lexique et son rendement pour la Fiche du vocabulaire.

Danielle de Clercq vient de nous communiquer les entrées pour une 9e lettre (le sigma); ces entrées peuvent maintenant être traitées chez nous afin d'être versées dans la base de données du Lexique. Pour la fin de l'année civile 2005, TOUTES les lettres de l'alphabet devraient être disponibles : à ce moment d'autres procédures pourront être imaginées pour une "récupératon" immédiate du stock de vocabulaire non (encore) reconnu issu du traitement, semaine après semaine, des environnements hypertextes grecs ... mais il s'agira, alors, d'établir (en premier lieu) des descriptions lexicographiques pour les nouvelles entrées de dictionnaire du Lexique : une tâche scientifique qui ne devrait pas être triviale.

En attendant, notre appel de ce jour va aux enseignants - et pourquoi pas aux étudiants? - qui mettent en oeuvre ces procédures conduisant à la Fiche du vocabulaire, pour leur demander de nous communiquer - cf. les adresses électroniques en bas de cette page-ci - les formes déjà présentes dans le Lexique mais attestées dans l'extrait ou la partie d'oeuvre traitée par eux sous une autre graphie. L'outil de travail que nous élaborons est à la disposition de tout enseignant ou apprenant de la langue grecque. Sa construction peut relever d'une même mise en commun.


Jean Schumacher 16 août 2005


 
UCL | FLTR | Itinera Electronica | Bibliotheca Classica Selecta (BCS) |
Analyse, design et réalisation informatiques : B. Maroutaeff - J. Schumacher

Dernière mise à jour : 17/02/2002