Projets ITINERA ELECTRONICA - HODOI ELEKTRONIKAI - HELIOS

Actu' ITINERA+ (Actualités - Nouvelles)


  Accueil     Liste des actualités     Recherche     Actualité     Administration  

Date :     06-10-2006

Sujets :
ITINERA ELECTRONICA : un nouvel outil TICE : De la forme ou de l'expression latine à la littérature latine; ITINERA ELECTRONICA : un autre outil TICE : les COOCCURRENCES; Statistiques de consultation - septembre 2006; HODOI ELEKTRONIKAI : nouveaux environnements hypertextes : Appien, Chariton, Denys d'Halicarnasse, Platon, Pausanias

Notice :

1. ITINERA ELECTRONICA : un nouvel outil TICE :

Dans l'Actu'ITINERA du 7 juillet 2006, nous vous avons présenté un nouvel outil d'interrogation de notre base textuelle : Du français au latin / grec.

Grâce à cet outil et partant de termes français, pris comme critères de sélection, il est possible d'interroger à la fois la littérature latine et la grecque telles qu'elles sont traitées dans notre base textuelle. Grâce aux opérateurs booléens (ET/OU), les recherches peuvent porter sur des formes isolées mais aussi sur des formes associées (expressions).

Cet outil comblait donc une lacune pour les recherches d'attestations. D'un autre côté, cependant, nous ne disposions pas encore d'un outil TICE, au sein des ITINERA et des HODOI, pour interroger des expressions latines (ou grecques) à partir du latin (ou du grec) .

Le "Dictionnaire des formes", en effet, qui est un outil de recherche TICE travaillant sur la totalité de la base textuelle, ne permet des interrogations que sur la base d'une seule forme exacte. Une recherche combinatoire (ou combinée) y est exclue.

Interrogé à ce sujet, Boris Maroutaeff, auteur de tous les développements informatiques au bénéfice des trois Projets, nous a donné à entendre que l'outil créé au mois de juillet 2006, à savoir la base de données "Du français au latin / grec" avait en lui, "congénitalement", aussi la possibilité d'interrogation de la littérature latine avec, comme critère de sélecton, un terme ou un ensemble de termes ("expressions") latins reliés grâce à l'opérateur booléen "ET".

Peu de temps après, cette nouvelle possibilité était devenue une réalité : De la forme ou de l'expression latine à la littérature latine.

Exemple d'interrogation: l'association "innumeram" ET "plebem" ("une foule innombrable") : Interrogation.

Quatre sélections sont produites : Résultats
dont Ammien Marcellin au paragraphe 26 et, fortuitement, aussi une variante : innumeram turbam chez Suétone

Rappelons que l'unité textuelle dans laquelle la recherche s'effectue est le "bloc" de texte : soit, en poésie, à chaque fois, 5, 10 ou 50 vers, soit, en prose, un chapitre dont la longeur varie suivant les auteurs et les oeuvres.

Cette unité de base - ou bloc de texte - représente pour la recherche à la fois un avantage et un inconvénient :

  • inconvénient : plus long est le chapitre interrogé, plus il y a aussi des chances d'obtenir du "bruit" au titre de réponses, à savoir des assocations fortuites ne constituant pas, en fait, une véritable expression;

  • avantage : peu importe le nombre de mots intercalés entre les élements de l'expression - un ou plusieurs - , l'expression est sélectionée; peu importe aussi s'il s'agit d' innumeram plebem" ou de "plebem innumeram".

Le critère de sélection est recherché, tel quel, dans toutes les formes qui le renferment : ainsi une interrogation sur uae produit aussi, en réponse, les formes quae; pour éviter ce bruit inopportun, il y a lieu d'introduire un espace DEVANT (et éventuellement aussi ) DERRIÈRE la forme qui est critère de sélection.

De la sorte " uae", associé à " uictis" ne livre qu'une seule (et bonne) réponse : Tite-Live

Lorsque nous avons mis en accès cette nouvelle possibilité d'interrogation, nous avons changé aussi les intitulés" des deux modes d'interrogation.


2. ITINERA ELECTRONICA : Les COOCCURRENCES :

Nos réflexions portent actuellement sur la création d'outils TICE portant sur la syntaxe et les constructions syntaxiques.

En l'an 2000, nous avions créé un outil qui autorise une premère approche de ces réalités syntaxiques : Les COOCCURRENCES en ligne.
Cf. l'Ancien site des ITINERA ELECTRONICA, Approches statistiques

Que fait cette application? Elle accède au texte dont l'adresse (URL) a été indiquée par l'utilisateur et établit les cooccurrences c'est-à-dire toutes les expressions de deux mots qui se suivent immédiatement dans le texte.

En les classant d'après les fréquences d'attestations, les expressions "les plus courantes" sont mises en évidence.

En cochant celles qui correspondent à la recherche syntaxique menée, puis, en cliquant sur le bouton SÉLECTION, en fin de page, les attestations qui n'ont pas été cochées sont éliminées de la liste finale. Et le résultat de ce TP (Travail pratique) peut être soumis à l'enseignant.

Intérêt pédagogique de l'application : faire travailler les étudiants, éventuellement par groupes, sur des constructions syntaxiques :

  • préposition + substantif : in agrum; ad regem; cum coniuge;
  • substantif + complément déterminatif : urbis excidium; excidium solis; primores ciuitatis;
  • substantif + complément d'objet : impetum facit;
  • locutions : magis quam; uae uictis; etiam quod; haud facile; usque ad; fama est; postero die; etc. etc.

L'application se déroule en ligne; le choix des textes est opéré par l'utilisateur qui ne doit connaître que l'adresse de ces textes sur la Toile; l'application peut porter sur la littérature latine comme aussi sur la littérature française. Elle constitue un autre outil TICE à la disposition de ceux qui veulent bien l'utiliser (et qui disposent d'un équipement PC/Windows relié aux réseaux).

En poussant plus loin notre réflexion, nous nous sommes rendus compte aussi de ce que notre base textuelle renfermait (déjà) un autre type de COOCCURRENCES beaucoup plus riche et étendu, à savoir les CONTEXTES élaborés pour chaque oeuvre au sein des environnements hypertextes; dans un contexte une forme mot-clé est entourée de 5 formes qui la précédent dans le texte et de 5 autres formes qui la suivent immédiatement. Ce sont donc des cooccurences de 11 formes à chaque fois.

Imaginons que la recherche à mener concerne les emplois d'excidium - et les associations de ce terme - dans la littérature latine. A titre d'exemple, nous l'avons menée dans la base de données globale consacrée à l'Histoire romaine de Tite-Live : EXCIDIUM
nous obtenons comme associations : urbium excidia, causam excidii, ab excidio urbis, excidium urbis, Sagunti excidium, excidium patriae, etc.

Avec Yves Ouvrard (COLLATINVS.org), nous cherchons à jeter ainsi un pont entre un Dictionnaire "classique", comme le Dictionnaire latin-français de Jeanneau, des associations de termes renfermant un lien syntaxique et, au-delà, des environnements hypertextes ainsi que des affichages (blocs de) texte-traduction. française.

Imaginons encore que nous retirions TOUS les contextes des 555 bases de données latines existantes au sein des ITINERA ELECTRONICA pour les verser, avec leurs références, dans une nouvelle base de données réservée à ce type de cooccurrences, nous disposerions alors d'une base de travail à nulle autre pareille pour trouver et extraire les constructions syntaxiques pertinentes.

Le travail de sélection des attestations et des emplois pertinents nécessite des philologues. S'ils devaient se manifester pour le prendre en charge, nous pourrions, de notre côté, envisager la création de la base de données globale des contextes (cooccurrences de 11 mots). Sans aide et appui, nous ne pourrons pas aller dans cette voie.

Nous entendons, ici et là, que le reproche est fait aux enseignants de ne pas recourir (assez) aux outils TICE, mais ne faudrait-il pas penser aussi (un peu) à aider ceux qui veulent en créer? Les enseignants, correctement formés à l'utilisation de ces outils, et disposant des équipements adéquats - et d'un accès garanti à ces équipements ! surtout lorsqu'il s'agit de langues anciennes ! - pourraient en redemander des outils TICE mais qui va les leur développer? Voilà, une autre question et problématique.


3. Statistiques de consultation - septembre 2006 :

  • Site ITINERA ELECTRONICA:
    • sessions de travail ouvertes: 37.982
    • pages visitées: 74.359
    • pages les plus fréquemment demandées: Cours GLOR 2330 (Auteurs latins - P.-A. Deproost) 15.539 pages); Actualités : 5.524 pages ; Cours GLOR 2320 + GLOR 1140 (Monique Mund-Dopchie - Auteurs grecs) : 1.814 + 3.272 pages; ITINERA, applications hors ligne : 1.916 pages;

  • Site AGORACLASS - Environnements hypertextes (hors Corpora) :
    • sessions de travail ouvertes: 79.296 (robots d'indexation exclus)
    • pages visitées : 561.270
    • pages les plus visitées : César, Guerre d'Afrique : 10.415 pages; Catulle, poèmes : 9.514 pages; Érasme, Éloge : 8.029 pages - Enchiridion: 8.336 pages; Lucrèce : plus de 45.000 pages; Ovide, Héroïdes : 11.528 pages; Sénèque, De la colère 6.585 pages - De la tranquillité : 10.450 pages; Tite-Live, plus de 40.000 pages; Virgile, Énéide : plus de 45.000 pages;

  • Site AGORACLASS (CORPORA):
    • sessions de travail ouvertes: 22.382
    • pages visitées: 777.693
    • bases de données les plus fréquemment consultées: Ammien Marcellin : 103.152 pages; Apulée : 66.045 pages; Claudien, Panégyriques : 38.109 pages; Ovide, Métamorphoses : 24.957 pages; Pline, Lettres : 32.598 pages; Sénèque (Lettres) : 32.886 pages); Valère Maxime : 31.128 pages;

  • Site BCS (Bibliotheca Classica Selecta):
    • sessions de travail ouvertes: 155.764
    • pages visitées: 297.342
    • pages les plus fréquemment demandées: Folia Electronica Classica (36.037 pages); Ovide, Métaphysiques : 32.423 pages; Suétone (36.580 pages); Virgile (21.030 pages); Précis grammatical (latin) : 9.203 pages ; Précis grammatical (grec) : 5.963

  • Site LCE (Lupa Capitolina Electronica):
    • sessions de travail ouvertes: 13.335
    • pages visitées: 18.295

  • Site COLLATINVS-UCL (lemmatisation - dictionnaire latin-français) :
    • sessions de travail ouvertes: 7.452
    • pages visitées: 11.815

  • Site HODOI ELEKTRONIKAI (Environnements hypertextes grecs) :
    • sessions de travail ouvertes: 16.484
    • pages visitées: 112.938
    • pages les plus fréquemment demandées: Aristote, Politique : 3.822 pages; Arrien, Anabase, II : 3.052 pages; Eschyle, Agamemnon : 4.528 pages; Platon, Banquet : 5.278 pages; Plutarque, Vie de Thésée: 3.733 pages; Xénophon, Banquet : 3.444 pages;

  • Site HELIOS (Coopération Grenoble (LOG) - UCL-LLN (FLTR/GLOR) : Langues anciennes) :
    • sessions de travail ouvertes: 10.838
    • pages visitées: 29.090
    • dossier le plus visité : Leçon Tite-Live : 3.811 pages; Leçon Platon : 2.731 pages visitées; Leçon Lucien : 1.280 pages; Leçon Socrate : 2.090 pages; Leçon Apollonios : 2.676 pages


État de la banque de textes latins :

  • Etat du dictionnaire au 6 octobre2006 :

    241.305 formes différentes.
  • Etat du corpus de textes traités au 6 octobre 2006:

    60 auteurs, 627 oeuvres, 4.651.591 occurrences.

  • État de la banque de textes grecs :

  • Etat du dictionnaire au 6 octobre 2006:

    262.328 formes différentes.
  • Etat du corpus de textes traités au 6 octobre 2006 :

    31 auteurs, 318 oeuvres, 3.259.343 occurrences.

  • 4. HODOI ELEKTRONIKAI : nouveaux environements hypertextes :

    A l'arraché, Christian Ruell, a pu constituer pas moins de 5 nouveaux environnements hypertextes :

    • Appien d'Alexandrie, Histoire romaine - Les guerres civiles, livre III [texte grec et traduction française repris au site de Philippe Remacle]
    • Chariton d'Aphrodise, Chéréas et Callirhoé, livre IV
    • Denys d'Halicarnasse, Les Antiquités romaines, livre IV [traduction anglaise reprise au site LACUS CURTIUS de Bill Thayer]
    • Platon, Les Lois, livre III [traduction française reprise au site de Philippe Remacle]
    • Pausanias, le Tour de la Grèce, livre IX [traduction française retravaillée par Jacques Poucet]

    Les textes bruts de ces oeuvres sont disponibles, au format UNICODE, dans le Dépôt HODOI ELEKTRONIKAI.

    Denys d'Halicarnasse : il n'existe pas de traduction française (libre de droits) au-delà du livre III des Antiquités romaines. Mais il existe bien une traduction anglaise pour l'ensemble des 20 livres de cette oeuvre.

    Cette traduction est affichée sur la Toile sur le site LACUS CURTIUS de Bill Thayer. Réflexion faite et après avoir sollicité l'agrément de Bill Thayer - que nous avons obtenu par retour du courrier - nous avons choisi de faire accompagner les livres IV à XX de cette oeuvre par la traduction anglaise plutôt que de laisser les environnements sans traduction, comme nous l'avons encore fait pour le livre III. Une traduction fournie est une aide à la traduction pour tous les utilisateurs mettant en oeuvre nos productions - c'est là un des objectifs du Projet HODOI ELEKTRONIKAI - et peut-on encore dire que la langue anglaise soit peu connue et pratiquée ?


    Jean Schumacher
    6 octobre 2006


     
    UCL | FLTR | Itinera Electronica | Bibliotheca Classica Selecta (BCS) |
    Analyse, design et réalisation informatiques : B. Maroutaeff - J. Schumacher

    Dernière mise à jour : 17/02/2002