JADT 2024 – Bruxelles
Université de Montréal – CRC sur les Écritures numériques
Université de Montréal – École de bibliothéconomie et des sciences de l’information
Université de Montréal – CRC sur les Écritures numériques
Étudier la possibilité de formuler une définition formelle (computationnelle, algorithmique) – d’un concept littéraire :
Notre but n’est pas heuristique, mais herméneutique.
Corpus étudié actuellement
Livre VI (= 358 épigrammes votives) en traduction française (Waltz, les Belles Lettres)
P. Laurens, L’abeille dans l’ambre : Célébration de l’épigramme de l’époque alexandrine à la fin de la Renaissance (2012, p. 117-130)
Stylistique : Concerne les mots et leur agencement, introduisant de multiples mais infimes modifications par quelques éléments déplacés ou par des substitutions d’ordre lexical ou stylistique
Rhétorique : Porte sur la forme générale des épigrammes ; l’impression est celle d’une multiplication à l’infini des possibilités d’expression d’une même idée
Paradigmatique : Conserve la structure de l’épigramme, mais en fait varier le sujet même, lequel est considéré comme une variable parmi d’autres
AP, VI.13 (Léonidas de Tarente) | AP, VI.14 (Antipater de Sidon) |
---|---|
Les trois frères t’ont consacré, chasseur Pan, ces filets, pris par chacun à son genre de chasse : Pigrès, pour les oiseaux ; Damis, pour les quadrupèdes ; Cléitor, pour le peuple de la mer. Envoie-leur en échange une bonne chasse à l’un par les airs, au second par les bois, à l’autre par les grèves. | À Pan, trois frères ont consacré ces instruments de leur profession : Damis un panneau pour les bêtes des montagnes, Cleitor ces filets à poissons, Pigrès cet infrangible collet à prendre les oiseaux. Car jamais de leur chasse l’un dans les bois, l’autre dans les airs, l’autre sur les eaux, leur logis ne les a vus revenir les rets vides. |
AP, IX.719 (Léonidas de Tarente) | AP, IX.720 (Antipater de Sidon) |
---|---|
Myron ne m’a pas modelée, il se vante : c’est quand je paissais qu’il m’a écartée du troupeau et liée à ce socle de pierre. | Si Myron ne m’avait fixé les pieds à cette pierre, je paîtrais, génisse, avec les autres vaches. |
AP, VI.16 (Archias) | AP, VI.17 (Pseudo-Lucien) |
---|---|
Pour toi voici, Pan, qui guettes du haut des sommets, des présents très variés que t’a consacrés un groupe de trois frères, prémices de leur triple genre de chasse: Damis, de ces panneaux qu’il tend aux bêtes sauvages; Pigrès, des collets à prendre les oiseaux, Cleitor, des filets à poissons. En échange, fais qu’ils continuent à être heureux, l’un dans les airs, le second dans la mer, le dernier dans les bois. | Trois courtisanes t’offrent ces jouets, bienheureuse Cypris, chacune des revenus de son travail spécial: Euphro, de ce que lui rapportent ses fesses, Cleio de ce qu’elle gagne en suivant les règles de la nature, Atthis enfin de ce qu’elle doit à son palais. En échange, souveraine, envoie à la première les profits que souhaite un garçon, à la seconde ceux que désire une femme, à l’autre ceux du troisième sexe. |
Textes
↓
Annotation (manuelle) des variations
↓
Nettoyage et normalisation and normalization
↓
Représentations numériques
↓
Mesures de similarité entre paires d’épigrammes
↓
Algorithmes prédictifs
↓
Modélisation de la variation
48 combinaisons considérées
Avec ou sans l’application d’un anti-dictionnaire ;
Avec ou sans la normalisation de la casse ;
Avec ou sans la suppression de la ponctuation ;
Avec ou sans la suppression de l’accentuation ;
Avec ou sans traitement supplémentaire :
4 représentations considérées
5 mesures considérées
Représentations | Mesure de similarité | Application d’un anti-dictionnaire | Normalisation de la casse | Suppression ponctuation | Suppression accentuation | Traitement supplémentaire |
---|---|---|---|---|---|---|
Sac de mots (binaire) | Similarité cosinus | OUI | OUI | NON | OUI | Racinisation |
Sac de mots (binaire) | Coefficient de Jaccard | NON | OUI | OUI | NON | Racinisation |
Sac de mots (pondéré tf-idf) | Similarité cosinus | OUI | NON | NON | NON | Racinisation |
Ensemble de bigrammes | Coefficient de Jaccard | NON | OUI | NON | NON | Racinisation |
Liste séquentielle | Similarité Damerau-Levenshtein | OUI | OUI | OUI | NON | NON |
3 algorithmes considérés
Un arbre de décision à 14 niveaux est nécessaire pour obtenir une classification parfaite des données d’entraînement.
Entre 17 et 47 % des variations répertoriées échappent encore aux modèles.
Chaque méthode produit quelques faux positifs qui demandent une attention spéciale :
AP, VI.202 (Léonidas de Tarente) | AP, VI.272 (Persès de Thèbes) |
---|---|
Cette ceinture aux belles franges et, en même temps, ce vêtement, c’est Atthis qui, en relevant de ses couches, les a suspendus, fille de Lêto, au-dessus des portes de ton temple virginal, parce que tu l’as délivrée du fardeau de sa grossesse et que sans douleur elle a mis au monde un enfant vivant. | Cette ceinture, fille de Lêto, ce vêtement brodé de fleurs et ce soutien-gorge qui enveloppait étroitement ses seins, c’est Timaessa qui te les a consacrés, quand elle eut, après neuf mois, échappé au fardeau pénible d’un douloureux enfantement. |
AP, VI.13 (Léonidas de Tarente) | AP, VI.11 (Satrius) |
---|---|
Les trois frères t’ont consacré, chasseur Pan, ces filets, pris par chacun à son genre de chasse : Pigrès, pour les oiseaux ; Damis, pour les quadrupèdes ; Cléitor, pour le peuple de la mer. Envoie-leur en échange une bonne chasse à l’un par les airs, au second par les bois, à l’autre par les grèves. | Le chasseur Damis a consacré ce long panneau, Pigrès ce filet aux fines mailles pour attraper les oiseaux et le rameur de nuit Cleitor ce tramail à mettre les rougets : c’est à toi, Pan, que tous trois ont dédié ces instruments de leur travail ; sois propice à ces frères si pieux, accorde-leur leur provende de volatiles, de venaison et d’habitants des eaux. |
Nous avons obtenu des résultats encourageants pour la formalisation du concept de variation stylistique dans le livre VI de l’Anthologie grecque (en traduction française).
Et la suite ?
JADT 2024