Qu’est-ce qu’un texte?

Une chaîne de caractères

  • tokenisation: byte pair encoding
  • Encodage : transformation de chaque token en one-hot encoding vector
  • Encodage : transformation de l’encodage en vecteur sémantique
  • Self-Attention : ajout de vecteurs afin de représenter certaines relations entre les éléments de chaque phrase.
  • Feed foreword (un perceptron multicouche pour apprendre les poids finaux)
  • Normalisation et softmax (une normalisation et une softmax afin d’obtenir la distribution de probabilité)

Et ça?

La glu Microsoft

Les principes

  • interface graphique
  • imprimé
  • bureautique
  • format=software
  • Habiter la glu
  • un format to kill them all
  • pourtant une philosophie

Les effets

  • la “désintermédiation”
    • perte de compétences
  • la perte de contrôle
  • la perte d’utilité (utiliser un ordinateur comme une machine à écrire)

TEI

Robert Alessi

Ekdosis

Ex. syntaxe ekdosis

% Preamble:
\DeclareShorthand{egomute}{\unskip}{ego}

% Document:
\begin{ekdosis}
  σχεδὸν \app{
    \lem[resp=egomute, nosep, post={post σχεδὸν quattuor uerba
      excidisse uid.}, type=emendation]{\supplied{\gap{reason=lost,
        unit=word, quantity=4}}}
  } οὗτοι

  subsidiis magnis \sic*{epicuri} constabilitas

  declinare quis est qui \sic{possit cernere sese}
  \app{
    \lem[resp=egomute, type=emendation, nosep, post={ante
      ὑπογίν.}]{\surplus{καὶ}}
        \note{deleui e Gal.P}
  } ὑπογίνονται

  Πάντων δὲ \app{
    \lem[resp=egomute, type=emendation, nosep]{\supplied{τῶν πυρετῶν}}
    \note[sep]{addidi (\arb{^gamI`a 'l-.hummayAti}
      \getsiglum{Gal})}
    \rdg[nordg, source=Gal]{\arb{al-.hummayAti}}
    \rdg[wit=codd, source=edd, alt=om.]{}
 },
\end{ekdosis}

Le rendu pdf

La sortie TEI

<p>σχεδὸν
<app>
  <lem resp="#ego" type="emendation">
    <supplied>
      <gap reason="lost" unit="word" quantity="4" />
    </supplied>
  </lem>
</app>οὗτοι</p>
<p>subsidiis magnis
<sic>epicuri</sic> constabilitas</p>
<p>declinare quis est qui
<sic>possit cernere sese</sic>.</p>
<p>
<app>
  <lem resp="#ego" type="emendation">
    <surplus>καὶ</surplus>
  </lem>
  <note>deleui e Gal.P</note>
</app>ὑπογίνονται</p>
<p>Πάντων δὲ
<app>
  <lem resp="#ego" type="emendation">
    <supplied>τῶν πυρετῶν</supplied>
  </lem>
  <note>addidi (

  <foreign xml:lang="ar-Latn" type="transliterated"
  subtype="arabtex">^gamI`a 'l-.hummayAti</foreign>
  <ref target="#Gal">Gal.</ref>)</note>
  <rdg source="#Gal">
    <foreign xml:lang="ar-Latn" type="transliterated"
    subtype="arabtex">al-.hummayAti</foreign>
  </rdg>
  <rdg wit="#V #I #R #H" source="#Lit #Erm #Sm" />
</app>,</p>

Une question théorique


\begin{edition}
\ekddiv{
    type=epigram,

    head=\getsiglum{S}55 (f. 180\textsuperscript{v}) = \getsiglum{B}9 (f. 135\textsuperscript{r}),
    n=6
}
\note[type=testium,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{\getsiglum{P} 10.76 (p. 501)}
\note[type=testium,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{\getsiglum{Pl} 1a.74.4 (f. 18\textsuperscript{v}) [\getsiglum{Q}, f. 18\textsuperscript{v}]}
\note[type=testium,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{\getsiglum{L}98 (f. 6\textsuperscript{r}), qui duo epigr. distinxit, 1-2 et 3-8}
\note[type=lemmata,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{εἰς τὸ αὐτό \getsiglum{B}}
\note[type=tituli,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{Tit. Παύλου Σιλεντιαρίου \getsiglum{P}, \getsiglum{Pl}}
\note[type=tituli,nosep,nonum,labelb=S55_1a,labele=S55_2e]%
{s.a.n. \getsiglum{Ss}, \getsiglum{B}, \getsiglum{L}}
\begin{ekdverse}[type=hexdact]
\indentpattern{01}
\begin{patverse}
Οὐ τὸ ζῆν χαρίεσσαν ἔχει φύσιν, ἀλλὰ τὸ \app{
    \lem[sep={~: }, source=edd]{ῥῖψαι}
    %alt = edd. ; devrais peut-être Declare a Short Hand plutôt ?
    \rdg[wit={P, Pl, Ss, B}]{ῥίψαι}
}
\\
φροντίδας ἐκ στέρνων \app{
    \lem[sep={~}, nodelim]{τὰς}
    \rdg[wit={Ss, B}, alt=om.]{}
}
πολιοκροτάφους. \linelabel{S55_2e} \\
\end{patverse}
\end{ekdverse}
\end{edition}

Pandoc

C’est le format qui pense