Saviez-vous que l’intégralité des modèles de traduction automatique utilisent l’anglais comme langue de référence ?
C’était en tout cas vrai jusqu’à l’annonce du nouveau modèle de traduction de Facebook.
Le fonctionnement d’un modèle de traduction est simple : traduire un texte depuis une langue vers l’anglais et/ou depuis l’anglais vers une autre langue.
Ce système fonctionne, mais il n’est pas toujours pertinent pour les traductions avancées.
Le nouveau modèle de Facebook, baptisé M2M-100, est présenté comme le premier membre de la famille des MMT (Multilingual Machine Translation), une nouvelle catégorie de modèles de traduction automatique.
M2M-100 peut se représenter sous la forme d’une matrice 100×100, capable de réaliser des traductions entre chaque paire de langues, sans utiliser l’anglais comme base de référence.
La complexité de M2M-100 dépasse tout ce qui existe actuellement : 15 milliards de paramètres distincts et un entraînement réalisé sur 200 milliards de phrases (!) dans 100 langues différentes.
Le résultat est fou : alors qu’il s’agit d’une toute nouvelle technologie, M2M-100 se place déjà au sommet de la pyramide des modèles de traduction, dépassé seulement par T-ULRv2, le nouveau modèle de Microsoft.
Source : https://about.fb.com/news/2020/10/first-multilingual-machine-translation-model/
Post original : https://www.linkedin.com/posts/guillaumebesson_saviez-vous-que-lint%C3%A9gralit%C3%A9-des-mod%C3%A8les-activity-6752494013309325312-FXd1