La construction des corpus spécialisés à partir du Web pour l’amélioration des langues de spécialité et la formation en traduction

1. Introduction Travailler avec des corpus offre des données authentiques et empiriques sur la recherche linguistique, l’enseignement des langues et la traduction. Les corpus (comme sources) et la linguistique de corpus (comme méthodologie) favorisent le sens de la découverte qui augmente la motivation et l’autonomie des étudiants traducteurs et même des apprenants avancés des langues étrangères. De plus, une telle méthodologie encourage l’utilisation d’outils informatiques et le traitement des informations sous forme électronique.

Cet article s’inscrit dans le cadre d’une thèse en didactique de la traduction spécialisée à l’aide de corpus. Le but de cet article est d’explorer l’usage du Web comme source de collection de données linguistiques pour la didactique de la traduction spécialisée et la formation en langues de spécialité (juridique, médical, technique). Plus précisément, l’objectif principal est de présenter comment le Web peut être utilisé comme moyen pour construire automatiquement des corpusspécialisés à l’aide du logiciel WebBootCat.

2. Qu’est-ce qu’un corpus ?

Dans le cadre de la linguistique de corpus, un corpus peut être décrit comme une grande collection de textes authentiques (discours écrit ou oral) qui sont sélectionnés comme échantillons représentatifs d’une langue ou de ses variétés. Sara Laviosa (2010: 80) définit le corpus, en linguistique moderne, comme un ensemble de textes authentiques et électroniques, assemblés selon des critères spécifiques en fonction d’un objectif précis.

Le terme électronique désigne les collections de textes qui ont été compilées et sauvegardées sous forme électronique (textes numérisés ou textes trouvés sur Internet), mais surtout le fait que ce matériel est codé en appliquant les méthodes de la linguistique informatique et peut être récupéré ou traité à l’aide d’outils linguistiques. Cependant, comme soulignent Tony McEnery et Andrew Wilson (2004: 17), le terme corpus est maintenant presque synonyme du terme corpus de textes mécaniquement lisible. La représentativité d’un corpus est aussi déterminée par des critères internes et externes. Les critères internes se réfèrent au texte et à son contenu, les critères externes sont davantage liés à l’environnement ou à la situation d’énonciation.

  1. Les corpus dans l’amélioration des langues et la formation en traduction spécialisée

 

L’usage des corpus, d’abord dans le domaine de la littérature, de la linguistique et de la lexicographie, s’est élargi ouvrant la voie à son application dans l’enseignement des langues et, à partir des années 90, à la traduction. Parmi les premiers corpus conçus exclusivement pour être utilisés par des experts étudiant la structure syntaxique et morphologique du langage (voir Biber et al.1998; Kennedy, 1998 et McEnery et Wilson 1996), nous avons atteint le point où ces outils sont disponibles pour un usage général dans le travail quotidien des enseignants et des étudiants de langues étrangères et de beaucoup de traducteurs.

La pédagogie de la traduction était basée sur l’apprentissage guidé par les données (Data Driven Learning) développé par Tim Johns, pour l’enseignement des langues (Johns, 1991a, 1992b dans Laviosa 2014), et sur les principes du constructivisme qui «forment la pierre angulaire du développement des méthodes d’enseignement centrées sur l’étudiant et axées sur la pratique» (Kiraly, 2003: 8).

Silvia Bernardini et al. (2003) considèrent la formation en traduction comme un moyen d’améliorer les langues de travail des étudiants traducteurs. L’utilisation des corpus dans l’enseignement de la traduction ne se limite pas aux cours de traduction. Les corpus peuvent également être utilisés dans d’autres cours inclus dans le programme d’études des étudiants traducteurs, tels que l’apprentissage d’une deuxième langue (Bernardini 2000) et la terminologie (Pearson 1998), et ce travail peut compléter les activités de traduction en développant des compétences étroitement liées à l’enseignement de la traduction (Flowerdew 2012: 216). Comme la plupart des programmes de traduction de troisième cycle nécessitent la connaissance de deux langues étrangères, nous considérons dans cette étude qu’il est plus approprié de parler d’amélioration des langues de travail, étrangères et native, plutôt que d’apprentissage d’une deuxième langue étrangère, comme l’indique Bernardini.

Exploité adéquatement en fonction des objectifs pédagogiques visés, le corpus peut devenir un outil pédagogique efficace pour les cours de traduction proprement dits, mais aussi dans les cours intégrés au programme de traduction, comme les cours de terminologie ou ceux portant sur les langues de spécialité (Zenettin et al. 2014).

Les corpus, en tant que collections de matériel linguistique authentique, étaient d’abord utilisés, comme mentionné ci-dessus, dans l’enseignement des langues. Puisque la traduction est une pratique de traitement de langues, et surtout de langues de spécialité, dans notre recherche nous considérons ces collections textuelles comme des sources de formation linguistique et en même temps d’amélioration de la compétence traductionnelle. Chaque langue comprend à la fois la langue spéciale et la langue générale qui convergent dans une certaine mesure. Dans le cas des traducteurs de textes spécialisés liés à des domaines de connaissance différents, l’utilisation de collocations et d’une phraséologie correcte, en plus de la terminologie correcte, est une condition préalable à la production, soit vers la langue maternelle soit vers la langue étrangère, de traductions de qualité. Par conséquent, les étudiants traducteurs continuent d’être apprenants de leur langue maternelle et des langues étrangères. Ils constituent même une catégorie distincte d’utilisateurs et d’apprenants d’une langue car leurs besoins d’apprentissage sont différents de ceux de l’apprenant d’une langue à des fins de communication orale.

L’analyse des données linguistiques d’un corpus spécialisé à l’aide de la liste des fréquences et du concordancier peut révéler quels sont les mots et les syntaxes les plus courants d’une thématique bien déterminée et fournir des exemples d’usage de la langue authentiques. Par conséquent, conformément à l’approche théorique qui traite les langues comme des organismes vivants adaptés aux nouvelles données communicatives, nous considérons que l’utilisation de matériel linguistique authentique favorise l’étude et la mise à jour des connaissances dans les langues de travail, alors que pour les langues de spécialité la collection directe et automatique de matériel linguistique authentique à l’aide des outils de construction de corpus permet l’accès immédiat au vocabulaire, aux néologismes et à la phraséologie de textes spécialisés.


Related Posts