Quant aux catйgories, l’ISO dйtermine celles qui sont obligatoires pour crйer une entrйe terminologique, par exemple “terme principal (concept)” qui peut кtre composй d’une ou de plusieurs йlйments qui reprйsentent un seul concept. Ensuite, l’utilisateur peut choisir parmi d’autres catйgories en fonction de ses besoins comme, par exemple, “champ terminologique”, “contexte”, etc [30, p. 23-24]. Prenons l’exemple d’un certain nombre de catйgories pour illustrer la structure des entrйes terminologiques possibles.
Tableau 1. Catйgories des entrйes terminologiques
Nom de catйgorie | Exemple |
terme principal | terme fr: ensemble ordonnй terme ru: упорядоченное множество |
synonyme | terme fr: rubйole synonyme fr: troisiиme maladie terme ru: краснуха synonyme ru: третья болезнь |
forme abrйgйe du terme | terme fr: Organisation des Nations Unies forme abrйgйe fr: ONU terme ru: Организация Объединенных Наций forme abrйgйe ru: ООН |
symbole | terme fr: pour-cent symbole fr: % terme ru: процент symbole ru: % |
formule | terme fr: acide sulfurique formule fr: H2SO4 terme ru: серная кислота formule ru: H2SO4 |
unitй phrasйologique | unitй phrasйologique fr: demande de brevet unitй phrasйologique ru: заявка на патент |
texte standardisй | texte standardisй fr: le salariй a le droit de modifier et de rйsilier le prйsent contrat de travail dans le respect des modalitйs lйgales et conventionnelles texte standardisй ru: работник имеет право на изменение и расторжение настоящего трудового договора в порядке и на условиях, установленных законодательством |
partie du discours | terme fr: entropie partie du discours fr: nom terme ru: энтропия partie du discours ru: nom |
genre grammatical | terme fr: pollen genre fr: masculin terme ru: пыльца genre ru: fйminin |
nombre grammatical | terme fr: barre d’appui nombre fr: singulier terme ru: перила nombre ru: pluriel |
champ thйmatique | terme fr: biosynthиse terme ru: биосинтез champ thйmatique: biologie |
dйfinition | terme fr: diamиtre dйfinition fr: corde d'un cercle ou d'une sphиre passant par le centre terme ru: диаметр dйfinition ru: отрезок, соединяющий две точки на окружности и проходящий через центр окружности |
contexte | terme fr: race contexte fr: chaque race de chien est classйe dans un groupe et une section dйterminйs par la FCI terme ru: порода contexte ru: Каталог пород собак собран по классификации МКФ - истории пород, характеристики, описание и психологический портрет собак всех пород |
Le tableau 1 prйsente des exemples de catйgories qui peuvent constituer les entrйes terminologiques. Les catйgories comme “unitй phrasйologique”, “texte standardisй”, “champ thйmatique”, “dйfinition” et “contexte” comportent des donnйes nйcessaires pour tout travail traductologique. Dans cette perspective, nous mettrons l’accent sur la crйation des fiches terminologiques pour des termes homonymiques et sur la description des donnйes selon des catйgories proposйes par l’Organisation internationale de normalisation.
Enfin, de nombreux organismes internationaux travaillent pour unifier les systиmes terminologiques. Grвce aux normes existantes et aux principes et mйthodologies universels, les spйcialistes des rйgions diffйrentes peuvent coordonner leurs recherches et complйter les bases de donnйes terminologiques. La normalisation en terminologie est nйcessaire pour rendre les discours techniques et scientifiques clairs et non ambigus, standardiser les descriptions des concepts et internationaliser les unitйs terminologiques ce qui prйsente un atout majeur pour les traducteurs.
II. DESAMBIGUISATION DES HOMONYMES TERMINOLOGIQUES PAR LE BIAIS DE L’IDENTIFICATION DU CHAMP THEMATIQUE DES TEXTES
II.1. Elaboration d’une mйthode automatique de dйsambiguпsation des homonymes terminologiques
Comme nous l’avons mentionnй dans la partie prйcйdente, les unitйs terminologiques homonymes fonctionnent le plus souvent dans des contextes diffйrents. Les homonymes interdisciplinaires, qui appartiennent а des champs thйmatiques distincts, ne prйsentent pas de danger pour les spйcialistes, puisqu’une telle collision sйmantique ne peut pas advenir au sein d’un seul domaine spйcifique. Pourtant, ce type d’homonymie n’est pas а nйgliger par les traducteurs, car la mкme unitй linguistique fait rйfйrence а des concepts distincts et peut renvoyer а des traductions diffйrentes en fonction du domaine d’application du terme en question.
La question cardinale qui йtait а l’origine de cette йtude est la suivante : “Quels outils linguistiques sont-ils les plus performants en vue de la dйsambiguпsation des homonymes terminologiques?” Il existe plusieurs possibilitйs de fixation du concept concret auquel le terme en question fait rйfйrence dans un tel ou tel contexte. Par exemple, le sens peut кtre dйfini via l’analyse des co-occurences de la dйsignation cible avec d’autres mots clйs а l’intйrieur des contextes йlйmentaires, tels que des phrases, des paragraphes ou autres. Dans ce cas-lа, l’objectif est de retrouver tous les contextes dans lesquels cette forme linguistique est employйe. Ensuite, les co-occurences peuvent кtre йgalement analysйes а l’intйrieur des sйquences de deux ou plusieurs unitйs lexicales prйsentes dans un des contextes йlйmentaires. Cette approche est, au contraire, basйe sur le calcul des unitйs contiguлs.
Le but de notre recherche est d’aborder la question posйe а travers une approche alternative qui consiste а faire une analyse des relations sйmantiques de similaritй entre les unitйs lexicales а l’intйrieur d’un corpus textuel. Lorsqu’il s’agit du traitement d’un corpus de volume considйrable, les rйsultats obtenus aprиs une telle analyse peuvent s’avйrer plus fiables et plus complets vu un plus grand nombre d’associations а l’unitй cible.
Dans les premiers types de calcul, ces associations devaient obligatoirement s’avйrer co-occurentes. Par contre, lors de l’analyse des associations de similaritй, ce sont les modиles d’usage qui sont comparйs.
L’analyse est effectuйe а la base des contextes йlйmentaires, mais les unitйs associйes ne sont pas nйcessairement co-occurentes, l’essentiel est qu’elles soient utilisйes dans des contextes similaires. Ainsi, les unitйs, dont l’index de similaritй au niveau sйmantique est assez йlevй, constitueront un noyau thйmatique propre а un domaine de spйcialitй. Par consйquent, il sera possible de vйrifier notre hypothиse visant а identifier le champ thйmatique des textes et а sйlectionner la traduction йquivalente par le biais d’une analyse automatique des liens sйmantiques de similaritй entre les unitйs lexicales.
Afin d’йlaborer un algorithme qui puisse nous aider а dйfinir le sens des termes homonymiques, nous avons analysй l’emploi des йlйments de l’annexe 1 au sein de notre corpus des textes spйcialisйs et nous avons construit des clusters des unitйs lexicales associйes а chaque terme en fonction du domaine de son application pour pouvoir ensuite dйterminer le champ thйmatique des nouveaux documents comportant ces termes interdisciplinaires. Nous avons donc йlaborй une mйthode de localisation des sens des unitйs terminologiques homonymiques interdisciplinaires а l’aide d’une analyse automatique des liens sйmantiques de similaritй entre les mots. La mйthode est composйe des йtapes suivantes :
1. Extraire les termes homonymiques
1.1 Crйer un corpus textuel ;
1.2 Normaliser le corpus ;
1.3 Exporter les substantifs а une frйquence йlevйe ;
1.4 Constituer une liste des termes homonymiques ;
1.5 Etablir les fiches terminologiques pour les termes homonymiques interdisciplinaires.
2. Construire les clusters thйmatiques
2.1 Dйfinir la notion de “cluster” ;
2.2 Crйer les reprйsentations vectorielles de tous les йlйments nominatifs du corpus ;
2.3 Calculer les distances entre les vecteurs ;
2.4 Crйer les matrices de similaritй pour chaque terme ;
2.6 Illustrer les clusters thйmatiques avec des reprйsentations graphiques.
3. Dйfinir le critиre de dйsambiguпsation des homonymes terminologiques
3.1 Choisir le critиre de comparaison des clusters ;
3.2 Analyser les caractйristiques des critиres de similaritй.
Dans les pages qui suivent, nous prйsenterons la description dйtaillйe de chaque йtape du traitement de notre corpus, des mйtriques et des outils qui ont йtй utilisйs lors de l’йlaboration de cette mйthode.
II.1.1. Extraction des termes homonymiques
II.1.1.1. Crйation du corpus textuel
Afin de procйder а une йtude de moyens de traduction des termes homonymiques interdisciplinaires, nous avons choisi deux domaines de connaissance, celui de la biologie et celui de la linguistique, pour crйer la base empirique de notre recherche qui est constituйe d’un corpus textuel de deux parties liйes respectivement а ces champs thйmatiques. Ce corpus comprend l’ouvrage “Biologie cellulaire: des molйcules aux organismes” de Jean-Claude Callen, le “Cours de linguistique gйnйrale” de Ferdinand de Saussure publiй par Charles Bailly et Albert Sйchehaye et plusieurs articles, mйmoires et thиses relatifs а la biologie et la linguistique publiйs par des universitйs les plus rйputйes de la France et du Canada (voir les textes de rйfйrences).
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |


