II.1.1.2. Normalisation du corpus
A l’йtape suivante, nous avons procйdй а l’extraction des termes du corpus. De nos jours, le dйveloppement des corpus textuels a permis de faciliter le travail linguistique d’une faзon considйrable. Le traitement informatique de textes a rendu accessible de tels outils automatiques de l’information que la lemmatisation, l’analyse morphologique, l'йtiquetage morpho-syntaxique, la gestion des dictionnaires, la segmentation en contextes йlйmentaires, etc. Dans le cadre de notre projet, nous avons utilisй le logiciel T-LAB qui propose plusieurs instruments linguistiques, statistiques et graphiques permettant de faciliter une analyse des textes.
Tout d’abord а l’aide de T-LAB, nous avons importй le corpus et nous avons reзu les textes normalisйs et lemmatisйs oщ les stop-words (mots qui ne sont pas indexйs ni utilisйs dans les recherches puisqu’ils ne sont pratiquement pas porteurs d'information, comme les articles ou les pronoms) et les parties du discours ont йtй bien dйtectйs.
II.1.1.3. Exportation des substantifs а une frйquence йlevйe
Ensuite, nous avons exportй deux listes composйs de 4194 et 3058 substantifs extraits respectivement des textes biologiques et linguistiques. Les outils statistiques nous ont permis de calculer la frйquence d’apparition de ces unitйs dans le corpus. Pour apporter une prйcision sur le choix des substantifs en tant que candidats-termes, il serait opportun de rappeler que dans la partie prйcйdente nous avons choisi la dйfinition de la notion de “terme” qui privilйgie le caractиre nominatif des unitйs terminologiques. Finalement, nous avons croisй les deux ensembles d’йlйments nominatifs.

Figure 10. Reprйsentation des ensembles de substantifs extraits
Dans l’intersection de ces deux ensembles d’unitйs appartenant aux domaines de la biologie et de la linguistique (fig. 10), nous avons obtenu un ensemble de 834 substantifs communs а ces deux disciplines. Les unitйs extraites ont йtй, donc, considйrйes comme des candidats-termes homonymiques interdisciplinaires. Cependant, l’extraction finale des termes de cette liste de candidats exigeait une validation manuelle et une йtude dйtaillй de leurs dйfinitions.
II.1.1.4. Constitution d’une liste des termes homonymiques
A cette йtape, nous avons exclu les unitйs lexicales dont la frйquence dans les textes ne dйpassait pas 10 apparitions. Йtablir un seuil de frйquence est nйcessaire afin d’effectuer par la suite une analyse des relations sйmantiques, sinon il n’y aura pas autant de relations а examiner par des logiciels du traitement automatique des textes. Puis, nous avons analysй les dйfinitions de chaque candidat-terme et йliminй les unitйs qui ne relevaient que du lexique gйnйral. Par consйquent, nous avons gardй les substantifs qui en mкme temps rйalisaient leurs sens terminologiques propres au domaines de la biologie et de la linguistique. Lors de l’йtude des dйfinitions des candidats-termes en question, nous avons consultй des dictionnaires gйnйraux et des dictionnaires spйcialisйs (voir les ressources numйriques).
Les deux sources franзaises les plus pertinentes pour notre projet йtaient le dictionnaire le “Trйsor de la langue franзaise informatisй” (TLFi) crйй par le Centre national franзais de la recherche scientifique en collaboration avec l’universitй de la Lorraine, et le “Grand dictionnaire terminologique” (GDT) rйdigй par l'Office quйbйcois de la langue franзaise. Un grand avantage du TLFi est qu’il dйcrit tout lexиme d’une faзon trиs exhaustive sur le plan sйmantique et les lexиmes homonymiques sont prйsents sous des entrйes distinctes. Chaque unitй est accompagnйe par les dйfinitions correspondant aux domaines d’application des concepts reprйsentйs et par de nombreux exemples de son emploi.
Le GDT, а son tour, est un dictionnaire essentiellement terminologique. “Chaque fiche renseigne sur un concept liй а un domaine d'emploi spйcialisй et prйsente les termes qui le dйsignent en franзais et, parfois, dans d'autres langues” [GDT]. Ainsi, le terme dйcrit par au moins deux fiches peut кtre considйrй comme homonymique puisque, comme nous l’avons dйfini dans la partie prйcйdente, les unitйs terminologiques sont jugйes homonymiques lorsqu’elles fonctionnent au sein des champs thйmatiques distincts.
Nous avons йgalement consultй une source informatisй “Academic” pour retrouver les dйfinitions des concepts йquivalents dans la langue russe. Cet outil donne l’accиs а une large gamme d’encyclopйdies, dictionnaires de traduction, dictionnaires gйnйraux et thйmatiques y compris ceux de biologie et de linguistique.
Finalement, nous avons obtenu une liste de 80 termes interdisciplinaires, qui fonctionnent simultanйment dans les deux disciplines en question. La liste finale est prйsentйe dans l’annexe numйro 1. Les caractйristiques des termes qui sont dйcrites dans le tableau sont les domaines de leurs applications, la frйquence des leurs apparitions dans les textes analysйs, la dйfinition dans la langue source, la traduction et la dйfinition du terme йquivalent dans la langue cible.
II.1.1.5. Etablissement des fiches terminologiques pour les termes homonymiques interdisciplinaires
La liste des termes extraits de notre corpus, la description de leurs propriйtйs et une analyse de leurs emplois nous ont permis d’йtablir les fiches terminologiques pour chaque terme d’aprиs les normes formulйes par l’Organisation internationale de normalisation [30, p. 15-28]. Ainsi, nous avons conзu deux entrйes terminologiques pour chaque unitй, dont une prйsente les caractйristiques propres au concept biologique et l’autre les mкmes informations pour le concept linguistique. Considйrons quelques exemples de ces fiches. Les donnйes complиtes sont prйsentйes dans l’annexe numйro 2.
Tableau 2. Fiche terminologique “liaison” biologie
Nom de catйgorie | Donnйes terminologiques |
terme principal | terme fr: liaison |
traduction | terme ru : сцепление |
unitй phrasйologique | unitй phrasйologique fr: liaison absolue unitй phrasйologique ru: полное сцепление |
partie du discours | partie du discours fr: nom partie du discours ru: nom |
genre grammatical | genre fr: fйminin genre ru: neutre |
nombre grammatical | nombre fr: singulier nombre ru: singulier |
champ thйmatique | champ thйmatique: biologie |
dйfinition | dйfinition fr: Groupe de deux ou plusieurs gиnes d'un mкme chromosome, situй sur des loci trиs proches et transmis simultanйment а la descendance. dйfinition ru: Совместная передача двух или более генов, лежащих в одной хромосоме, от родителей потомкам. |
contexte | contexte fr: Le degrй de liaison mesurй par le pourcentage de recombinaisons entre loci, indique une distance gйnйtique que l'on exprime en centimorgans. contexte ru: Сила сцепления между генами зависит от расстояния между ними: чем дальше гены располагаются друг от друга, тем выше частота кроссинговера и наоборот. |
Le tableau 2 nous prйsente une fiche terminologique conзue pour le terme “liaison” dans son sens biologique. Dans ce tableau nous voyons une catйgorie obligatoire “terme principal”, qui comporte l’information sur la forme linguistique de l’unitй terminologique en question, et des catйgories avec les informations terminologiques gйnйrales comme “nombre grammatical”, “champ thйmatique”, “dйfinition” et d’autres, ainsi que des catйgories avec les informations axйes sur l’activitй traductologique de l’utilisateur telles que “traduction”, “dйfinition ru”, “contexte ru” et toutes les autres qui incluent la mention de la langue cible “ru”.
Tableau 3. Fiche terminologique “liaison” linguistique
Nom de catйgorie | Donnйes terminologiques |
terme principal | terme fr: liaison |
traduction | terme ru : связывание |
unitй phrasйologique | unitй phrasйologique fr: liaison facultative unitй phrasйologique ru: факультативное связывание |
partie du discours | partie du discours fr: nom partie du discours ru: nom |
genre grammatical | genre fr: fйminin genre ru: neutre |
nombre grammatical | nombre fr: singulier nombre ru: singulier |
champ thйmatique | champ thйmatique: linguistique |
dйfinition | dйfinition fr: Habitude de prononciation qui consiste а unir la derniиre consonne d'un mot habituellement non prononcйe а la voyelle initiale du mot suivant. dйfinition ru: Явление в языке, когда в речевом потоке в положении перед гласным произносится конечный согласный, непроизносимый в изолированном слове. |
contexte | contexte fr: La liaison est obligatoire, dans le groupe nominal, entre le dйterminant (article, dйterminant possessif, indйfini, numйral, interrogatif ou exclamatif) et le nom qu’il accompagne, ou avec l’adjectif qui prйcиde ce nom. contexte ru: Связывание обязательно между детерминативом (артиклем, притяжательным, указательным, неопределенным или вопросительным прилагательным) и следующим за ним словом (существительным, прилагательным или местоимением. |
Le tableau 3 a йtй йgalement conзu pour le terme “liaison” mais dans son sens linguistique. Les catйgories restent les mкme pour toutes les fiches terminologiques tandis que les donnйes changent pour chaque terme en fonction de son contexte thйmatique d’emploi. Ainsi, de telles entrйes terminologiques peuvent aider а choisir la traduction йquivalente suite au traitement du corpus proposй dans notre projet. La mйthode йlaborйe йtablie la discipline а laquelle appartient le texte en question. Puis, grвce aux informations qui sont indiquйes dans la fiche terminologique dans la catйgorie “champ thйmatique”, il sera possible de fixer le sens du terme homonymique au sein du domaine de son usage.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |


