II.1.1.2. Normalisation du corpus

A l’йtape suivante, nous avons procйdй а l’extraction des termes du corpus. De nos jours, le dйveloppement des corpus textuels a permis de faciliter le travail linguistique d’une faзon considйrable. Le traitement informatique de textes a rendu accessible de tels outils automatiques de l’information que la lemmatisation, l’analyse morphologique, l'йtiquetage morpho-syntaxique, la gestion des dictionnaires, la segmentation en contextes йlйmentaires, etc. Dans le cadre de notre projet, nous avons utilisй le logiciel T-LAB qui propose plusieurs instruments linguistiques, statistiques et graphiques permettant de faciliter une analyse des textes.

Tout d’abord а l’aide de T-LAB, nous avons importй le corpus et nous avons reзu les textes normalisйs et lemmatisйs oщ les stop-words (mots qui ne sont pas indexйs ni utilisйs dans les recherches puisqu’ils ne sont pratiquement pas porteurs d'information, comme les articles ou les pronoms) et les parties du discours ont йtй bien dйtectйs.

II.1.1.3. Exportation des substantifs а une frйquence йlevйe

Ensuite, nous avons exportй deux listes composйs de 4194 et 3058 substantifs extraits respectivement des textes biologiques et linguistiques. Les outils statistiques nous ont permis de calculer la frйquence d’apparition de ces unitйs dans le corpus. Pour apporter une prйcision sur le choix des substantifs en tant que candidats-termes, il serait opportun de rappeler que dans la partie prйcйdente nous avons choisi la dйfinition de la notion de “terme” qui privilйgie le caractиre nominatif des unitйs terminologiques. Finalement, nous avons croisй les deux ensembles d’йlйments nominatifs.

НЕ нашли? Не то? Что вы ищете?

Figure 10. Reprйsentation des ensembles de substantifs extraits

Dans l’intersection de ces deux ensembles d’unitйs appartenant aux domaines de la biologie et de la linguistique (fig. 10), nous avons obtenu un ensemble de 834 substantifs communs а ces deux disciplines. Les unitйs extraites ont йtй, donc, considйrйes comme des candidats-termes homonymiques interdisciplinaires. Cependant, l’extraction finale des termes de cette liste de candidats exigeait une validation manuelle et une йtude dйtaillй de leurs dйfinitions.

II.1.1.4. Constitution d’une liste des termes homonymiques

A cette йtape, nous avons exclu les unitйs lexicales dont la frйquence dans les textes ne dйpassait pas 10 apparitions. Йtablir un seuil de frйquence est nйcessaire afin d’effectuer par la suite une analyse des relations sйmantiques, sinon il n’y aura pas autant de relations а examiner par des logiciels du traitement automatique des textes. Puis, nous avons analysй les dйfinitions de chaque candidat-terme et йliminй les unitйs qui ne relevaient que du lexique gйnйral. Par consйquent, nous avons gardй les substantifs qui en mкme temps rйalisaient leurs sens terminologiques propres au domaines de la biologie et de la linguistique. Lors de l’йtude des dйfinitions des candidats-termes en question, nous avons consultй des dictionnaires gйnйraux et des dictionnaires spйcialisйs (voir les ressources numйriques).

Les deux sources franзaises les plus pertinentes pour notre projet йtaient le dictionnaire le “Trйsor de la langue franзaise informatisй” (TLFi) crйй par le Centre national franзais de la recherche scientifique en collaboration avec l’universitй de la Lorraine, et le “Grand dictionnaire terminologique” (GDT) rйdigй par l'Office quйbйcois de la langue franзaise. Un grand avantage du TLFi est qu’il dйcrit tout lexиme d’une faзon trиs exhaustive sur le plan sйmantique et les lexиmes homonymiques sont prйsents sous des entrйes distinctes. Chaque unitй est accompagnйe par les dйfinitions correspondant aux domaines d’application des concepts reprйsentйs et par de nombreux exemples de son emploi.

Le GDT, а son tour, est un dictionnaire essentiellement terminologique. “Chaque fiche renseigne sur un concept liй а un domaine d'emploi spйcialisй et prйsente les termes qui le dйsignent en franзais et, parfois, dans d'autres langues” [GDT]. Ainsi, le terme dйcrit par au moins deux fiches peut кtre considйrй comme homonymique puisque, comme nous l’avons dйfini dans la partie prйcйdente, les unitйs terminologiques sont jugйes homonymiques lorsqu’elles fonctionnent au sein des champs thйmatiques distincts.

Nous avons йgalement consultй une source informatisй “Academic” pour retrouver les dйfinitions des concepts йquivalents dans la langue russe. Cet outil donne l’accиs а une large gamme d’encyclopйdies, dictionnaires de traduction, dictionnaires gйnйraux et thйmatiques y compris ceux de biologie et de linguistique.

Finalement, nous avons obtenu une liste de 80 termes interdisciplinaires, qui fonctionnent simultanйment dans les deux disciplines en question. La liste finale est prйsentйe dans l’annexe numйro 1. Les caractйristiques des termes qui sont dйcrites dans le tableau sont les domaines de leurs applications, la frйquence des leurs apparitions dans les textes analysйs, la dйfinition dans la langue source, la traduction et la dйfinition du terme йquivalent dans la langue cible. 

II.1.1.5. Etablissement des fiches terminologiques pour les termes homonymiques interdisciplinaires

La liste des termes extraits de notre corpus, la description de leurs propriйtйs et une analyse de leurs emplois nous ont permis d’йtablir les fiches terminologiques pour chaque terme d’aprиs les normes formulйes par l’Organisation internationale de normalisation [30, p. 15-28]. Ainsi, nous avons conзu deux entrйes terminologiques pour chaque unitй, dont une prйsente les caractйristiques propres au concept biologique et l’autre les mкmes informations pour le concept linguistique. Considйrons quelques exemples de ces fiches. Les donnйes complиtes sont prйsentйes dans l’annexe numйro 2.

Tableau 2. Fiche terminologique “liaison” biologie

Nom de catйgorie

Donnйes terminologiques

terme principal

terme fr: liaison

traduction

terme ru : сцепление

unitй phrasйologique

unitй phrasйologique fr: liaison absolue

unitй phrasйologique ru: полное сцепление

partie du discours

partie du discours fr: nom

partie du discours ru: nom

genre grammatical

genre fr: fйminin

genre ru: neutre

nombre grammatical

nombre fr: singulier

nombre ru: singulier

champ thйmatique

champ thйmatique: biologie

dйfinition

dйfinition fr: Groupe de deux ou plusieurs gиnes d'un mкme chromosome, situй sur des loci trиs proches et transmis simultanйment а la descendance.

dйfinition ru: Совместная передача двух или более генов, лежащих в одной хромосоме, от родителей потомкам.

contexte

contexte fr: Le degrй de liaison mesurй par le pourcentage de recombinaisons entre loci, indique une distance gйnйtique que l'on exprime en centimorgans.

contexte ru: Сила сцепления между генами зависит от расстояния между ними: чем дальше гены располагаются друг от друга, тем выше частота кроссинговера и наоборот.


Le tableau 2 nous prйsente une fiche terminologique conзue pour le terme “liaison” dans son sens biologique. Dans ce tableau nous voyons une catйgorie obligatoire “terme principal”, qui comporte l’information sur la forme linguistique de l’unitй terminologique en question, et des catйgories avec les informations terminologiques gйnйrales comme “nombre grammatical”, “champ thйmatique”, “dйfinition” et d’autres, ainsi que des catйgories avec les informations axйes sur l’activitй traductologique de l’utilisateur telles que “traduction”, “dйfinition ru”, “contexte ru” et toutes les autres qui incluent la mention de la langue cible “ru”.

Tableau 3. Fiche terminologique “liaison” linguistique

Nom de catйgorie

Donnйes terminologiques

terme principal

terme fr: liaison

traduction

terme ru : связывание

unitй phrasйologique

unitй phrasйologique fr: liaison facultative

unitй phrasйologique ru: факультативное связывание

partie du discours

partie du discours fr: nom

partie du discours ru: nom

genre grammatical

genre fr: fйminin

genre ru: neutre

nombre grammatical

nombre fr: singulier

nombre ru: singulier

champ thйmatique

champ thйmatique: linguistique

dйfinition

dйfinition fr: Habitude de prononciation qui consiste а unir la derniиre consonne d'un mot habituellement non prononcйe а la voyelle initiale du mot suivant.

dйfinition ru: Явление в языке, когда в речевом потоке в положении перед гласным произносится конечный согласный, непроизносимый в изолированном слове.

contexte

contexte fr: La liaison est obligatoire, dans le groupe nominal, entre le dйterminant (article, dйterminant possessif, indйfini, numйral, interrogatif ou exclamatif) et le nom qu’il accompagne, ou avec l’adjectif qui prйcиde ce nom.

contexte ru: Связывание обязательно между детерминативом (артиклем, притяжательным, указательным, неопределенным или вопросительным прилагательным) и следующим за ним словом (существительным, прилагательным или местоимением.


Le tableau 3 a йtй йgalement conзu pour le terme “liaison” mais dans son sens linguistique. Les catйgories restent les mкme pour toutes les fiches terminologiques tandis que les donnйes changent pour chaque terme en fonction de son contexte thйmatique d’emploi. Ainsi, de telles entrйes terminologiques peuvent aider а choisir la traduction йquivalente suite au traitement du corpus proposй dans notre projet. La mйthode йlaborйe йtablie la discipline а laquelle appartient le texte en question. Puis, grвce aux informations qui sont indiquйes dans la fiche terminologique dans la catйgorie “champ thйmatique”, il sera possible de fixer le sens du terme homonymique au sein du domaine de son usage.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12