Ana PANO ALAMAN, Valeria ZOTTI (éds.), The Language of Art and Cultural Heritage. A Plurilingual and Digital Perspective

Ana Pano Alamán, Valeria Zotti (éds.), The Language of Art and Cultural Heritage. A Plurilingual and Digital Perspective, Newcastle upon Tyne, Cambridge Scholars Publishing, 2020, 284 pp. 

L’ouvrage édité par Ana Pano Alamán et Valeria Zotti rassemble treize contributions, en anglais, en français, en italien et en espagnol, qui analysent le discours sur l’art et le patrimoine culturel dans sa dimension plurilinguistique et dans ses mutations dues au numérique. En effet, la communication numérique représente, selon les éditeurs de l’ouvrage, la clé de voûte de la communication actuelle dans ce domaine et l’un de ses principaux défis. Ana Pano Alamán et Valeria Zotti se proposent de fournir un aperçu sur les recherches concernant la communication dans le domaine de l’art et du patrimoine artistique ainsi qu’une description des principales stratégies employées dans ce contexte fortement influencé par la dimension globalisée de la communication. L’ouvrage est divisé en trois chapitres à savoir a) linguistique de corpus, b) lexicographie numérique et c) Web genres.

La première section, Corpus Linguistics, est centrée sur la création, le déploiement et l’exploitation des corpus concernant l’art et le patrimoine culturel.

Le premier article, On Translating Art and Heritage Discourse from Italian into English: From a Learner Corpus to a Specialized Corpus, est consacré aux enjeux de la traduction de textes du tourisme, de l’italien vers l’anglais, dans un contexte d’apprentissage des langues de spécialités. Comme les auteurs, Monica Turci et Gaia Aragrande, le précisent, ce projet, issu d’une collaboration entre l’Université de Bologne et d’autres institutions dont le Ministère de la culture et du tourisme de la Région Émilie-Romagne, montre à la fois l’importance de la traduction non professionnelle dans le contexte d’apprentissage et l’apport des acquis de la linguistique de corpus.  

Dans sa contribution, Between Philology, Lexicography and Art History: The ItalArt project, Alessandro Aresti présente le projet ItalArt. The language of the Arts and Architecture in Italy between the Middle Age and the Renaissance, qui s’inscrit dans le projet OVI (Opera del Vocabolario Italiano) visant la création d’un vocabulaire historique de la langue italienne. Le projet ItalArt, explique Aresti, consiste dans le déploiement du corpus du vocabulaire historique de la langue italienne grâce à la numérisation des ouvrages de l’historien d’art Gaetano Milanesi, à savoir, Documenti per la storia dell’arte senese (1854-1856) et La scrittura di artisti italiani (secoli XIV et XVII) du 1876.  

Irene Buttazzi et María Cecilia Ainciburu s’intéressent, dans leur étude, Reactividad emocional ante la obra de arte en la lengua extranjera. Observaciόn de producciones lingüísticas multimodales en un grupo de estudiantes italόfonos, aux influences de la langue sur la réaction cognitive et esthétique face à l’œuvre d’art. En l’occurrence, les auteurs analysent un corpus de textes rédigés par un groupe d’étudiants apprenant l’espagnol, qui décrivent leurs impressions (en espagnol et en italien) face à trois tableaux de Botero. Cette étude montre les différences du traitement des stimuli de la part des apprenants selon qu’ils s’expriment en italien, leur langue maternelle, ou en espagnol, langue étrangère.

Dans sa contribution, Cultural Heritage Lexicon: A Case Study, Riccardo Billero décrit le projet de recherche concernant le Lexique du patrimoine culturel (Lessico dei beni culturali-LBC) qui a été mis en place au sein du Département de Langues, Littératures et Études interculturelles de Florence et dont le but est de créer des ressources numériques utiles aussi bien pour les traducteurs spécialisés que pour les opérateurs touristiques. Billero illustre, en particulier, le travail d’enrichissement du projet par six corpus comparés concernant le patrimoine artistique et culturel de Florence et de la Toscane en anglais, français, espagnol, russe, italien et allemand. L’approche est axée sur une analyse contrastive des textes disponibles en ligne exploitant le potentiel offert par un modèle basé sur un corpus spécifique (corpus-based study).

Le corpus du Lexique du patrimoine culturel de la langue russe (Corpus LBC) constitue également une des ressources importantes dans l’analyse menée par Marcello Garzaniti, Alle origini delle relazioni culturali e artistiche fra Russia e Italia: il termine russo frjag e la sua storia. Suivant une approche diachronique et interculturelle, Garzaniti se penche sur l’étude lexicographique du terme frjag, désignant les architectes italiens travaillant en Russie, en particulier à Moscou, à partir du XVe siècle qui voit la reconstruction du Kremlin. Grâce à la consultation de multiples sources encyclopédiques et à l’exploitation des corpus, particulièrement utiles pour les termes sémantiquement complexes, Garzaniti analyse les différents champs sémantiques du terme et de ses dérivés, en démontrant son importance considérable dans le cadre du domaine artistique en dépit de sa rareté.

Dans son étude comparée, Lexical Association as an Indicator of Conceptual Convergence and Divergence in English, French and Italian, Daniel Henkel se pose une question captivante visant tout d’abord à déterminer dans quelle mesure le vocabulaire spécifique utilisé pour décrire trois sous-domaines des arts visuels et du spectacle, à savoir la musique, la peinture et la sculpture, est similaire en anglais, en français et en italien. Le corpus d’analyse est extrait de Wikipedia par le biais du logiciel BootCat. À partir d’un échantillon de mots, l’auteur étudie leur fréquence d’utilisation et leurs connotations. Il en ressort que le français et l’italien partagent de nombreux traits conceptuels contrairement à l’anglais, qui aurait tendance à s’éloigner « conceptuellement » des deux langues néo-latines.

La deuxième section, E-Lexicographie, est consacrée à la lexicographie numérique qui marque un tournant dans la lexicographie contemporaine. Les auteurs se proposent d’analyser l’apport de la lexicographie numérique dans les domaines de l’art et du patrimoine culturel. Ils décrivent les exploitations et le déploiement des ressources disponibles, en particulier dans le domaine de l’architecture et du tourisme, ainsi que les enjeux liés à leur consultation en libre accès.   

Dans le premier article de cette section, Monika Bogdanowska propose une réflexion sur Defining Architecture : Considerations in the Field of Architectural Corpora. Elle se focalise sur la terminologie de l’architecture et, plus précisément, sur certaines particularités liées à l’élaboration d’un dictionnaire multilingue de l’architecture (New Dictionary of Architecture, NDA), qui se veut novateur, basé essentiellement sur les langues européennes, en particulier sur l’anglais. Pour y parvenir, Bogdanowska s’inspire des dictionnaires dits « populaires » et « académiques », mais se montre réticente à adopter l’ordre alphabétique pour la construction de la nomenclature. Elle y préfère des « sous-chapitres thématiques » qui peuvent renfermer des définitions, des illustrations, des commentaires, etc.

Suivant une approche lexicographique, Nathalia Gasiglia contribue à l’ouvrage par sa réflexion sur la Typologie des dictionnaires numériques de français illustrée par des mots du vocabulaire patrimonial. Elle met en avant un travail lexicographique comparatif entre les dictionnaires papier et les dictionnaires électroniques, en particulier les dictionnaires génériques, encyclopédiques et spécialisés, avec une attention particulière à trois mots à l’étude, à savoir art, balustre et gouache. La comparaison est suivie d’une analyse qui entend souligner les caractéristiques des différents dictionnaires et leur visée éditoriale spécifique pour délimiter un public précis et pour mieux cerner la clientèle cible. Gasiglia identifie douze sous-ensembles de dictionnaires en référence aux mots de son étude et examine leur portée et leurs entrées pour repérer les occurrences potentielles. En conclusion, l’hétérogénéité des données est telle que les informations syntaxico-sémantiques en viennent à être beaucoup plus intéressantes car elles permettent de différencier en tout ou en partie les différents dictionnaires consultés.

Dans la neuvième contribution de l’ouvrage, Art and Cultural Heritage in the Slovenian Tourism Corpus and E-dictionary, Vesna Mikolič décrit son expérience dans la création d’un corpus centré sur le tourisme (TURistični Korpus-TURK) qui rassemble des textes en slovène et inclut leurs traductions en italien, anglais et allemand. Mikolič explique les critères de sélection ainsi que le système de balisage du corpus et les avantages de la constitution d’un dictionnaire électronique (TURistični Slovar-TURS) à partir de ce même corpus thématique.

Cette section se clôt par la contribution de Geoffrey Williams, Architecture in the 1701 Dictionnaire Universel: Encoding and Analysing Architectural Terminology with Digital Humanities Methodologies. Williams y explore l’édition de 1701 du Dictionnaire Universel de Furetière, édité par Basnage de Beauval, qui se présente comme un corpus unique, contenant également les références encyclopédiques, en l’occurrence les entrées relatives aux arts, aux techniques et à la science. Dans le cadre du projet BasNum dont l’objectif est l’extraction automatique des termes de l’architecture à partir de documents historiques, Williams décrit les différentes phases de numérisation de l’édition 1701 du Dictionnaire Furetière et de ses éditions successives, à savoir l’utilisation du logiciel Atlas.ti pour le traitement préalable du corpus et le recours au marqueur XML-YEI pour le balisage. Enfin, à travers l’analyse de l’entrée « architecture », Williams illustre le système de construction des ontologies dans le domaine de l’architecture qui rentre dans le projet Basnage.

Dans la troisième section, Web genres, les contributions se concentrent sur l’analyse de la représentation de l’art et du patrimoine culturel sur la Toile qui tient compte des différents aspects caractérisant la communication en ligne, à savoir l’hypertextualité, la multimodalité, etc.

Lola García-Santiago et María Dolores Olvera-Lobo, dans leur contribution intitulée An approach to Information Diffusion of Spanish World Heritage in the Italian Wikipedia, analyse le corpus de Wikipedia et, en particulier, les entrées espagnoles et italiennes concernant le patrimoine culturel mondial situé en Espagne et reconnu par l’UNESCO. La comparaison entre les entrées en espagnol et en italien se concentre, entre autres, sur les entités nommées, les données historiques, mais aussi sur les hyperliens et leur distribution. Si, d’un côté, l’analyse montre l’importance de Wikipedia en tant que ressource performante pour la diffusion du patrimoine artistique, de l’autre, elle relève la nécessité d’uniformiser et de développer les réseaux des entrées dans toutes les versions de cette encyclopédie collective en ligne. 

Lorenzo Devilla analyse, à son tour, Le Patrimoine sarde en français et en ligne : le discours touristique, du papier au numérique. Dans cette contribution, il se penche sur la manière dont les guides touristiques ont changé leur façon de décrire le patrimoine culturel sarde lors du passage du papier au numérique. S’appuyant principalement sur des sites de guides touristiques en ligne, Devilla montre comment ces guides mettent à profit le potentiel communicatif de l’interactivité sur la Toile à travers la présence de forums et de sections consacrées aux commentaires et aux recommandations des lieux visités. Devilla en vient à postuler une sorte de « démocratisation du langage du tourisme », qui a sans doute tendance à élargir la portée énonciative de ces textes, tout en dénonçant une réduction partielle de la valeur didactique des guides analysés.

L’ouvrage se clôt par la contribution d’Alessandra Rizzo intitulée Digital Spaces of Collaboration in Aesthetic Counter Narratives : Hamedullah. The Road Homeand The Mirror Project. Dans le sillage des études en narratologie de Margaret Sumers, Rizzo analyse deux œuvres numériques “esthétiques” centrées sur la représentation des identités marginales telles que celles des immigrés. Elle examine en particulier la construction du sens à travers les méthodes multimodales et leurs effets sur la sollicitation des récepteurs/citoyens du point de vue de l’inter-subjectivité et de la coopération. Enfin, Rizzo se concentre sur l’analyse du langage (verbal et non verbal) employé dans ce contexte et ses implications sociales.

Comme les éditeurs le précisent dans les conclusions de l’ouvrage, la réflexion autour de ce sujet est issue du projet Lessico multilingue dei Beni Culturali (LBC) qui a été entamé à l’Université de Florence en 2013. Ce projet se propose d’élaborer un dictionnaire numérique en français, anglais, espagnol, allemand, portugais, russe et chinois à partir d’un corpus concernant l’art et l’histoire de la Renaissance afin de déployer les ressources numériques existantes telles que l’Encyclopédie de Vasari.

Anteprima in una nuova scheda(si apre in una nuova scheda)

L’ensemble des contributions présentées dans cet ouvrage fait le point sur l’apport déterminant du numérique dans le discours sur l’art et le patrimoine culturel. Il montre non seulement les possibilités d’intégration de nouveaux atouts numériques dans les pratiques discursives mais aussi l’urgence d’en analyser les changements paradigmatiques. Il s’adresse donc à tous les professionnels travaillant dans le domaine de l’art et du tourisme, aussi bien que dans le domaine de la médiation linguistique et la communication.

[JANA ALTMANOVA]

Delphine BERNHARD, Maryvonne BOISSEAU, Christophe GERARD, Thierry GRASS, Amalia TODIRASCU (éds.), La néologie en contexte : cultures, situations, textes

Delphine BERNHARDMaryvonne BOISSEAUChristophe GERARD, Thierry GRASSAmalia TODIRASCU (dir.), La néologie en contexte : cultures, situations, textes, Éditions Lambert-Lucas (« La Lexicothèque »), Limoges, 2018, 304 pages.

Avant de présenter les contributions du volume La néologie en contexte : cultures, situations, textes, Christophe Gérard (« Le contexte, méconnu célèbre des études de néologie », pp. 9-21) souligne la nécessité de contextualiser les néologismes dans la situation sociohistorique et dans la typologie de contextes (extra)linguistiques qui en provoquent l’apparition, mais conclut que l’attention portée aux divers contextes en tant que champs de recherche demeure lacunaire. Si les études se consacrent généralement à la « langue » ou au « domaine » en tant que contextes, beaucoup d’autres possibilités restent insuffisamment explorées, comme par exemple, le « style collectif », la « linéarité du texte », l’« idiolecte », le « point de vue », et surtout les « genres », plus ou moins néologènes et néolophores.

Suit un article de synthèse par Jean-François SABLAYROLLES (« Les néologismes ne naissent pas dans les choux », pp. 23-38) qui, après avoir montré que l’opposition entre néologisme de luxe et nécessaire n’est plus opératoire parce que « rien n’est sans raison », discute la variabilité du degré de « néologicité » selon les langues et les variantes diatopiques d’une langue et selon d’autres facteurs plus ou moins néologènes tels les domaines du savoir, les genres de discours et les époques littéraires. L’auteure montre aussi l’importance d’autres facteurs comme l’extension de la « diffusion » des néologismes et la diversité des contextes dans lesquels ils sont créés, comme la lexicalisation, la déterminologisation, l’échange interdomanial et le contact intralinguistique. Ce qui unit toutes ces pistes est donc le poids que le co(n)texte joue sur l’apparition d’un néologisme.

La première partie, D’une culture à l’autre : traduire et emprunter, se penche sur la traduction et l’emprunt ainsi que sur les risques d’interférences entre les langues et cultures en contact dans l’activité néologique.

Lina SADER FEGHALI (« Dans les coulisses de la traduction lexicale en traductologie », pp. 41-53) aborde le problème de la terminologie de la traductologie en arabe, qui nécessite la formation de néologismes. L’auteure dresse un bilan d’un projet conduit à l’École de traducteurs et d’interprètes de Beyrouth, afin de doter les traducteurs d’une telle terminologie en arabe (accompagnée de définitions, exemples et notes d’usage), par l’adaptation de l’ouvrage quadrilingue (français, anglais, espagnol, allemand) Terminologie de la traduction de Delisle et al. (1999). Sader Feghali présente enfin un nouveau projet de recherche, complémentaire au premier, qui vise les termes de la traductologie et se présente comme un chantier néologique pour l’arabe.

Corinne BRICMAAN (« Traduire les néologismes des discours officiels chinois : entre skopos et soft power. Étude de cas », pp. 55-66) s’intéresse par contre aux néologismes qui habitent les discours chinois autour du soft power – rendu en termes de « force, puissance culturelle douce » (p. 56) qui restaurerait le déficit d’image de la République populaire –, sur le modèle contextuel sociocognitif qui en est à l’origine, et sur leur restitution internationale. L’auteure étudie ainsi les traductions officielles des nouveaux termes chinois, liés aux idéologies de la République populaire aussi bien qu’à ses stratégies politiques internationales. Dans un tel contexte les traducteurs deviennent des instruments de la construction de l’identité nationale et la théorie du skopos perd sa valeur. Ensuite, Bricmaan montre toute la force de la lexie « rêve chinois », que le président Xi Jinping a lancée en 2012 lors d’une visite à l’exposition permanente du Musée national, intitulée « la Voie du Renouveau », et qui incarne le filtre idéologique auquel les traducteurs chinois sont soumis.

Corina VELEANU (« L’entrée des termes anglais en –ing dans le vocabulaire juridique des langues romanes », pp. 67-81) étudie l’intégration de 13 termes juridiques anglais et américains en –ing représentant des nouveaux concepts juridiques (grooming, leasing, dumping, auditing, etc.), aux langues-cultures juridiques de français, roumain, italien, espagnol et portugais, tels qu’ils sont utilisés par les interprètes simultanés du Parlement européen et dans d’autres corpus secondaires. Il apparait que ces termes montrent une grande stabilité sémantique dans le passage d’une langue à l’autre et que les langues-cultures italienne et roumaine sont plus prédisposées à l’intégration d’emprunts, notamment mais non seulement en –ing, alors que le français et le portugais se montrent plus conservateurs, avec une fréquence des anglicismes qui décroit dans le temps au profit d’équivalents et d’officialismes.

Dans leur article, Najet BOUTMGHARINE et John HUMBLEY (« Adapter la class action aux sociétés francophones : enjeux juridiques et linguistiques », pp. 83-96) examinent un corpus journalistique et un corpus juridique afin de décrire l’adaptation du terme « class action », issu de la Common law américaine et concernant le droit des consommateurs, dans différentes sociétés francophones (France, Québec, Belgique, Suisse, UE) relevant du Droit civil, dont ils esquissent la situation juridique par rapport au dispositif réglant les droits collectifs. Ils analysent à la fois le contexte institutionnel qui influence la néologie juridique et administrative (notamment lorsque les formes linguistiques adoptées peuvent refléter la volonté politique du législateur) et la variation textuelle et discursive qui accompagnent les termes afférant à « class action » dans la presse (par exemple, la présence ou l’absence de gloses ou de marques typographiques).

Christine JACQUET-PFAU (« A propos des emprunts néologiques dans le discours journalistique : marquage et commentaires », pp. 97-109) choisit elle-aussi un corpus journalistique afin d’étudier la réception de quelques emprunts néologiques reconnaissables formellement, susceptibles de ne pas être encore compris par le lecteur, issus des modes alimentaires et des pratiques professionnelles. L’auteure analyse le contexte métalinguistique journalistique qui accompagne ces emprunts et qui offre essentiellement des informations linguistiques d’ordre étymologique et définitionnel, auquel s’ajoute la présence du marquage typographique qui véhicule le point de vue du journaliste, notamment pour ce qui est de la synonymie, avec la mention d’équivalents proposés dans un binôme à ordonnancement textuel variable. Jacquet-Pfau se penche enfin sur la position des emprunts dans la structure de l’article, lesquels peuvent être placés aussi dans le titre ou dans les intertitres, avec reprise ou non de l’unité lexicale dans l’article.

Par une collecte de mots effectuée sur le terrain en 2015, Jean-Paul BALGA (« La création lexicale en situation de contact de langues : la morphologie lexicale du français parlé au nord-Cameroun », pp. 111-125) étudie une variété du français du nord-Cameroun, notamment le « dialecte français » parlé à Maroua, influencé par un fort contact plurilinguistique où le français est langue officielle, le fulfulde est langue véhiculaire, mais d’autres langues telles le tupuri, le guisiga, le mundang, le masana, etc. sont employées et fournissent des emprunts. L’auteur mesure l’ampleur du contact entre le français et la socio-culture camerounaise et montre que le dialecte français du nord-Cameroun considéré exploite toutes les stratégies de créativité lexicale issues de la dérivation (impropre, régressive, préfixation, suffixation), tout en privilégiant la composition et l’abrègement de formes françaises ou empruntées aux langues en contact.

La deuxième partie, Point de vue, interprétation et création, s’occupe du rapport que les individus entretiennent avec la langue, qui les conduit à appliquer de différentes conceptions du monde, c’est-à-dire de différents points de vue, aux produits de l’activité langagière, ce qui en influence à la fois la production et la réception.

Dans son article, Philippe SELOSSE (« ‘L’Ordonnance de Soissons’ : la latinisation des phytonymes vernaculaires français dans le De Natura Stirpium de Jean Ruel (1536) », pp. 129-143) met en exergue l’originalité du premier recensement de la nomenclature vernaculaire française des plantes, proposé par le botaniste Jean Ruel dans son De Natura Stirpium (1536), qui consiste en la latinisation des phytonymes locaux français, jusque-là n’existant qu’en forme orale, dans un esprit ouvertement humaniste. Cette conception, éloignée de la démarche néonymique moderne, a permis à Ruel de recueillir les emprunts (sans ou avec latinisation et ajout d’un affixe flexionnel) et les calques (morphologiques ou référentiels) en usage à l’époque, et d’en légitimer l’emploi en reliant le savoir français sur les plantes au savoir ancien, par le biais d’une « néo-latinisation ».

Françoise Dufour et Fanny RINCK (« Castorin, maltolé, ozonique… La créativité lexicale dans les descriptions d’odeurs par les experts », pp. 145-158) s’intéressent au domaine des odeurs et à la créativité lexicale (caractérisée d’emprunts à l’anglais et de dérivations adjectivales) d’un discours spécialisé dépourvu d’une nomenclature univoque. Ils ont sollicité 35 experts parfumeurs et aromaticiens à évoquer 20 molécules odorantes distinctes, et ont étudié la dimension langagière de leur expertise, telle qu’elle s’exprime dans la description olfactive. Il en résulte, d’un côté, une pluralité de descripteurs choisis par les experts afin de verbaliser les sensations évoquées par une même molécule – ce qui témoigne du caractère subjectif de la perception, qui conditionne le discours de l’olfaction et lui confère une dimension idiolectale – et, de l’autre côté, que ces termes ne coïncident pas avec ceux qui seraient employés par un non-expert, ce qui en confirme par contre le degré de spécialisation et la nécessité « de se mettre d’accord à plusieurs sur ce que ‘ça’ sent » (p. 146).

L’implication de la subjectivité dans la perception des néologismes fait également l’objet de l’étude de Jean-François SABLAYROLLES (« Interprétation de néologismes en co(n)textes », pp. 159-166), qui montre que le recours aux gloses explicatives témoigne souvent de l’autocritique du sujet parlant envers sa création (par exemple, dans le cas d’adaptations transcatégorielles inusitées), soit-elle formelle ou combinatoire, mais toujours relevant du contexte énonciatif. Dans le cas des néologismes, l’activité interprétative mise en place par les récepteurs ne se limite pas à la compréhension d’un néologisme hors contexte, mais s’efforce d’en reconnaitre aussi les motivations. Cette tendance les oblige à mobiliser une série de compétences langagières relevant de la prise en compte du co(n)texte de la création lexicale (allant par exemple de la comparaison avec des lexies préexistantes à la prise en considération de la combinatoire lexicale).

254 noms en –eux désignant des humains (NH-eux) font l’objet de l’étude de Ann-Lise ROSIO (« Comparaison de contextes d’emploi des néologismes nominaux en –eux désignant des humains », pp. 167-181) qui en propose une description sémantique, référentielle et modale, afin de dépasser le concept trop vague de « connotation négative ». Il s’avère que la plupart de ces noms en –eux, suffixe très productif mais peu étudié et présenté par le TLF comme formateurs d’adjectifs, sont employés par les locuteurs afin d’exprimer leur point de vue, qu’ils relèvent de la modalité aléthique classifiante ou bien de la modalité appréciative axiologique. À ce stade de la recherche, il résulte également que la modalité appréciative négative se montre indépendante des types de contexte d’usage ou de la spécialisation des sources, alors que le degré de lexicalisation des NH-eux semble se déplacer du formalisme initial vers des contextes plus informels.

La troisième partie, Rôles du contexte dans les domaines de spécialité, déplace l’attention vers les terminologies spécialisées.

L’étude de Isabel DESMET et Sandra de CALDAS (« Création lexicale et variation en portugais et en français contemporains : contextes, textes et discours dans les sciences sociales, économiques et financières », pp. 185-200) analyse les manifestations de quelques mécanismes de création lexicale dans un corpus de 400 articles de presse généraliste et de spécialité dans les sciences sociales, économiques et financières, écrits en français et en portugais, et recueillis à partir de la présence de l’emprunt « yield ». Ce corpus permet aux auteures d’illustrer différentes techniques de substitution de termes spécialisés et de création d’équivalents, aussi bien qu’une multiplicité de variations contextuelles, textuelles et discursives, conduisant vers la synonymie terminologique. Cependant, elles concluent à ce que le flou dénominatif dû à la surabondance de variantes terminologiques touche essentiellement le niveau de la vulgarisation (dans lequel la présence d’un marquage typographique incohérent ne s’avère pas parlant pour ce qui est du degré d’intégration des termes), car cette profusion ne se retrouve pas dans des textes spécialisés.

La diversité des domaines de spécialité fait également l’objet de l’étude de Hélène LEDOUBLE (« Problématiques liées à la diffusion de créations lexicales ‘complexes’ : divergences interprétatives autour de l’unité sociodiversité dans les discours scientifiques », pp. 201-215), qui – à l’aide d’un corpus de 182 articles scientifiques (1994-2015) – montre que l’amalgame sociodiversité connait un usage instable tant au plan formel que sémantique, ce qui est rendu plus évident par l’absence d’une définition de référence. Son sens semble donc déclencher de nombreuses interprétations divergentes au sein du discours scientifique francophone. Si la lexie se caractérise par deux sèmes essentiels, /pluralité/ et /êtres vivants/, les autres sèmes qui lui sont tour à tour associés (par exemple, /citoyens/, /modes de vie/, /espèces animales/, /bâtiments/, etc.) varient en fonction du contexte d’emploi, décliné en forme de définition, glose, explicitation, etc. et selon le domaine disciplinaire dans lequel on l’emploie (sciences de l’environnement, sociologiques, agronomiques, de la vie, économiques, juridiques, etc.).

Anne CONDAMINES (« La transitivation des compléments circonstanciels dans le sport et les loisirs, en situation d’implication affective : néologie sémantique ou simple variation argumentale ? », pp. 217-229) se concentre sur le domaine du sport et des loisirs et observe une modification syntaxique remarquable, c’est-à-dire la transitivation des compléments circonstanciels, notamment dans des co(n)textes qui impliquent et manifestent la subjectivité du locuteur. Ainsi, il s’avère que souvent dans les blogs, les sites personnels et les forums concernant la pêche et la chasse (sondés via Google), le complément circonstanciel indiquant le lieu d’une activité se trouve en position d’argument-objet, dans des constructions de type [pêcher + dét. + rivière] ou [chasser + dét. + N]. Celles-ci semblent véhiculer une dimension affective et attribuent aux deux verbes pris en considération un sens nouveau, étroitement lié à des situations de communication particulières, qui n’est pas (encore) recensé dans les dictionnaires. 

Jana ALTMANOVA (« Les dérivés de l’onomastique commerciale entre brandverbing et créativité des locuteurs », pp. 231-244) s’intéresse quant à elle au statut linguistique de l’onomastique commerciale et de sa sémantique, notamment à l’implantation lexicale des noms de marque (NdM) et des noms de produits (NdP). Elle analyse en particulier la manière dont les locuteurs modifient et transforment un certain nombre de NdM et de NdP – recueillis dans des blogs et de forums, qui semblent être un terrain propice à leur émergence – lesquels, étant des noms propres, fonctionnent de manière différente en fonction du degré de lexicalisation qu’ils atteignent et de leur charge lexiculturelle. Ainsi, des dérivés créatifs et originaux concernant plusieurs classes morphologiques (dérivés verbaux, adjectivaux, nominaux et dérivés par troncation) fleurissent dans certains contextes énonciatifs, qui demeurent d’importance capitale pour leur interprétation.

La quatrième partie est consacrée à la Détection et documentation automatique des néologismes, accomplies par la linguistique informatique qui a désormais développé des outils puissants, comme Logoscope ou Néoveille pour le français, mais qui doit encore résoudre des problèmes de taille. Les trois contributions suivantes visent donc, chacune selon son approche, à éclairer la nécessité de prendre en considération des facteurs contextuels pour le traitement automatique de la néologie.

L’approche statistique et textométrique de Frédéric ERLOS (« Sur la houle des données textuelles : enjeux du pilotage d’un dispositif textométrique dédié au repérage des néologismes d’un sociolecte », pp. 247-264) vise à identifier les néologismes sans recourir à un corpus d’exclusion externe. Sa méthode se fonde sur une « norme endogène », notion sur laquelle l’auteur développe une réflexion rigoureuse, qui consiste en l’emploi d’un dispositif outillé organisé sous la forme de séries textuelles chronologiques (STC), notamment dans le genre discursif du « parler d’entreprise » (circulaires et documents de référence, 2010-2014). Cette démarche compare le vocabulaire d’un ensemble de textes avec le dernier texte qui lui est ajouté, et extrait des candidats néologismes à l’aide de techniques statistiques non seulement sur la base de leur originalité, mais aussi de leur spécificité et fréquence dans le texte ajouté.

Selon Yulya KORENCHUK (« Identification automatique de familles morphologiques et de néologismes », pp. 265-279) l’extraction de néologismes terminologiques à fréquence faible gagne à être enrichie par le regroupement de termes proches même lorsqu’ils ne suivent pas l’ordre alphabétique. Elle travaille donc à l’identification automatique de familles morphologiques en français, anglais et allemand, par le biais d’un moyen original : les « n-grammes de caractères », c’est-à-dire des séquences de caractères d’une longueur définie n, extraites à partir de termes candidats dans leur forme lemmatisée. Par exemple, à partir du terme nanostructure, elle obtient les quadrigrammes « nano », « anos », « nost », « ostr » et « truc », acquis directement à partir du corpus analysé et lancés à la recherche de néologismes qui les contiennent. Bien qu’une validation manuelle demeure nécessaire, dans les domaines spécialisés considérés les scores moyens sont très élevés, surtout pour l’anglais (97,33%) et l’allemand (95,67%) alors qu’ils restent en peu plus bas pour le français qui s’atteste à 89,33%.

Si les deux contributions précédentes se penchent notamment sur la détection des néologismes, l’article de Amalia TODIRAŞCU (Néologie et genres textuels : comment caractériser les genres journalistiques pour la classification automatique ? », pp. 281-297) souligne que celle-ci doit nécessairement être liée à la documentation de leurs contextes. La documentation doit elle aussi être automatisée afin d’éliminer l’intervention humaine, et doit tenir compte du lien entre le genre et la création lexicale, puisque le genre influence, entre autres, le choix du vocabulaire et fait partie des variables discursives qui aident l’interprétation sémantique et formelle des néologismes ainsi que leur diffusion. L’objectif de l’auteure est donc d’intégrer au projet Logoscope une classification automatique des genres journalistiques (éditorial, nécrologes, brèves, etc.) permettant de les identifier à partir de diverses propriétés linguistiques et d’identifier, par conséquence, les néologismes qui y apparaissent.

[Chiara PREITE]

Marie-José BÉGUELIN, Gilles CORMINBOEUF, Florence LEFEUVRE (éds.), Types d’unités et procédures de segmentation

Marie-José BÉGUELIN, Gilles CORMINBOEUF, Florence LEFEUVRE (éds), Types d’unités et procédures de segmentation, Limoges, Lambert-Lucas, 2019, pp. 270.

Comme Marie-José BÉGUELIN, Gilles CORMINBOEUF et Florence LEFEUVRE le remarquent dans l’Avant-propos (pp. 9-12), Types d’unités et procédures de segmentation se veut un aperçu des unités linguistiques en usage par rapport à leur histoire, aux analyses, aux pratiques de segmentation et d’annotation dont elles sont à l’origine, à leur application dans des domaines variés, à savoir la syntaxe, la sémantique, la phraséologie, la structuration textuelle, la didactique du texte, l’analyse du discours et des conversations, le traitement et l’étiquetage de corpus oraux et la psycholinguistique de corpus écrits. Si, en effet, différents courants ont abordé le phénomène de la segmentation des unités linguistiques en l’adaptant aux fins des analyses conduites – tel est le cas du Groupe aixois de recherches en syntaxe, du modèle genevois, du Groupe de Fribourg, mais aussi de recherches sur les phrases averbales, sur les constructions, sur le jet textuel –, la question des unités a retenu l’attention de chercheurs suivant des modèles et adoptant des positions différents, comme il ressort des sections et des chapitres qui composent ce travail, dont l’objectif est entre autres de mettre en lumière la diversité des approches présentées en vue de faire avancer la réflexion collective sur le sujet abordé. Ainsi cet ouvrage est-il structuré autour de trois volets principaux à la fois répartis en chapitres, suivis par la Bibliographie générale (pp. 221-238), l’Index nominum (pp. 239-244), l’Index rerum (pp. 245-256) et les résumés de chaque chapitre en français et en anglais (pp. 257-268).

La première partie du volume, Enjeux épistémologiques (pp. 13-82), se compose de quatre chapitres.
Dans le premier chapitre, De la langue au texte : à la recherche des unités perdues (pp. 15-32), Pierre LE GOFFIC s’interroge sur le statut théorique des unités linguistiques relativement à la tripartition langue/ discours/ texte, en analysant la manière dont la grammaire a traité ces unités dans le temps et dans le rapport au texte pour ensuite souligner leur rôle dans le cadre de la linguistique de corpus. Le grammairien part de l’opposition, rapportée au langage, entre la puissance et l’acte – le langage en acte se présentant à la fois sous l’aspect du discours ou sous l’aspect du texte – pour souligner que, au-delà de leur hétérogénéité, ces termes sont inséparables, mais également que c’est le texte qui est le plus variable et sujet à variations. A partir d’un exemple d’échantillon d’exposé réellement produit, il montre qu’il est possible d’y reconstituer le déroulement du discours dans le temps, de constater que le locuteur a une compétence linguistique solide, de mettre en évidence le statut incertain du texte en raison de l’effort du locuteur de transformer en mots son intention de signification et de la transmettre à son interlocuteur afin que celui-ci l’interprète, et, au fond, de s’interroger sur le statut des unités. Pour aborder ce dernier aspect, LE GOFFIC compare le paradigme classique qui va de la langue au discours et qui voit donc dans la proposition la seule unité linguistique possible, le texte n’ayant pas d’existence propre mais étant ramené au discours et s’identifiant avec celui-ci, avec le paradigme moderne, développé à partir du XIXe siècle, qui voit d’abord l’émergence du texte écrit, par l’appui sur la phrase en tant qu’unité appartenant à la fois à la langue et au texte, ensuite du texte oral, depuis la fin du XXe siècle. Dans ce contexte, c’est l’irruption de la technologie qui fait perdre à l’oral sa volatilité et qui permet à la phrase de devenir une unité de la langue et du texte, écrit ou oral. Par ce survol, l’auteur pose donc la question de la segmentation des textes à la lumière de la distinction écrit/ oral et, dans ses remarques conclusives, il souligne le contenu vide de la phrase, en tant qu’unité de la langue et du texte, tout comme, pour autant, son rôle comme modèle de langue. Quant au discours, il relève les défis posés par l’élaboration d’un véritable modèle de discours ou de performance pouvant rassembler les travaux existants, et il laisse enfin ouverte la question de la segmentation des textes en raison du manque d’une procédure adéquate sur le sujet, en dépit des avancées de la technologie.
Le deuxième chapitre, rédigé par Dominique LEGALLOIS, aborde les « comportements » discursifs des constructions grammaticales et la relation grammaire-discours qui leur est sous-jacente (Les constructions grammaticales comme schémas pré-discursifs, pp. 33-44). L’étude de la métafonction textuelle des constructions, dont la fonction est la structuration du discours, permet à l’auteur de montrer que la compétence grammaticale et discursive des locuteurs se compose entre autres également d’unités non discrètes n’appartenant ni aux unités phraséologiques ni aux unités lexicalisées. Pour ce faire, il se sert de trois exemples qui indiquent l’imbrication entre grammaire, discours et compétence des locuteurs : l’organisation narrative relevant du schéma narratif préparatoire – désormais disparu –, liant à la fois un motif et l’expression du trinôme datation-circonstance-événement ; le schéma, inhérent à la pratique sociale, de clôture/ rupture, dont est présenté le fonctionnement discursif inhérent issu de la compétence des locuteurs et la complémentarité de plusieurs constructions de niveaux différents ; le first verb (emprunté à Sacks (1992)), consistant en un indicateur verbal d’une structure organisationnelle liée à un phénomène d’attente et de projection par lequel émerge une connaissance préétablie et mémorisée, donc préalable dans la compétence des locuteurs. LEGALLOIS relève ainsi que ces formes conventionnelles, illustrées par les trois cas de figure ci-dessus, ont en réalité une dimension a priori et sont des préfigurations du discours, souvent schématiques, qui sont appelées à contribuer à l’organisation des discours.
Dans le ch. 3, De la textualité narrative aux faits syntaxiques dans un écrit scolaire. Peut-on articuler micro- et macro-syntaxe dans une perspective didactique ?, pp. 45-63), Caroline MASSERON présente une analyse ponctuelle d’écrits scolaires réellement produits dans une perspective de formation des maîtres de français et des enjeux didactiques posés par ce type d’écrits. En distinguant la dimension de la langue de celle du discours, dans l’échantillon choisi, comprenant quatre productions narratives écrites réalisées par des élèves dans les mêmes conditions – en fin de cycle primaire ; même âge ; même consigne autour d’un épisode passé – à Libreville et à Metz, l’auteur examine les unités de segmentation, les rangs de structuration de celles-ci, ainsi que les règles et les indicateurs permettant d’effectuer une segmentation d’un texte complet. Elle souligne ainsi la « fragilité syntaxique » du modèle, très répandu, de la phrase graphique écrite, dominant l’analyse des écrits scolaires, tout comme les « fragilités » relevées au sein des quatre écrits d’enfants. L’auteur fait alors appel à l’influence des unités de rang supérieur et de la rédaction elle-même ; aux phénomènes de redénomination ; au faible apport de la mémoire discursive, tout comme au type de périodes et aux unités « pivots », pour prouver que la segmentation des productions est essentielle pour identifier les mécanismes d’encodage textuel et les erreurs qui en découlent, mais aussi que le recours à une démarche alliant micro- et macro-syntaxe ainsi que l’enseignement des phénomènes de cohésion et de l’enchaînement transphrastique devraient être questionnés dans le cadre d’une perspective didactique renouvelée.
Le dernier chapitre de cette section, Récursivité des unités dans les discours : enjeux épistémologiques et sémantico-pragmatiques (pp. 65-82), rédigé par Annie KUYUMCUYAN, aborde, à partir de l’approche de Benveniste (1966), la constitution de l’unité de discours dans le discours et les reconfigurations éventuelles que celle-ci reçoit par le biais de ce traitement. C’est au sein du cadre dialogal, à l’appui d’exemples tirés de dialogues apparaissant au sein de textes littéraires et d’une approche comparant le modèle hiérarchique de Roulet (2001) avec celui du Groupe de Fribourg (2012), que l’attention de l’auteur est dans un premier temps focalisée sur l’intervention en tant qu’unité de dialogue minimale appliquée à des enchaînements dialogaux inférieurs au format propositionnel – tirés de Diderot et de Simenon et au sein desquels l’enchaînement dialogal est opposé à l’enchaînement monologal –, composés de propositions incomplètes, pour souligner que l’analyse syntaxique de ces répliques partielles est soumise aux tours de parole des interlocuteurs. Il s’ensuit une comparaison avec un dialogue narratif complet, tiré d’une nouvelle de Mérimée, dont l’analyse peut donner lieu, selon KUYUMCUYAN, à deux lectures distinctes selon le processus dynamique d’interprétation du segment discursif examiné de la part du lecteur, qui relèvera soit d’une requête soit d’une question. Celui-ci, en effet, en segmentant le fragment discursif, hiérarchisera les unités obtenues – à ce propos, l’auteur propose des représentations arborescentes – en vue de placer certaines unités sous la dépendance d’autres unités, créant ainsi une recomposition potentiellement indéfinie des unités et de leur combinaison.

La deuxième partie du volume, Modèles d’analyse et choix de segmentation (pp. 83-162), compte également quatre chapitres.
Dans le chapitre 5, Clauses nominales : prédication ou monstration ? (pp. 84-98), pour étudier les clauses nominales « monorèmes » et leurs retombées sur la théorie générale des unités linguistiques, Alain BERRENDONNER ne s’appuie pas sur la conception vérifonctionnelle du langage, héritée d’Aristote, mais sur une sémantique nominale généralisée. Ainsi montre-t-il que ni l’interprétation prédicative ni la modalité énonciative ne sont des invariants ou des propriétés constantes des syntagmes nominaux. C’est pourquoi il est nécessaire, d’après l’auteur, de changer de perspective pour examiner les interprétations contextuelles des clauses nominales, en adoptant une conception du langage comme activité ostentive-inférentielle dont les fondements reposent sur l’idée que la communication verbale se construit autour d’un dialogue in praesentia et concerne donc une activité gestuelle de monstration, et que le langage n’est pas une activité verifonctionnelle mais fictionnelle. Dans ce cadre, l’auteur relève que le syntagme nominal – le modèle nominal est généralisé à tous les énoncés – est l’acte ostensif d’un nom, dont l’acte de langage est la désignation d’un objet-de-discours, et que divers effets peuvent être inférés sur la mémoire discursive en termes de localisation, d’apport ultérieur d’informations, de contenu.
Pour sa part, le ch. 6, rédigé par Marie-José BÉGUELIN et Gilles CORMINBOEUF, porte sur les greffes et les segments flottants, à savoir deux types de séquences posant des problèmes de segmentation – leur place syntaxique et leur contenu sémantique – et de délimitation, et d’unités syntaxiques et discursives pertinentes, respectivement (Segmentation en unités : le cas des « greffes » et des « segments flottants », pp. 99-129). A partir d’extraits tirés de la base de français oral Ofrom et d’exemples de français écrit (Frantext), les auteurs distinguent ces segments d’autres structurations apparentées mais distinctes de ceux-ci. Si les greffes d’une construction verbale sont examinées quant à leur position syntaxique – à la suite du verbe ; sous une rection prépositionnelle ; en position adnominale ; en position nominale, après un déterminant ; en coordination –, au plan sémantique, les constructions verbales greffées peuvent soit signaler des circonstances spatio-temporelles du procès, la manière, ou un dire un cours d’élaboration, soit véhiculer un contenu argumentatif ou épistémique, soit concourir à identifier des référents et/ou enrichir leurs propriétés. Pour ce qui est de la segmentation et du traitement de ces constructions, les auteurs comparent les deux modèles aixois et fribourgeois en vue de proposer une typologie des greffes à partir d’une modélisation dynamique de ce phénomène. Relativement aux segments flottants, organisés autour d’une structure ternaire (ABC), à l’appui d’exemples et des cas de figure qui y apparaissent, les auteurs confirment la parenté de ces segments avec la notion grecque d’apo koïnu en identifiant quatre configurations pragma-syntaxiques caractérisées par une rupture et une reprogrammation ; un couplage de deux structures attributives ; des « îles flottantes » ; des syllepses syntagmatiques, respectivement. Il émerge non seulement que le terme B n’a pas de statut syntaxique homogène, mais également que les quatre cas de figure mettent en évidence une adaptation du locuteur aux besoins immédiats et entraînent une réanalyse fonctionnelle instantanée. Il émerge par ailleurs que les greffes et les segments flottants, loin d’être des phénomènes typiques du français parlé, sont à bien différencier d’autres phénomènes ; que le contexte métanalytique joue un rôle central dans le cas des greffes ; que les notions de « mémoire discursive », de routines périodiques et de « métanalyse » en usage, empruntées au modèle fribourgeois, contribuent à l’analyse de ces segments.
Dans le ch. 7, La configuration discursive unité résomptive / unité prédicative c’est vrai, P du type c’est vrai, je t’ai un peu oublié (pp. 131-147), Florence LEFEUVRE examine le schéma c’est vrai, P et ses deux variantes P, c’est vrai et c’est vrai au sein de P à partir des deux unités prédicatives qui le composent, dont l’une, exemplifiée par je t’ai un peu oublié pendant ce bienheureux printemps (Frantext), est autonome et l’autre, c’est vrai, joue le rôle d’unité résomptive caractérisant ou modalisant la première unité. L’approche théorique suive par l’auteur repose sur Le Goffic (1993 ; 2011), à savoir sur une conception de la phrase ou des unités discursives à l’interface de la syntaxe et du discours. L’attention est d’abord focalisée sur le lien sémantique entre l’unité résomptive et l’unité prédicative, ce qui montre que ces deux unités représentent un tout sur le plan sémantique. L’analyse se poursuit ensuite par l’étude des contraintes syntaxiques de c’est vrai : cette unité est syntaxiquement dépendante de l’unité prédicative, mais l’ensemble de ces unités constitue, selon LEFEUVRE, une « période discursive », c’est-à-dire une unité supérieure constitutive du discours pourvue de valeurs discursives au niveau argumentatif. Celles-ci donnent lieu à trois moments argumentatifs principaux : le renforcement ; la justification ou l’exemplification ; la restriction.
Le dernier chapitre de la deuxième section, rédigé par Georgeta CISLARU et Thierry OLIVE, porte sur des phénomènes d’« amorçage » dans le cadre du processus de textualisation, notamment dans un processus de rédaction enregistré en temps réel (Dynamiques d’amorçage au cours du processus de textualisation dans l’écriture enregistrée, pp. 149-162). En tant que processus d’actualisation d’une unité linguistique activant une attente, l’amorçage est étudié par les auteurs en termes linguistiques et psycholinguistiques, relativement aux types de catégories grammaticales et de relations sémantiques, en particulier par rapport aux jets textuels – en examinant leurs frontières et plus en particulier leur borne droite –, pour catégoriser les phénomènes d’amorçage figurant dans le corpus examiné, traité dans la deuxième partie de l’étude. Celui-ci, composé de rapports éducatifs et de dossiers académiques dont le processus de rédaction a été enregistré en temps réel par le biais des logiciels Inputlog et Scriptlog, vise à examiner une sélection de groupes de jets textuels en fonction de leur borne droite et des suites projetées. Trois niveaux de saillance d’amorçage y sont identifiés : si les attentes de nature syntaxique sont soumises à des relations de dépendance et à la combinatoire syntagmatique, les attentes lexico-sémantiques relèvent d’un cadre collocationnel, tandis que les attentes sémantico-fonctionnelles sont à relier à des macrostructures discursives. Il s’ensuit, en termes morpho-syntaxiques, que les catégories des noms, des adjectifs et des verbes sont plus utilisées comme bornes droites projetant une suite dans le processus de textualisation que celles des déterminants et des prépositions : cela est dû, selon les auteurs, aux relations informationnelles et discursives par lesquelles le thème est en attente de spécification et une nouvelle prospection temporelle s’ouvre pour chaque nouveau jet textuel, dont les pauses marquent la frontière entre des séquences à portée générale structurante amorçant une caractérisation ou une spécification.

La troisième et dernière partie du volume, Analyse sur corpus et/ou segmentation outillée (pp. 163-220), est composée de trois chapitres portant sur la langue orale.
Dans le ch. 9, consacré à l’espagnol, Oscar Garcia MARCHENA analyse des corpus oraux à partir du corpus CORLEC représentatif de l’espagnol oral contemporain et les défis qu’ils posent par rapport au concept syntaxique de la phrase comme structure construite autour d’un prédicat verbal et de son sujet (Les fragments comme unités linguistiques : une analyse de corpus de l’espagnol oral, pp. 165-180). L’attention de l’auteur est en particulier focalisée sur deux types d’énoncés sans verbe, c’est-à-dire les phrases averbales et les fragments, dont il met en évidence les difficultés de classement, les sous-types, les propriétés syntaxiques, sémantiques et illocutoires, et la distribution au sein du corpus en vue d’envisager leurs réalisations sous forme d’énoncés différant de la phrase à tête verbale.
Le français parlé fait en revanche l’objet de l’étude de Mathilde CARNOL et Anne Catherine SIMON (Forme et fréquence des constructions verbales en français parlé, pp. 181-201) qui, s’inspirant des travaux de Blanche-Benveniste autour de la syntaxe du français parlé dans la cadre de la grammaire de dépendance, examine le verbe dans la syntaxe de dépendance en tant qu’unité de rection en vue de vérifier la fréquence des unités de rection construites autour d’un verbe et de ses compléments au sein du corpus de français parlé multigenre Locas-F. L’analyse conduite par les auteurs, dans laquelle elles présentent un inventaire des variantes de dispositifs de rection identifiés – dispositif direct ; clivé ; pseudo-clivé ; binarisé ; construction présentative – et la difficulté de classer le dispositif concerné – en témoignent les constructions segmentées réparties en double marquage à gauche et à droite ; en constructions en A c’est B et c’est B A ; en associé lexical –, vise ainsi à établir non seulement la fréquence de ces dispositifs, mais également les types de compléments qui y apparaissent davantage. Il émerge une vision générale du fonctionnement de ces dispositifs en français parlé contemporain, tout comme des remarques qualitatives sur des structures dont l’annotation et l’analyse posent problème.
Enfin, le ch. 11, La syntaxe en empirie et en théorie. La proposition de segmentation multiniveau du projet SegCor pour le français parlé (pp. 203-220), relève de l’analyse de l’oral en interaction dans le cadre du projet SegCor – visant à réaliser une segmentation multiniveau de corpus oraux du français en termes syntaxiques – dans le but d’examiner les choix de rédaction de protocoles d’annotation à différents niveaux syntaxiques. Nathalie ROSSI-GENSANE, Biagio URSI, Iris ESHKOL-TARAVELLA et Maria SKROVEC examinent les types de segmentations proposés dans les protocoles de rédaction en comparant le cadre théorique relevant des études de Blanche-Benveniste et du Groupe de Fribourg en micro- et macro-syntaxe, d’une part, et les projets Rhapsodie et Orféo, d’autre part, pour souligner que l’appui sur une rection étendue permet d’élargir le domaine de la (micro-)syntaxe au détriment de celui de la macro-syntaxe. Ainsi, étant donné les problèmes de délimitation entre les niveaux d’analyse micro-et macro-syntaxique, les auteurs proposent une segmentation syntaxique en chunks – des unités d’analyse minimale syntaxique définies en termes de constituance – dont ils soulignent les décisions opérées par rapport aux étiquettes choisies pour indiquer les locutions figées, les mots composés par plusieurs tokens, les contextes d’occurrence d’une même forme, les disfluences de la parole – et présentent l’unité maximale (micro-)syntaxique et l’unité maximale macro-syntaxique au sein du projet SegCor. Dans leurs remarques conclusives, ils présentent une réflexion sur les unités maximales complexes, aux niveaux micro- et macro-syntaxique, qui comportent des segments apparemment non-dépendants d’un point de vue syntaxique et qui peuvent être considérés comme juxtaposés ou coordonnés.

[Alida M. SILLETTI]