«Соотношение предложенческих и непредложенческих структур в современной французской разговорной речи»

Сюткина Анна Викторовна

«Соотношение предложенческих и непредложенческих структур в современной французской разговорной речи»

 

Скачать:


Предварительный просмотр:

«Соотношение предложенческих и непредложенческих структур в современной французской разговорной речи»

Москва 2020

Plan

1.        Introduction        3

2.        Problématique de la parole spontanée        5

2.2.        L’opposition «langue écrite- langue orale»        11

2.3.        Les principaux mécanismes de la formation du discours oral        18

2.3.1.        Segmentation de la parole.        18

2.3.2.        Segmentation phonétique        18

2.3.3.        Segmentation lexicologique        19

2.3.4.        La segmentation de la phrase ; le rôle prépondérant de c'est        20

2.4.        Structures couramment employées en français        22

3.        Corélation des structures syntaxiques du français parlé        31

4.        Conclusion        38

5.        Bibliographie        40

Annexe


  1. Introduction

Comme bien d'autres langues, le français parlé a longtemps été ignoré des linguistes qui lui préféraient l'étude de l'écrit. Avant l'invention du magnétophone, la difficulté de recueil de corpus oraux fiables a pu justifier ce manque d'intérêt. Depuis, il est clair que cette désaffection de la communauté scientifique ne trouve sa justification que dans une vision faussement dévalorisée de l'oral.

Pour nombre de syntacticiens, la langue parlée ne serait ainsi qu'un langage fautif par rapport à une norme écrite qui représenterait une compétence langagière seule digne d'étude. Pour le cogniticien, il est pourtant évident que ces prétendues fautes de l'oral (répétitions, reprises, amorces, lapsus, etc.) sont précisément le reflet des activités cognitives qui président à une production langagière en direct. D'un point de vue strictement linguistique, ces «inattendus» sont pour la même raison des révélateurs très précieux du fonctionnement et de la logique des systèmes langagiers. On saisit dès lors l'importance de l'étude sur la langue parlée qui est sortie, au cours des années 80-90, du purgatoire dans lequel elle était confinée.

C’est pour cette raison que cette recherche est actuelle, car elle réalise un certain apport dans l'étude du français parlé, de ce phénomène linguistique fort comlexe et polyvalent. Aussi, ce travail contribue-t-il aux explications des mécanismes linguistiques généraux, qui concernent aussi bien le versant oral que le versant écrit de la langue. En outre, la connaissance de la production de langage en train de se faire permet de trouver des règles de production orale qui concernent tous les locuteurs.

Le but de notre travail est porté sur l’analyse statistique du nombre de fréquences de différents types de  structures syntaxiques dans la formation et l’usage contemporain du français parlé. Notre tâche est de compléter des connaissances sur les processus et les procédés que nous utilisons  pour faire avancer nos discours et projeter nos énoncés. Pour réaliser cette tâche nous avons choisi des enregistrements des corpus oraux recueillis sur une période de temps limitée . Ce corpus se compose de 10 enregistrements qui représentent environ 15000 mots transcrits. Il était donc important, voire indispensable, de fournir une claire vision des subdivisions internes de cette banque de données en tenant compte, par exemple, du nombre de locuteurs par enregistrement, de l'âge des intervenants, des situations de parole, etc.

La structure de notre travail comprend introduction, deux parties, conclusion, bibliographie et annexe.

Dans la première partie après un rappel de certaines considérations traditionnelles concernant l'opposition "écrit et oral", nous essayons de montrer comment la prise en compte des données fournies par les corpus de français parlé oblige à nuancer les termes de cette opposition et à reconsidérer les rapports que les usagers entretiennent avec leur langue. Notre attention a été aussi surtout portée sur la déscription des particularités généralles du français parlé.

Dans la deuxième partie nous avons analysé certaines spécificités de l’organisation de la phrase en français parlé. Cette analyse nous a permi de formuler les résultats statistiques de l’emploi des types répandus de structures syntaxiques du français parlé.

Dans l’annexe on expose la transcription de certains enregistrements.

La valeur théorique de notre travail consiste en ce que nous avons essayé de préciser sur les sources des corpus oraux les traces des discours non préparés, composés au fur et à mesure de leur production. La valeur pratique de cette recherche consiste en ce que cette étude permet de prendre connaissance des particularités de l’organisation syntaxique provenant du français parlé . Les résultats de ce travail pourront être utiles dans les cours de syntaxe, l'histoire de la langue, civilisation française.


  1. Problématique de la parole spontanée
  1.  La caractéristique de la parole spontanée

La parole spontanée est présente dans les journaux d'information sous plusieurs formes : interviews, débats, dialogues, etc. II ne fait aucun doute que ce qui caractérise le plus la parole spontanée sont les disfluences (les morphèmes spécifiques comme euh, les répétitions, les corrections et les faux départs) et plusieurs études se sont concentrées sur la détection et la correction de ces disfluences[1][2]. Toutes ces études montrent une importante baisse de performances entre les résultats obtenus sur des transcriptions de référence et ceux obtenus sur des transcriptions automatiques. En effet, les systèmes de RAP se situant à l'état de l'art en la matière ont des taux d'erreur mot élevés lorsqu'ils transcrivent des données susceptibles de contenir beaucoup de parole spontanée comme de la parole conversationnelle ou des enregistrements de réunions. Un des objectifs de cette étude est d'illustrer le mieux possible ce lien entre le taux d'erreur mot et la parole spontanée.

En plus des disfluences, la parole spontanée est aussi caractérisée par son agrammaticalité et un registre de langage différent de celui qui peut être trouvé dans les textes écrits[3]. En fonction du locuteur, l'état émotionnel et le contexte, le langage utilisé peut être très différent. Dans cette étude nous définissons la parole spontanée comme de la parole non préparée, en opposition à la parole préparée qui se rapproche des phrases bien formées que Ton peut trouver dans des documents écrits. Nous proposons un ensemble de caractéristiques acoustiques et linguistiques pour caractériser la parole non préparée. La pertinence de ces caractéristiques est estimée sur un corpus de 11 heures (journaux d'information français) étiqueté manuellement selon un degré de spontanéité sur une échelle de 1 (propre, parole préparée) à 10 (discours hache, a la limite du compréhensible). Nous présentons une évaluation de ces caractéristiques sur ce corpus et décrivons la corrélation entre le taux d'erreur mot obtenu par un système de RAP à l'état de l’art sur ce corpus de journaux d'information et le degré de spontanéité.

En définissant la parole spontanée comme de la parole non préparée, nous suivons la définition proposée par[4] qui définit un énoncé spontané comme : "un énoncé perçu et conçu au fil de son énonciation". Cette définition illustre la subjectivité de ce classement de la parole en préparée ou spontanée. Idéalement, pour annoter un corpus de parole avec des étiquettes représentant la spontanéité de chaque segment, nous devrions demander a chaque locuteur d'annoter ses propres énoncés. Ce n'est bien sur pas faisable, nous avons cependant suivi cette définition en réalisant un protocole d'annotation base sur la perception du degré de spontanéité par un juge humain pour chaque segment donne. Notre approche a été d'étiqueter manuellement les segments d'un corpus de parole avec un ensemble de dix étiquettes correspondant chacune a un degré de spontanéité : le degré 1 correspond a de la parole préparée, assimilable a de la parole lue, et le degré 10 correspond a de la parole très disfluente, presque incompréhensible.

 Cette approche nous permet de choisir subjectivement ou se place la limite entre parole préparée et spontanée. Dans les expériences nous considérons trois classes : parole préparée correspondant aux niveaux de 1 a 3 ; parole peu spontanée correspondant aux niveaux de 4 a 6, et parole tres spontanée correspondant au niveau 7 et plus.

Deux juges humains ont annoté un corpus de parole en écoutant les enregistrements audio. Le corpus a été coupé en segments homogènes (en terme de conditions acoustiques et de locuteurs) grâce à un système de segmentation et de classification en locuteur se situant à l'état de l’art en la matière[5]. Ces segments ne durent pas plus de 20 secondes. Aucune transcription n'a été donnée aux annotateurs. L'accord inter annotateur concernant les degrés de spontanéité a été vérifié sur un corpus d'une heure de journaux d'information. Ensuite, ils ont annote le reste du corpus séparément. Un des problèmes rencontres était que des segments de parole spontanée peuvent apparaitre n’ importe où, pas seulement dans de la parole conversationnelle. mais aussi au milieu d'énoncés tres propres. De la même manière de la parole conversationnelle peut contenir des segments qui peuvent être considérés comme de la parole préparée. Afin de prendre ces phénomènes en compte, nous avons décidé d'évaluer chaque segment de manière indépendante : un segment de parole spontanée peut être entoure de multiples segments de parole préparée.

Le corpus obtenu après ce processus d'étiquetage est constitue de 11 fichiers contenant des données de journaux d'information français provenant de cinq radios différentes (France Culture, France Inter, France Info, Radio Classique, RFI). Ces fichiers ont été choisis en fonction de leur possibilité de contenir de la parole spontanée en fonction de rémission. La durée totale est de llh37 pour un total de 2899 segments (après la suppression des segments ne contenant pas de parole : musique, jingles, ...). Parmi ces segments, 1876 ont été annotés comme étant de la parole préparée, 842 comme étant de la parole peu spontanée et 203 comme étant de la parole tres spontanée.

Afin dévaluer l'accord inter annotateur pour cette tache spécifique, nous avons calculé le coefficient Kappa de cet accord[6] obtenu sur un autre corpus d'une heure de journaux d'information non inclus dans les données décrites auparavant. Le coefficient obtenu sur l'étiquetage en parole préparée, parole peu spontanée ou parole très spontanée est très haut : 0,852. Une valeur supérieur 0,8 est habituellement considérée comme excellente[7].

Parallèlement à cette annotation subjective du corpus, nous proposons par la suite certaines caractéristiques utilisées pour décrire les segments de parole, pertinentes pour caractériser leur spontanéité, extractives par un système de transcription automatique, et sur lesquelles un système de classification automatique peut être entraine sur notre corpus annote. Ce problème a récemment été étudié comme une tache spécifique de la campagne dévaluation Rich Transcription Fall 2004 destinée a détecter les disfluences de la parole. Certaines approches n'utilisent que des caractéristiques linguistiques, d'autres des caractéristiques linguistiques et prosodiques[8], ou encore les caractéristiques linguistiques et des caractéristiques plus générales[9].

Ainsi nous utilisons deux ensembles de caractéristiques : les caractéristiques acoustiques relatives à la prosodie, et les caractéristiques linguistiques relatives au contenu lexical et syntaxique des segments. Nous combinons les deux afin de caractériser le degré de spontanéité d'un segment de parole : cette tache est différente de la tache de détection de disfluences puisque les segments de parole spontanée ne contiennent pas nécessairement des disfluences. Par exemple, ils peuvent aussi être caractérisés par une forte variation de débit de la parole. Les caractéristiques utilisées dans cette étude sont brièvement présentées dans la partie suivante.

 Caractéristiques prosodiques. Les caractéristiques prosodiques utilisées concernent la durée des voyelles et le débit phonémique, comme présente ci-dessous.

Durée : dans la lignée de travaux précédents décrivant le lien entre la prosodie et la parole spontanée[10], nous utilisons deux caractéristiques : la durée des voyelles et l'allongement des syllabes a la fin d'un mot. Cette dernière caractéristique a été proposée dans[11] et associée au concept de mélisme. En plus des moyennes des durées, leur variance et écart-type sont aussi prises en compte pour mesurer la dispersion des durées autour de leur moyenne.

Débit phonémique : de précédentes études ont montré la corrélation entre les variations du débit de parole et l'état émotionnel du locuteur. Partant de cette idée nous avons utilise comme caractéristique une estimation du débit de parole, mot par mot ou par segment de parole, afin d'observer son impact sur la spontanéité de la parole. Nous estimons le débit phonémique de deux manières : la variance du débit phonémique pour chaque mot, et la moyenne du débit phonémique sur le segment entier, ceci en incluant les pauses et les morphèmes spécifiques (ben, euh).

Caractéristiques linguistiques. La principale caractéristique de la parole spontanée est le concept des disfluences. Elles peuvent être catégorisées comme des pauses aussi appelées fillers, des répétitions, des corrections ou des faux départs. Beaucoup d'études se sont concentrées sur leur description a un niveau acoustique ou lexical[12]. Nous utilisons deux caractéristiques des segments de parole qui les représentent :

- morphèmes spécifiques ou fillers : le lexique du système de RAP contient plusieurs morphèmes pour représenter les hésitations comme euh, ben ou hum. Leur nombre d'occurrences total dans un segment est la première caractéristique retenue.

- répétitions et faux départs : nous utilisons une caractéristique très simple qui consiste a compter le nombre de répétitions d'unigrammes ou de bigrammes dans un segment.

Caractéristiques acoustiques et linguistiques. Comme présente dans sur des données extraites de journaux d'information, la parole spontanée est aussi caractérisée au niveau linguistique par d'autres phénomènes que les hésitations ou les répétitions. L'agrammaticalité et le registre de langage sont aussi très caractéristiques de la parole non préparée. Afin de capturer le lien entre la spontanéité d'une part et le lexical et le syntaxique d'autre part, nous appliquons aux transcriptions des segments audio un processus de shallow parsing[13]  incluant un étiquetage en parties du discours (POS) et un processus de découpage syntaxique. Nous utilisons les caractéristiques suivantes pour décrire les segments :

  • paquets de n-grammes (de 1 a 3-grammes) sur les mots, étiquetage POS et découpage syntaxique en catégories (groupe nominal, groupe prépositional) ;
  • taille moyenne des découpages syntaxiques du segment.

  1. L’opposition «langue écrite- langue orale»

L'opposition "langue écrite" / "langue orale" n'a vraiment commencé à susciter une réflexion approfondie que du jour ou l'enseignement des langues s'est proposé pour objectif fondamental l'acquisition non plus d'un outil littéraire, mais d'un outil de communication. Ce recentrage sur la communication fit apparaitre la nécessité de distinguer la langue utilisée en communication orale de la langue utilisée en communication écrite.

Toutefois le concept de "langue orale", pas plus que celui de "langue écrite", n'a reçu jusqu'ici de définition suffisamment explicite pour permettre de distinguer dans tous les cas  entre la "langue" que l'on parle et la "langue" que l'on écrit. Aussi le problème subsiste-t-il de déterminer des critères adéquats susceptibles de servir de fondement à une telle définition. C'est autour de cette préoccupation que s'est organisée notre recherche.

Après avoir examiné la valeur des diverses définitions qui sous-tendent l'enseignement actuel de la "langue orale", et proposé une nouvelle définition, nous conclurons par un aperçu des directions dans lesquelles pourraient s'orienter les recherches futures.

VALEUR DES CONCEPTIONS COURANTES.

1        - Conceptions courantes :

L'enseignement actuel repose sur un certain nombre de conceptions intuitives de la "langue orale" qui, à l'analyse, se révèlent fondées sur une ou plusieurs des définitions suivantes.

La "langue orale" se distingue de la "langue écrite" uniquement par le canal de transmission : à la production graphique et la réception visuelle de l'écrit s'opposent la production vocale et la réception auditive de l oral.

La "langue orale" est celle que l'on utilise dans les situations de la vie courante (dans la rue, dans les magasins, etc. . .) lorsque la conversation porte sur des sujets quotidiens (le temps, les vacances, etc. . .).

C'est typiquement la définition sous-jacente aux expressions telles que "langue de la conversation courante", etc…

La "langue orale" se distingue de la "langue écrite" par son caractère "relâché", laxisme que l'on retrouve à la fois au niveau morphosyntaxique et au niveau de l'organisation du contenu : le texte de "langue orale" présente moins de phrases complexes, davantage de constructions incomplètes, des répétitions, des hésitations, et le contenu en est souvent très diffus.

Lorsque certains utilisent l'expression "langue parlée", c'est généralement à ces diverses caractéristiques qu'ils se réfèrent.

2        - Limites de ces définitions :

Dans quelle mesure ces diverses définitions sont-elles satisfaisantes ?

                        a) Si la définition par le canal permet de distinguer la communication orale de la

 communication écrite, offre t-elle- en fait un critère de distinction entre "langue

 orale" et "langue écrite" ? Prenons l'exemple d'une page de roman : cette page

 peut être lue à haute voix ou silencieusement. Si l'on adopte la définition par le

 canal, il faudra parler de "langue orale" dans le premier cas (lecture à voix haute),

 de "langue écrite" dans le second et qualifier le même texte successivement de

 texte oral et de texte écrit.

Une telle définition réduit en fait la différence entre "langue orale" et "langue écrite" au seul aspect phonique ou graphique du texte, puisque aux autres niveaux celui-ci ne subit pas de modifications.

                     b) La définition par la situation et le thème, quant a elle, repose sur des notions subjectives qui ne peuvent constituer des critères suffisamment rigoureux : qu'est-ce qu'une "situation de la vie courante" ? Qu'est-ce qu'un "sujet quotidien" ? Deux spécialistes d'endocrinologie débattant de leurs problèmes de glandes a la terrasse d'un café s'entretiennent-ils d'un "sujet quotidien" dans une "situation de la vie courante" ? Ou se situe la limite entre le quotidien et le non quotidien, entre le courant et l'exceptionnel?

D'autre part, quand bien même cette limite pourrait être objectivement établie, ces critères ne seraient ni nécessaires ni suffisants pour distinguer la "langue orale" de la "langue écrite" : il existe en effet des thèmes et des situations communs aux deux types de langue (un directeur peut transmettre ses instructions de vive voix ou par note de service).

                  c)De la même manière, les caractéristiques formelles du texte ne peuvent être retenues comme critère de différenciation entre "langue orale" et "langue écrite". D'une part, le "relâchement" dans la morpho- syntaxe et dans l'organisation du contenu peut fort bien se rencontrer à l'écrit (que l'on songe, par exemple, a une lettre écrite hâtivement à un ami). D'autre part, il n'est pas inhérent a l'oral (ne dit-on pas, parfois,
de quelqu'un qu'il "parle comme un livre" ?).

En fait, ce "relâchement" n'est pas lié à la distinction écrit/ oral, mais aux différences de niveaux et de registres de langue[14].

Assimiler la "langue orale" à la "langue parlée" revient par conséquent à tronquer la réalité. La "langue parlée" représente au mieux une fraction seulement de la "langue orale" : "langue orale" a un certain niveau (non cultive) et dans un certain registre (familier).

Les limites de ces diverses conceptions, que nous venons de mettre en évidence, nous conduisent donc à reprendre le problème ab initio afin de rechercher une définition plus complète et plus adéquate.

 La comparaison entre français écrit et français oral évoque, dans l'usage courant, une opposition entre le « familier » et le « soutenu ». Cela ne tient que si l'on compare des échantillons typiques servant de pôles extrêmes, par exemple une conversation orale entre amis et un texte littéraire imprimé :

— et les photos que j'ai prises elles sont moches — une — plus moche que l'une que l'autre hein (Henneq 5,6).

— Par suite de l'abominable puanteur, la nuit dans la baleinière est une sérieuse épreuve (A. Gide, Le Retour du Tchad, p. 77).

Sur une base aussi fragile, il est facile d'enchaîner les malentendus ; pour désigner une conversation telle que l'écrit un romancier, on dira que c'est du français « parlé écrit ». Lorsqu'une secrétaire de direction expliquant oralement le fonctionnement d'une « Holding » financière, parle avec des formes normatives et un vocabulaire choisi :

— la société absorbante elle-même convoquera une assemblée générale extraordinaire — de ses actionnaires — lesquels décideront si oui ou non sont d'accord avec la fusion projetée (Holding, 1,1, in Blanche-Benveniste et alii, 1990)

Un témoin naïf dirait peut être que ce n'est pas un « bon » échantillon de français parlé, parce que ce n'est pas « spontané » (comme si tout oral devait être « spontané» et qu'il s'agit d'une sorte de copie de l'écrit. Devant un récit qui comporte des tournures Littéraires et un passé simple : que dira-t-on ? C'est de l'oral ; c'est un homme qui raconte des souvenirs d'enfance devant le micro d'un interviewer ; certes, il « parle comme un livre » (et cela est fréquent) ; la tentation sera de classer ce récit comme du « français écrit parlé », en donnant au premier qualificatif une valeur qui a trait au « niveau de langue » et pas du tout au support matériel. On voit, dans les termes mêmes de ces approches naïves, où est la contradiction. C'est que, pour suivre l'idée mythique de ces natures différentes du français parlé et du français écrit, il faudrait écarter de l'observation tout ce qui ne concorde pas avec la répartition que l'on s'est donnée a priori.

Par une facilité de langage qu'on peut accepter à condition de la reconnaître comme telle, « français parlé » et « français écrit » désignent en ce cas, non pas les productions réellement attestées dans ces deux types de manifestation, mais des genres rhétoriques.

Ce glissement de désignation est si bien installé dans nos habitudes culturelles qu'il est sans doute illusoire de vouloir le combattre. Les arguments des linguistes avertis n'y changent pas grand chose ; ils peuvent signaler que les langues sans tradition écrite connaissent, dans l'oralité, le même type de répartition entre langue familière et langue élaborée et qu'il vaudrait mieux supprimer la comparaison «écrit/oral » pour parler de ces répartitions en termes généraux. Ils peuvent faire observer que la comparaison globale entre oral et écrit est viciée au départ, dans la mesure où tous les francophones, pour des raisons culturelles et scolaires, n'ont pas un accès égal au français écrit. Ils peuvent insister sur le fait qu'il ne faut pas confondre le système de la langue avec les contenus qu'elle véhicule.

En ce qui concerne les structures grammaticales, nous pouvons dire qu’une tenace idée reçue laisse croire que l'oral aurait des structures grammaticales déficientes ; seul l'écrit aurait une grammaire organisée s. L'expérience des linguistes qui ont analysé de longs corpus oraux est toute autre. Sans argumenter sur ce point, Halliday (qui pense que la plus grande date de la linguistique contemporaine est celle de l'invention du magnétophone !) voyait là l'exemple typique de « folk belief » en matière de langage (XXIII-XXIV), la croyance populaire peu informée.

Selon une autre idée reçue, l'oral serait marqué par des structures qui lui seraient propres et le différencieraient de l'écrit. Quantité de publications portent cette comparaison, explicite ou non, dans leurs titres : «Les structures grammaticales orales». On cite généralement, outre les formes non normatives, des constructions qui ne sont pas recensées dans l'arsenal grammatical classique : dislocations, topicalisations, anacoluthes, extractions en « c'est... que/qui... (« c'est avec papa que je discutais », traité comme une mise en relief de « je discutais avec papa), etc.

La plupart de ces tournures ont été intégrées dans l'appareillage grammatical de la linguistique contemporaine ; clivées, pseudo-clivées, et topicalisations, font partie intégrante de l'analyse pour quantité de langues autres que le français. Mais pour le français, comme elles sont souvent traitées de caractéristiques « orales », elles ont de ce fait un statut un peu bizarre.

Prenons par exemple le phénomène du « détachement à gauche », ou «topicalisation», que nous analysons syntaxiquement comme un « associé en double marquage » (cf. Blanche-Benveniste et alii, 1984, 1990). L'énoncé comporte un élément « topicalisé » en tête, en relation anaphorique avec un pronom situé dans la construction verbale qui suit. Les exemples se rencontrent dans les productions orales :

le marié comment était-il habillé (Brunet D, 24,9)

les gens ils sont moins motivés qu'auparavant (Navale 3,10)

—ah mais la cave on l'a déjà beaucoup rétrécie (Cappeau 2,3)

cette histoire de lentilles je m'en souvient encore (Simonet 1,1)

la voiture j'y ai passé une partie de ma vie (Sonder 3)

—mais cet argent il fallait que je me débrouille avec ça (Baral 4,21)

et dans les productions écrites :

—«Le nez de Cléopâtre, s'il eût été plus court, toute la face de la terre aurait changé » (Pascal, Pensées)

—«Ce manuel d'évasion, de délivrance, il est d'usage qu'on m'y enferme» (A. Gide)

— «Cette solidarité militaire, comment pourrait-elle être mise en jeu ? » (Journal Le Monde, 18/09/90, p. 3)

—«Ceux qui sont venue à moi, je ne dis pas qu'ils sont à moi, mais pourtant ...et qu'il les réclame donc celui qui les croit à lui !» (Henri Michaux, Exorcismes, 42)

—«Une fille avec la vitalité d'une bactérie, je ne sais s'il y aurait beaucoup de garçons pour lui parler d'amour. » (Henri Michaux, Verrous)

— « Сеs oiseaux, le grand ennui avec eux est qu'ils ne peuvent longtemps se passer de poisson » (Henri Michaux, Ailleurs, 169).

Si l'on veut à toute force attribuer ce phénomène à une « nature » de l'oral, on dira que les exemples de français parlé sont « normaux » et que les exemples écrits sont suspects ; celui de Pascal, parce qu'il est archaïque ; celui de Gide, parce que c'est une coquetterie de styliste ; celui du Monde, parce que le niveau des journaux baisse ; ceux d'Henri Michaux, parce que le poète peut tout se permettre, et qu'il utilise, comme le dit H. Meschonnic, des « effets de l'oralité » ...Est-ce bien sérieux ? Intégrer ce phénomène dans la description générale, comme on le ferait pour d'autres langues, rend totalement inutile la distinction entre l'oral et l'écrit.

Les analyses de Saussure, puis de Jakobson, nous ont habitués à cette dissociation; l' axe syntagmatique était vu par Saussure comme celui des déroulements linéaires, où les éléments s'interprètent les uns à la suite des autres, dans une suite contiguë. Ainsi, dans un exemple comme: « il nous le disait encore hier », on analyse la suite linéaire « il + nous + le + disait », à laquelle s'enchaîne l'autre suite : « encore + hier ». C'est le domaine de la continuité entre éléments cooccurrents, à lire sur une dimension ; nous avons pris l'habitude de représenter cette dimension sur un axe horizontal.

L'axe paradigmatique, que Saussure nommait axe «des rapports associatifs», était pour lui celui qui unit « des termes in absentia, dans une série mnémonique virtuelle » (Cours, éd. 1949, p. 171). D'après son célèbre exemple, le mot enseignement ferait surgir « mentalement » une série d'autres mots comme éducation, apprentissage, qui lui sont associés mais qui ne peuvent pas être cooccurrents ; de même pour il nous le disait où le choix du pronom nous résulterait d'une confrontation qu'il appelait « mentale » entre d'autres pronoms potentiellement disponibles au même endroit : vous, me, qui auraient fourni d'autres énoncés : « il vous le disait, il me le disait ». Le locuteur aurait à « éliminer mentalement » tout ce qui n'est pas conforme à son choix. Cette opération était figurée sur l'axe vertical des paradigmes, où l'un des éléments doit être choisi, à l'exclusion des autres:

Il       nous       le        disait

         vous                  rappelait

         me                    répétait


  1. Les principaux mécanismes de la formation du discours oral
  1. Segmentation de la parole.

Segmentation de la parole est le processus d'identifier les frontières entre mots, syllabes, ou phonèmes dans parlé langages naturels. La limite s'applique tous les deux au mental processus utilisés par des humains, et aux processus artificiels de traitement de langage naturel.

La segmentation de la parole est un sous-problème important de reconnaissance de la parole, et ne peut pas être en juste proportion résolu en isolation. En tant que dedans la plupart traitement de langage naturel les problèmes, un doivent tenir compte contexte, grammaire, et sémantique, et néanmoins le résultat est souvent a probabiliste division plutôt qu'un catégorique. Table des matières.

  1. Segmentation phonétique

Le niveau le plus bas de la segmentation de la parole est la dissolution et la classification du signal sain dans une corde des téléphones. La difficulté de ce problème est composée par le phénomène de Co-articulation de la parole retentit, où une peut être modifiée dans diverses manières par les bruits adjacents : il peut se mélanger sans à-coup avec eux, fondre avec eux, se dédoubler, ou même disparaître. Ce phénomène peut se produire entre les mots adjacents juste comme facilement que dans un mot simple.

La notion que la parole est produite comme l'écriture, comme ordre des voyelles et des consonnes distinctes, est une relique de notre héritage alphabétique. En fait, la manière que nous produisons des voyelles dépend des consonnes environnantes et la manière nous produisons des consonnes dépend des voyelles environnantes. Par exemple, quand nous disons le « kit », [k] est plus loin vers l'avant que quand nous disons « attrapé ». Mais également la voyelle dans le « coup-de-pied » est phonétiquement différente de la voyelle dans le « kit », bien que nous normalement n'entendions pas ceci. En outre, il y a des changements spécifiques à une langue qui se produisent sur le discours occasionnel qui des marques il tout à fait différent de l'épellation. Par exemple, en anglais, l'expression « vous a frappé » pourrait souvent être « hitcha » plus convenablement écrit. Par conséquent, même avec les meilleurs algorithmes, le résultat de la segmentation phonétique sera habituellement très éloigné de la langue écrite standard. Pour cette raison, l'analyse lexicologique et syntactique du texte parlé exige normalement des algorithmes spécialisés, distincts de ceux utilisés pour analyser le texte écrit.

Des modèles statistiques peuvent être employés pour segmenter et aligner le discours enregistré sur des mots ou des téléphones. Les applications incluent la synchronisation automatique de lèvre-synch pour l'animation de dessin animé, sous-titrer visuel de suivre-le-rebondir-boule, et la recherche linguistique. Le logiciel automatique de segmentation et d'alignement est disponible dans le commerce.

  1. Segmentation lexicologique

Dans tous les langages naturels, la signification d'une phrase parlée complexe (qui souvent a été jamais entendue ou avant pas poussée) peut être comprise seulement en le décomposant dans plus petit segments lexicologiques (rudement, mots de la langue), associant une signification à chaque segment, et puis combinant ces significations selon les règles de grammaire de la langue. L'identification de chaque segment lexicologique exige alternativement sa décomposition dans un ordre de discret segments phonétiques et traçant chaque segment à un élément d'un ensemble fini de bruits élémentaires (rudement, phonèmes de la langue) ; la signification alors peut être trouvée par des algorithmes de consultation de table standard.

Pour la plupart des langues parlées, il est étonnamment difficile identifier les frontières entre les unités lexicologiques. L'on a pourrait compter que les espaces entre les mots employés par beaucoup de langues écrites, comme anglais ou espagnol, correspondraient aux pauses dans leur version parlée ; mais c'est vrai seulement dans le discours très lent, quand le haut-parleur insère délibérément ces pauses. Dans le discours normal, on trouve typiquement beaucoup de mots consécutifs être dit sans des pauses entre elles, et souvent les bruits finals d'un mélange de mot sans à-coup ou le fusible avec les bruits initiaux du prochain mot.

D'ailleurs, une expression peut avoir différentes significations selon la façon dont elle est coupée en mots. Un exemple populaire, souvent cité dans le domaine, est l'expression Comment détruire une plage gentille, au lequel retentit très semblable Comment identifier la parole. Pendant que cet exemple montre, la segmentation lexicologique appropriée dépend du contexte et de la sémantique ce qui dessine dans l'ensemble de la connaissance et d'une expérience humaines, et exigerait ainsi des technologies d'identification de modèle avançée et d'intelligence artificielle à mettre en application sur un ordinateur.

Ce problème recouvre dans une certaine mesure avec le problème de segmentation des textes cela se produit dans quelques langues qui sont traditionnellement écrites sans espaces entre les mots, comme Chinois et Japonais. Cependant, même pour ces langues, la segmentation des textes est souvent beaucoup plus facile que la segmentation de la parole, parce que la langue écrite a habituellement peu d'interférence entre les mots adjacents, et contient souvent des indices additionnels non actuels dans la parole (telle que l'utilisation de Caractères chinois pour des tiges de mot dans le Japonais).

  1. La segmentation de la phrase ; le rôle prépondérant de c'est

Comme l'on pouvait s'y attendre, les émissions-débats présentent beaucoup de phrases segmentées. Parmi les procédures qui découpent en deux temps la phrase complexe, l'extraposition de la subordonnée, compensée grammaticalement par l'anaphore, est largement attestée, mais le pivot essentiel de cette opération est le présentatif c'est :

« Ce que je leur reproche, c'est leur politique. »

« Ma conviction, c'est que le pays comprend... »

II faut alors noter l'importance de la construction qui combine les deux schémas syntaxiques privilégiés par nos locuteurs, mettant en présence la relative, sous sa forme nominale, et la complétive, introduite par c'est :

« Ce qui m'intrigue, c'est que... » — « Ce que je voudrais dire, c'est que... »

II s'agit certes là d'un cadre de phrase dont la décomposition en deux moments facilite, par l'étalement de l'énoncé dans le temps, l'émission et la réception du message. Mais il semble que cette construction doive aussi sa productivité à l'organisation grammaticale de ses éléments.

La présence de part et d'autre du prédicat c'est de deux séquences verbales, l' une en position sujet, l'autre en position complément, et le lien anaphorique qui les unit permettent non seulement de modeler le cas des verbes impersonnels sur celui des verbes à sujet personnel (« ce que je dis, ce qu'il faut, ce qui me plaît, c'est que... ») mais encore et surtout d'unifier l'emploi de la complétive en lui assignant pour unique fonction celle de complément de verbe (« que P me fait plaisir ; il me fait plaisir que P ; ce qui me fait plaisir, c'est que P »). Grâce à cette construction, le champ opératoire de la complétive s'élargit considérablement :

« Ce qui me différencie des gaullistes, c'est que... » — « Ce qui fait actuellement mon optimisme, c'est que... » — « Ce qui avait beaucoup encombré les parlements des républiques précédentes, c'était que... »

En s'étalant, l'énoncé progresse alors par séquences discontinues dont le découpage est tout à la fois grammatical et intonatif. S'il faut pour conclure cerner le profil de la phrase type de notre corpus, nous dirons donc qu'elle répond à un modèle probabiliste qui inclut dans l'organisation de ses constituants deux formes de subordonnée, la complétive et la relative ; l'une s'articule sur le verbe, l'autre sur le nom, n une étroite complémentarité syntaxique : Verbe/c'est + que P — Nom/ ce + qui V.

L'apparition de ces constructions est conditionnée par le discours lui-même dont l'économie se caractérise tout à la fois par la projection sur l'énoncé des verbes de renonciation, le regroupement cohésif de propositions hiérarchisées et le recours à des procédures syntaxiques de prédication (c'est ... qui; c'est que) qui découpent l'énoncé en insérant dans l'activité d'émission des temps de pause. C'est l'imbrication de ces facteurs qui explique la richesse d'occurrence des phrases « à relatives » ou/et « à complétives ».


  1. Structures couramment employées en français

On ne peut pas analyser les énoncés de langue parlée sans prendre une option sur les phénomènes de fragmentation du discours. Il n'est en effet pas possible de faire la moindre analyse en suivant l'ordre réel d'apparition des mots ; il faut nécessairement les constituer en syntagmes. Sinon, on ne saurait pas de quoi serait constitué un ordre linéaire. Un exemple simple est fourni par certaines formes de répétition de pronoms, de prépositions ou d'articles. Il arrive fréquemment que les locuteurs, hésitant sur le début des syntagmes, produisent des séquences qui, sous leurs formes réelles, sont manifestement contraires à ce que tout le monde considérera comme des règles grammaticales élémentaires : séquences de plusieurs pronoms sujets je, ou de plusieurs articles le ou des, ou encore réitération d'une même conjonction quand ou d'une même préposition de :

• moi je je je me souviens très bien être allé souvent en Espagne (Tché 215, 10)

• ce sont des des des îles qui se situent qui se situent à l'est de ce territoire (Patag 3,5)

• Kafka était au centre de tout le le le désespoir finalement de de d'une jeunesse (Tché 210, 21)

• ça c'est quelque chose qui est frappant aussi quand quand on passe une frontière (Tché 213, 28)

• moi je parle de de de ce problème de l'eau là (Maçon 3, 8)

II serait bien difficile de fournir une grammaire cohérente si l'on décidait d'y inclure des suites comme je je je et de de de, dont l'occurrence est fondamentalement aléatoire. D'une façon ou d'une autre, ces suites seront écartées de la description grammaticale proprement dite. Mais on ne peut pas pour autant les placer « hors analyse ». Une méthode simple, mais qu'il vaut la peine d'expliciter, est de considérer que les suites je je je ou de de de ne forment pas des syntagmes, à disposer selon un ordre de successivité, mais que ce sont des réitérations, d'éléments à situer sur une même place syntaxique. En ce cas, cela implique que des éléments produits côte à côte dans le déroulement réel du discours, peuvent être interprétés soit comme des séquences syntagmatiques , soumises à des règles « d'ordre des mots grammatical», comme c'est le cas pour était+au+centre+de, soit comme des énumérations paradigmatiques, le le le, de, de d\ qu'on ne doit pas décrire avec les mêmes règles :

Kafka était au centre de tout le

     le

     le désespoir finalement de

  de

  d'une jeunesse

Dans d'autres cas, qu'il faudrait caractériser, les répétitions d'un même mot comme très, seront traitées comme des séquences syntaxiques, avec un effet qu'on qualifie habituellement de « redoublement intensif » :

•certaines viennent de de très très loin (Tché 209,5)

Certaines séquences sont donc adoptées telles quelles et considérées comme des exemples légitimes de règles d'ordre linéaire, alors que d'autres auront un statut très différent. C'est ce que symbolise cette double représentation, à l'horizontale et à la verticale. Dans l'ordre grammatical, on ne devrait, en fait, parler que de l'ordre des syntagmes. Ce ne sont pas seulement les répétitions qui obligent à poser une différence entre l'ordre discursif des mots et l'ordre grammatical des syntagmes. Les formes de constructions dites « incidentes », comme les vocatifs ou les parenthèses (cf. D. Delomier & M. A. Morel 1986, Françoise Zay 1995) exigent qu'on distingue plusieurs niveaux grammaticaux d'ordre des éléments. C'est le cas, dans l'exemple suivant, pour le mot madame, employé comme vocatif, au milieu d'une expression de quantité dix-sept mètres de long. Dans la version orale de ce passage, on ne remarque pas de pause ni d'intonation spécifique qui donnerait une indication de rupture :

• il a vécu comme ça dans un bateau qui faisait peut-être euh quinze seize mètres – mettons dix-sept mètres madame de long (Lie 93-1, Barian 3-16)

L'emplacement de madame n'est pas déterminé par rapport aux autres éléments syntaxique de l'énoncé, puisque, en tant que vocatif, il ne forme de séquence avec aucun de ces éléments. Il serait tout à fait absurde de fabriquer un syntagme avec madame + de + long, ou avec dix-sept + mètres + madame. On sait que ces sortes de vocatifs se placent dans un grand nombre de lieux de l'énoncé, à l'exception des lieux d'attache des éléments clitiques, comme le pronom il, ou l'article un (ou la jonction entre quinze et seize, proche du mot composé). Les exemples de français parlé montrent que les points d'insertion sont plus nombreux et plus « bizarres » qu'on ne le penserait intuitivement :

• il a, madame, vécu, madame, comme ça madame, dans un bateau, madame, qui, madame faisait, madame, peut-être, madame, euh quinze seize mètres, madame, mettons, madame, dix-sept mètres, madame, de long, madame,

Mais ces emplacements possibles se situent à un autre niveau que celui de l'enchaînement des syntagmes comme il + a + vécu, ou qui + faisait + quinze + seize mètres, dont la successivité est syntaxiquement pertinente. On ne pourra pas les intégrer dans les mêmes règles « d'ordre des mots ». Ces places dans les « failles » de la syntaxe (comme les nomme B. Fradin 1990, 26) sont cependant déterminées par la syntaxe, et il serait nécessaire d'en avoir une description complète pour établir des règles d'ordre des mots.

On doit probablement traiter de la même façon les éléments formant commentaires sur renonciation. Ils peuvent également intervenir à l'intérieur des grands constituants, avec une très grande variété de points d'insertion. C'est le cas dans l'exemple suivant pour l'expression encore une fois (« pour le dire encore une fois »), qui vient se placer entre un nom l'impression et son adjectif première :

• enfin c'était l'impression encore une fois première que j'ai eue à ce moment-là - maintenant je ne penserais pas exactement pareil (Tché 213, 1)

Les morceaux d'énoncés parenthétiques plus étoffés, contenant par exemple une construction verbale complète, ont à peu près les mêmes possibilités de placement, de sorte que, en ce cas, deux déroulements syntaxiques de niveaux différents s'enchevêtrent:

• on a l'impression je crois que c'est mon ami René qui a employé ce mot qu'à la Bourse c'est un non-événement (C40, Halimi 34, 13)

• j'avais été désigné je le savais comme otage (Candell 13, 9)

Ces phénomènes d'hésitations et d'insertion d'incidentes, même s'ils sont très fréquents dans certains discours oraux, ne sont pas spécifiques de la langue parlée. Il est bien évident qu'on les rencontre également par écrit. Mais comme ils y sont en moins grandes quantités (et qu'ils sont peut-être plus standardisés), on peut se permettre de ne pas les mentionner dans une étude sur l'ordre des mots, alors que cela ne serait pas possible pour la langue parlée.

Lorsqu'on choisit comme unités d'analyse des segments plus grands que la « phrase », on peut voir des phénomènes fréquents de jeux sur l'ordre des mots. L'un des plus simples est celui qui correspond à la figure rhétorique du chiasme.

Le chiasme à base syntaxique, du type complément suivi de verbe et verbe suivi de complément, est une figure de style dont Molière s'est moqué (cf. CM. Roberts 1917) :

• Oui vraiment ! Nous avons fort envie de rire, fort envie de rire nous avons (Bourgeois Gentil-homme III, 5)

• Je les ai le premier avisés, avisés le premier je les ai (Don Juan II, 1)

Ce qui favorise cette figure, ce sont toutes les occasions de faire contraster, pour un même élément, des possibilités différentes dans l'ordre des mots : couples de questions et de réponses, compléments antéposés et postposés, dislocations à droite et à gauche, ou constructions concurrentes dues aux hésitations des locuteurs.

Dans un modèle fréquent, les éléments interrogatifs comme pourquoi, de qui, quel, viennent en tête de la construction verbale, alors que la réponse lexicale vient après:

• pourquoi ça m'a manqué - ça m'a manqué à cause du sommeil (CZR42, 6)

• de qui je veux parler - eh ben bien sûr je veux parler du vieux bien sûr (Suz 67, 5)

II arrive que le lexique du complément ne soit pas le même (tout le monde, tes parents), mais que la disposition en chiasme soit cependant présente :

• ils ont pas gardé tout le monde - pourquoi tes parents ils les ont gardés (L955-3-35, 3, 1)

• et sur la falaise quel est vraiment son travail - alors son travail eh ben il pose des grillages (95-3-42, 3, 1)

Dans un autre modèle, les locuteurs disposent les deux éléments d'une dislocation selon un modèle de symétrie inverse, qui provoque la figure de chiasme dans la disposition du pronom et du lexique, comme par exemple pour ça... une tronçonneuse I une tronçonneuse ça :

• ça coûte combien une tronçonneuse — ben une tronçonneuse ça vaut entre six mille et neuf mille francs (L95-3-41, 13, 8)

La disposition a b b a est facilement suscitée par une façon d'exploiter les différences syntaxiques entre les interrogations et les réponses. Nous avons été frappés par l'utilisation des chiasmes dans certains cas de répétitions d'énoncés. Les mêmes éléments s'y trouvent, avec un changement d'ordre. Tout se passe comme s'il était important de dire les choses une fois dans un sens et une fois dans un autre. Il y a par exemple un premier énoncé avec complément placé après le verbe, et un second avec le même complément focalisé en tête :

• Denise mon père il va m'acheter un petit mouton - un petit mouton il va m'acheter (Agenet Gr3, 6)

Parfois la forme lexicale du complément se modifie (à lire, à écrire I tout ce que je savais), la disposition restant a b b a :

• et je lui apprenais à lire à écrire - enfin tout ce que je savais - je lui ai appris (Baral 259, 3)

L'utilisation d'une même construction verbale avec et sans complément disloqué a des effets similaires. On a successivement verbe + complément / complément + pronom + verbe:

• j'ai connu Edith Piaf- Edith Piaf je l'ai connue (Vie par 263, 4)

Nous avions relevé, dans un autre modèle, une tendance à répéter un même verbe successivement au passif et à l'actif (ou l'inverse), aboutissant à la même figure (cf. Blanche-Benveniste 1988 et M. Blasco 1987) entre actif et passif :

• ça a été imprimé comme ça - on a imprimé ça (Astier 35, 7)

Enfin, on pourrait compter comme modèles distincts les cas où les hésitations des locuteurs, lorsqu'ils utilisent à l'essai plusieurs constructions, provoquent parfois ce même effet. C'est le cas dans l'exemple suivant qui commence avec un verbe impersonnel il y avait et l'adverbe partout, et qui continue avec l'adverbe partout et un verbe personnel à sujet postposé, sur le modèle verbe + partout / partout + verbe:

• dans ces guérites de douaniers il y avait partout - partout étaient placardées donc des photos de Vaclav Havel (Tchc 212, 1)

Lorsque le résultat est rhétoriquement intéressant, comme dans ce dernier exemple, on voit que la limite est imperceptible entre procédés intentionnels et procédés non intentionnels.

Si l'on décrit en termes grammaticaux les différents schémas de construction qui sous-tendent les phrases complexes d'un corpus de dialogues radiodiffusés, l'analyse montre que toutes les marques de la subordination verbale (qui, que, seul ou en composition, comme, quand, si) contribuent à en organiser le fonctionnement syntaxique. L'on constate aussi que, se référant au contexte ou à la situation, le pronom qui présente les divers types de variation flexionnelle qui le caractérisent par rapport à la conjonction que.

Quant aux propositions marquées comme unités partielles de la phrase, elles se construisent, selon un réseau d'oppositions distinctives, en un ensemble de schémas syntaxiques dont l'analyse formelle souligne le caractère abstrait. Mais en se substituant à la présentation sémantique à laquelle nous ont habitués des siècles de grammaire fondés sur la conceptualisation de la phrase, ce mode de classement ne saurait masquer l'évidence des faits : le discours que Ton observe dans les émissions débats se fonde sur les mêmes constructions que le discours étudié par les observateurs de l'usage écrit ; les relatives sont là, adjectivales ou nominales, ainsi que les interrogatives indirectes, les complétives en que et les multiformes circonstancielles.

L'on pourrait bien sûr, raffinant l'analyse, signaler des manquants dans la liste des subordonnants lexicalement disponibles ou dans la série des réalisations possibles d'une construction. Ce ne serait que repérer, dans l'identité d'un cadre syntaxique linguistiquement cohérent, des variations sémantiques totalement dépourvues de signification grammaticale ou des divergences d'emploi qui ne mettent pas en cause l'ordre structural.

 Il nous est donc impossible d'affirmer globalement que les Français changent de grammaire quand ils écrivent et quand ils parlent. Tout dépend, il est vrai, de ce que Ton entend par le mot « grammaire » et du domaine que l'on soumet à l'observation. Ce que nous pouvons dire ici, c'est que dans l'ordre de la subordination, la syntaxe du français radiophonique ne présente aucune particularité. Si néanmoins, quittant l'ordre de la grammaire, l'on en vient à l'étude de la performance, l'attention est éveillée par la fréquence d'apparition de certaines constructions et la réflexion orientée vers les lois qui en régissent l'emploi.

Deux types de subordonnée jouent dans ce discours un rôle prépondérant, la complétive et la relative.

La richesse d'occurrence de la complétive s'explique par l'abondance des verbes dénonciation. Ces verbes, verbes d'opinion, de déclaration, « d'attitude », eux-mêmes souvent modalisés, sont là pour « rapporter » l'énoncé, relayer le message, l'insérer dans un autre message où se manifestent les protagonistes de renonciation

« Je peux vous dire que votre information est assez mal fondée. »

« Vous venez de reconnaître que vous votez pour ce gouvernement. »

Le jeu des pronoms du dialogue (« Je crois que j'ai raison ; vous savez bien que vous ne gagnerez pas ; vous permettez que je continue ; je constate que vous refusez de répondre ») et l'enchaînement des verbes (« Je pense qu'il serait préférable que... ; je prétends qu'il n'est pas vrai

que... ») soulignent cette appropriation de l'énoncé par le sujet parlant, dans la tirade didactique comme dans l'échange polémique. Remarquons en passant la complémentarité fonctionnelle de l'incise (« dites-vous ; me semble-t-il ; vous voyez ; vous comprenez »). Tout concourt à caractériser le discours dialogué par la relation qui s'institue linguistiquement entre le locuteur et son partenaire.

Tout aussi remarquable est le privilège accorde à la relative, et plus particulièrement à la relative en expansion du nom. Plusieurs facteurs dans l'économie du discours semblent conduire le locuteur à choisir cette subordonnée plutôt que la simple anaphore pronominale. Retenons ici, outre le jeu de la référence contextuelle qui explique l'insertion d'une relative en cours de phrase par dominance de la loi de distanciation minimale, le rôle de relais que joue la relative copule entre le nom et l'adjectif :

« On aboutit à une situation qui est contradictoire. »

Cette procédure de remplissage, très caractéristique de notre discours, se trouve même exploitée comme un mode de liaison totalement pléonastique entre deux ou plusieurs séquences nominales:

Il y a un autre système qui est le système proportionnel qui est le reflet exact des forces du pays.»

Le recours aux présentatifs (il y a, voilà et surtout c'est) favorise, avec l'apparition de la relative, le découpage de l'énoncé en deux temps :

« C'est le gouvernement qui s'y est opposé » — « C'est la la question que j'allais vous poser. »

Que nos dialogues accordent ainsi la priorité à l'anaphore subordinative (qui) sur l'anaphore coordinative (il) mérite d'être souligné. L'économie de ce type de discours se caractérise par la succession de groupes de propositions dont la cohésion est grammaticalement marquée ; les propositions indépendantes, qu'elles soient ou non regroupées par l'intonation dans le cadre d'une phrase, sont relativement rares.

Le pronom le plus exploité est évidemment qui dans la mesure où il obéit aux impératifs de l'ordre canonique mais le que relatif joue lui même un rôle important; c'est lui qui permet de rattacher à un nom les propositions à sujet Animé et notamment celles dont le verbe se réfère à l'une des personnes du dialogue :

« Je voudrais revenir sur la question que vous m'avez posée. »

La loi de prévalence du sujet Animé l'emporte alors sur la règle d'ordre et les relatives par que occupent une aire d'emploi qui leur confère une place essentielle dans le modèle de performance.

Une remarque enfin sur lequel situé ici à un rang qui n'est pas celui du Français fondamental. Complétant le groupe des relatifs indifférents à la classe sémantique de leur antécédent, lequel s'emploie derrière préposition (avec, contre, par, pour, sans, sur...) ; il contribue ainsi à simplifier le fonctionnement du système en neutralisant l'opposition de qui et de quoi, tout en permettant grâce à ses marques de lever toute ambiguïté sur le terme de référence:

« Une partie du corps électoral sur laquelle vous comptiez paraît bien s'être dérobée.»

En dehors du que conjonction et des pronoms relatifs ou interrogatifs, les locuteurs exploitent essentiellement une dizaine de subordonnants, déjà signalés pour leur productivité oar le Fonçais fondamental. Les voici dans Tordre de leur fréquence d'apparition : si, parce que, quand, comme, puisque, lorsque, alors que, pour que, tandis que. Conjonctifs stables, comme le confirme l'indice de leur répartition, ils permettent l'expression des grandes relations conceptuelles, condition, cause, temps, opposition, finalité. Les autres locutions conjonctives apparaissent en nombre infime.

L'on peut en conclure que le français radiophonique s'est construit un sous-ensemble de subordonnants qui économise pour le locuteur l'effort de sélection. Seule l'étude comparative d'autres messages, écrits notamment, permettrait de dire s'il s'agit là ou non d'un système propre à l'oral. Gardons-nous de généraliser et notons l'essentiel : le français de la radio ne tend nullement à substituer dans l'articulation du discours parlé les moyens modulatoires aux moyens grammaticaux. L'étude de la phrase segmentée montre au contraire que ces moyens viennent s'additionner et se renforcer mutuellement dans leur fonction de cohésion.


  1.  Corélation des structures syntaxiques du français parlé

Avant même de s’intéresser aux spécificités du français oral telles qu’elles apparaissent dans ces entretiens, il faut rappeler que l’oral et l’écrit diffèrent, quelle que soit la langue à l’étude, en ce que la structuration du discours oral s’opère en temps réel, laissant apparaître un ensemble de traces linguistiques qui seront absentes du discours écrit achevé. A travers ces traces, il est possible de suivre la pensée du locuteur en construction au fur et à mesure de son énonciation.

Parmi ces caractéristiques générales de l’oral figurent dans le texte des hésitations, indiquées notamment par euh dans la transcription, ainsi que des répétitions qui rendent compte de l’activité du locuteur en train de « chercher ses mots » : qui se, qui se sont (l. 13), il y a une, une, une (l. 25), nous on fait euh, on fait (l. 26), on fait, on fait la fête (l. 28), il y a un, un mec (l. 33), sur les, les gens, les les histoires (l. 40-41), on fait, ouais on fait des cabarets (l. 48). Ces répétitions peuvent aussi se transformer en redondances : c’est sympa. Ouais, puis c’est, c’est rigolo. C’est sympa. (l. 29).

On trouve également des amorces d’énoncés inachevés, qui donnent lieu à des spécifications, des reformulations et/ou des autocorrections : on fait, on garde le euh, on va chercher (l. 4) [passage du verbe générique faire à des verbes plus précis] ; on donne euh, aussi euh, je donne (l. 5) [passage du on, sujet de l’énoncé précédent, à je] ; pour les, pour avoir le brevet, le papier de sauveteur (l. 6) [on remarque ici le passage d’un nom précis, brevet, à un autre moins précis, papier, précisé cependant par le complément de sauveteur] ; qui, qu’il faut (l. 13) [passage du pronom sujet utilisé précédemment, qui, au pronom complément, qu’] ; on va ja/ il y a jamais per/ beaucoup (l. 17) [on va est modifié en il y a, puis per[sonne] est modifié en beaucoup] ; Enfin, je (x), ouais, je suis pas, non je joue pas, je fais (l. 21) [qui précise et modifie, notamment grâce à l’adverbe enfin, l’énoncé précédent je fais aussi le théâtre, ce dernier pouvant laisser penser que le locuteur est acteur et joue des rôles] ; le, la sono (l. 22) [le masculin le pouvant renvoyer au son : en effet, l. 26 le locuteur utilise le mot son au lieu de sono] ; on fait, on est, nous là on est, on est deux cop/ trois copains (l. 24) ; et puis on va euh. (l. 26) [énoncé inachevé] ; mais qui sont, c’est écrit (l. 33) [énoncé inachevé, reformulé] ; c’est des, c’est plutôt des (l. 38) [le locuteur nuance son propos à l’aide de l’adverbe plutôt] ; c’est, il fait, il met en scène (l. 38) ; ils sont, ils répètent là (l. 44) ; mais c’est, ça dure (l. 50) ; sinon je fais. Maintenant je m’occupe (l. 57) [dans un premier temps, le locuteur reprend le verbe faire utilisé par l’enquêtrice dans sa question qu’est-ce que tu fais , puis l’abandonne et utilise le verbe s’occuper, plus précis] ; mais. Voilà, non en général (l. 55).

D’un point de vue syntaxique, ces inachèvements et reformulations donnent parfois lieu à des ruptures dans la syntaxe de l’énoncé : comme on est trois […] on fait, puis en général (l. 27-28) ; il y a un, un mec là qui fait part/ le metteur en scène […] c’est lui qui (l. 33-34) ; on va commencer une nouvelle euh, c’est une revue (l. 35) ; et puis. Ou bien des fois on, des f/ bon, il y a des années (l. 52). Ces ruptures peuvent s’expliquer par des « retours en arrière » ou des incidentes, comme dans et puis sur euh, en général il y a ça et puis sur les (l. 40) [ça renvoie à l’énoncé précédent (Ce qui se passe dans le monde)].

Ces caractéristiques générales de l’oral étant rappelées, nous pouvons à présent nous pencher sur les spécificités du français  que l’on retrouve dans cet entretien.

Sur le plan syntaxique, on remarque en premier lieu des phénomènes fréquents de la langue parlée : des phrases inachevées, Alors je me suis fait dans la tête, j’ai cru que … (l. 29) ; des parallélismes, Au printemps il y avait les fleurs, il y avait les coucous, il y avait tout ça. (l. 13/14) ; des répétitions, Et euh, on avait des vaches, des, des moutons. Des vaches et des moutons, … (l. 7/8) ; des autocorrections, alors demandez, demandez leur ce que font, ce que fait la petite … (l. 42) ; etc.

Les nombreuses dislocations à gauche et à droite constituent un autre phénomène typique du français parlé : un constituant de la phrase est placé en tête ou, plus rarement, à la fin d’un énoncé tandis qu’il est repris par un pronom auprès du verbe. Deux exemples tirés de l’entretien illustrent le fonctionnement de ce procédé : Les forgerons autrefois ils allaient dans les fermes … (l. 38/39) ; il lui a dit le bonhomme, … (l. 41).

Parmi les traits typiques du français parlé, l’omission de la particule de négation ne a fait couler beaucoup d’encre. Ce phénomène duquel des facteurs linguistiques aussi bien qu’extralinguistiques paraissent responsables (cf. Armstrong & Smith 2002 ; Hansen & Malderez 2004) se présente aussi dans notre extrait : des 15 verbes que NC y utilise à la forme négative 8 apparaissent sans ne, et la négation complète n’est employée que dans 6 cas, une occurrence – quand on (n')a pas de pain … (l. 27) – étant incertaine. Ce taux assez élevé de ne pourrait s’expliquer par l’âge avancé de la locutrice, son domicile dans une petite commune et le caractère plutôt formel de la situation : un entretien guidé avec des enquêtrices jusqu’alors inconnues. S’y ajoutent les facteurs linguistiques : tandis que le marqueur négatif plus (il n'y a eu plus de pain, l. 25, et ça n'existe plus, l. 38) favorise la présence de ne, les propositions relatives (qui n'avait pas de pain, l. 28) et les constructions à infinitif (pour ne pas être en retard, l. 24) constituent d’autres sites préférés pour ce terme de négation.

Kremnitz (1981) mentionne l’emploi étendu de l’article défini qui constituerait une particularité syntaxique du français du Midi. NC fait preuve d’un tel emploi quand elle dit Au printemps il y avait les fleurs, il y avait les coucous, … (l.13). Comme il ne s’agit pas de fleurs ni de coucous particuliers on s’attendrait plutôt à l’article indéfini.

Les extraits contiennent une multitude de phénomènes syntaxiques typiques du français parlé. La locutrice utilise le pronom on pour nous (l. 3), la négation simple sans la particule ne (l. 2, 5, 10, 13, etc.), notamment dans les constructions figées je sais pas (l. 48) et c’est pas (l. 5, 21, 51), le double pronom personnel moi je (l. 7, 12, 16/17, etc.) et la forme verbale faut sans pronom sujet (l. 15). Le discours se caractérise par une structure agrégative : les propositions principales sont tout simplement juxtaposées et non liées par des conjonctions, p.ex. je suis venue à Paris euh, euh, j'avais dix-neuf ans déjà (l. 9). La conjonction que manque particulièrement dans le discours indirect, p.ex. quand on leur dit on est (l. 52).

En outre, on retrouve de nombreuses dislocations à gauche : le vrai Parisien, c'est un peu quand même un peu métro, boulot, dodo quoi (l.1/2), nous les Provin/, le, les gens de la province, on vit peut-être un peu différemment (l.3), le vrai Parisien, lui, euh, il vit, il vit à Paris (l.27), le Parisien, lui c'est la mer hein qu'il recherche (l.50/51), Lui, où c'est qu'il veut partir, c'est la méditerranée (l.51/52), etc.

Une autre structure typique du français parlé est l’emploi de catégories de mots dans des fonctions syntaxiques dans lesquelles elles sont inhabituelles : dans Moi je suis restée très, très tradition. (l.16/17), le substantif tradition est utilisé dans la fonction d’attribut, habituellement réservée aux adjectifs ; dans je mange varié (l.17/18), l’adjectif varié est employé comme adverbe en tant que complément circonstanciel.

L’extraits analysés réunissent un certain nombre de traits syntaxiques qui relèvent du français familier oral en général, dont:

- l’emploi du pronom on (pour nous) (l.1, 3, 4, 6, 16, etc.)

- la fréquence élevée des formes c’est attesté à 7 reprises (l. 17, 42, etc.) et surtout il y a à 14 reprises (l. 2, 3, etc.) : Oui, depuis la route, il y a beaucoup de changements. D’abord, il y a toutes les voitures, qui sillonnent. […] Il y a l’hé/, l’hélicoptère aussi (l. 29-30).

La thématisation, construction typique de la syntaxe du français oral, ne se relève dans cet extrait que sous la forme d’une seule structure, lui, il, employé à deux reprises : Mais lui il n'a pas vu, malheureusement, le téléphone arriver à, à la, à Ilet à Cordes (l. 23) ; Et lui il dit (l. 11).

Il est à noter que l’omission, habituellement très fréquente, de la particule négative ne ne se réalise dans cet extrait que dans les structures classiques il y a/avait pas/que (l. 2, 3, 6, 7, 44) et c’est pas/que (l. 17, 57); à côté de ces 9 occurrences d’absence, nous trouvons 8 présences de ne, attestant du registre formel de l’extrait : sont ainsi signalés les thèmes solennels comme la personne du maire (il n’a pas vu (l. 23) ; il ne se privait pas (l. 27)), les citations des paroles du médecin (‘on ne va pas déranger’ (l. 49) ; ‘les os n’ont pas transpercé’ (l. 45)) et sa propre épreuve de la fracture du tibia (enfin, je ne sais pas comment j’ai fait (l. 51), je n’étais pas réveillée (l. 53)).

L’exemple ‘les os n’ont pas transpercé’ (l. 45) révèle un autre indice de formalité qui consiste en l’utilisation d’un sujet nominal, que nous attestons aussi dans la citation des paroles du maire : ‘il faut que tous les adjoints me donnent leur aval’ (l. 16) ; ou encore dans le récit de l’épreuve : l’hélicoptère est venu me prendre dans le fond de la rivière (l. 32) ; Et le docteur (…) était un Allemand (l. 40). Un dernier trait de formalité s’atteste dans l’emploi du participe apposé : arrivée, quand on était en train de, de m’opérer (l. 52).

Différents traits particularisant le français réunionnais sont réunis ici : tout d’abord, l’absence de subjonctif : ‘il faut que vous me dites’ (l. 14-15) où la locutrice cite ses propres paroles devant le maire ; il avait peur que j’aurais perdu connaissance (l. 50), où le conditionnel passé se substitue au subjonctif. Ensuite, l’absence remarquable de clitique objet : il faut [le] remarquer (l. 31) ; ‘Bon, on ne va pas [la, la jambe/l’attelle] déranger’ (l. 49), combinant ainsi, dans cette citation du docteur, la présence du ne de négation avec l’absence du clitique objet ; dans les énoncés est-ce qu’on peut voir (l. 41) et si vous voulez (l. 42), l’omission est grammaticalisée dans beaucoup de zones francophones. Enfin, notons le marqueur même à valeur intensive : Eh ben si c'est rien que ça même. 'Si c'est rien que ça même, Monsieur le maire, ben, vous pouvez y aller, hein' (l. 16-18).

Cet extrait présente un certain intérêt au plan syntaxique. Mis à part des structurations propres au discours oral, on y retrouve une organisation syntaxique commune à l’oral et à l’écrit. On peut en aborder l’étude selon trois optiques.

Dans cet extrait, les structures non standard sont, soit spécifiquement ivoiriennes, soit communes à des variétés non standard hexagonales. On distingue dans ce sens les deux premiers points des deux autres :

• Des utilisations proprement ivoiriennes du déterminant défini (Boutin  2002) :

l'oncle (l. 10 ; 44) : équivalent de mon oncle (l. 49)

faire le journalisme (l. 51): équivalent de faire des études de journalisme. Ce type de constructions existe aussi dans d’autres variétés de français hors de France (voir le commentaire de l’extrait de Nyons (Andreassen & Detey, ce volume))

• L’utilisation proprement ivoirienne de faire (+ nom de durée) : lignes 10 ; 15 ; 20 ; 25.

• L’omission du complément de maîtriser (l. 5 ; 10). Le français, surtout oral, a la possibilité d’omettre un complément référentiel s’il est restituable par le contexte ou la situation. Dans les cas présents, les compléments implicites ne font pas référence à un syntagme nominal explicite, mais à l’ensemble des énoncés précédents : dans le premier cas, la réponse à la question portant sur les domiciles successifs, nombres d’années, etc., dans le deuxième cas, une donnée précise concernant l’année (Boutin 2005a).

• Des utilisations non standard de prépositions :

La préposition à pour introduire un syntagme génitival humain : la tante à ma maman (l. 8)

La préposition sur, situationnelle, avec un verbe de déplacement demandant, en français standard, une préposition directionnelle, de / pour / vers : on est parti sur le Nord (l. 16-17) (voir Laur, 1993 ; Borillo, 1998).

En ce qui concerne le style, on remarque la prédominance de tournures soignées, par exemple :

le quartier qu'on habitait (habiter un quartier) (l. 17-18)

la vie [...] n'était plus la même (l. 38)

j'ai obtenu mon Certificat d'Etudes / je n'ai même pas pu obtenir [...] mon B.E.P.C. (l. 25 ; 43)

des ouvriers qui nettoyaient les abords des routes (l. 33)

Lorsque j'allais en Seconde (l. 49)

étant chez un tuteur (l. 39)

Puisque, étant toujours aux T.P. (l. 31-32)

on était logés dans [...] ce cadre-là (l. 20)

Les tournures réputées plus familières apparaissent en moindre nombre, par exemple :

je faisais tout le boulot (l. 43)

j'ai pu avoir mon, examen / j'ai eu mon B.E.P.C. (l. 48-49)

maîtriser le coin (l. 14)

Là, c'était nettoyer tout (l. 33-34)

Sur quatre phrases négatives, deux comportent la particule ne (l. 13 ; 43), ce qui est caractéristique d’un registre soigné, et deux sont réalisées uniquement avec la négation pas (l. 5 ; 9), ce qui est relativement courant à l’oral. On peut noter une congruence sur le plan du registre soigné des premiers exemples : dans le premier cas, le témoin recourt, dans la même phrase, à la fois à ne et à une forme verbale non finie ; dans le deuxième cas, à ne et à un verbe spécifique (obtenir) plutôt qu’à avoir, générique.


  1. Conclusion

La prise en compte de la langue parlée apporte, pour l'ordre des mots, une série de données spécifiques, même s'il ne s'agit pas de faits radicalement nouveaux. Contrairement à ce que proposent des auteurs comme B. Fradin (1990), je serai d'avis que ces données peuvent être intégrées très naturellement à celles du français écrit. Faire une nette séparation entre grammaire de l'écrit et grammaire de l'oral ne paraît pas s'imposer.

Pour établir des règles proprement grammaticales, il semble nécessaire de distinguer d'une part un ordre des mots tels qu'ils apparaissent dans la suite linéaire, où jouent les phénomènes discursifs de prise de parole, et d'autre part un ordre grammatical des syntagmes, qu'il faut en quelque sorte « reconstruire », par delà le désordre apparent des discours. Cette dissociation est indispensable si l'on veut pouvoir dégager la cohérence des productions orales et les règles qu'elles suivent. Je reprendrai ici, pour le compte de la langue parlée, la profession de foi que H. NØlke faisait pour l'étude des textes en général :

« Tout texte est cohérent. Par définition. C'est là un axiome qui dirige toute interprétation de texte » (H. N0lke 1994, 259)

II me paraît important de voir comment, dans tous ces problèmes d'ordre des mots, la syntaxe, la sémantique et l'intonation sont liées. Il ne serait pas sain de penser que, lorsque l'intonation aide à voir certains phénomènes de focalisation, on n'aurait plus besoin de la syntaxe pour expliquer la construction, un peu comme pour une maison qui ne tiendrait que par la peinture...

Les variations dans l'ordre des mots semblent parfois être utilisées par les locuteurs comme autant d'éléments de « figures » d'une sorte de rhétorique élémentaire. Ces figures, dont le chiasme est la plus frappante, s'exercent sur une matière syntaxique qui peut s'y prêter. Renoncer, pour les décrire, au cadre trop étroit de la phrase, n'implique pas que l'on quitte le domaine de la description morpho-syntaxique.

Oral vs. écrit, populaire vs. cultivé, familier vs. soutenu ont souvent été considérés comme une opposition du simple vs. complexe et de surcroît comme trois phénomènes qui n’en font qu’un. Trop souvent des linguistes, en employant les désignations des registres, ne distinguent pas entre le paramètre social et le paramètre stylistique : « populaire » se confond avec « familier », par exemple, ce qui est dû au fait que les variations sociale et stylistique se manifestent d’une manière similaire (cf. Gadet 2007). En outre, il y a confusion de langue non-standard et langue orale, puisque cette dernière s’oppose à la langue écrite, qui tend vers le standard. Or, si notre locutrice s’avère relativement conservatrice, nos observations montrent qu’à la fois les facteurs de l’oral et des phénomènes typiques d’un registre informel se retrouvent dans le discours d’une locutrice de la haute bourgeoisie parisienne et donc dans toutes les classes sociales.

Comme nous venons de le montrer, le français parlé possède une multitude de particularités linguistiques inconnues dans le français standard. Ces spécificités se manifestent dans les domaines lexical et (morpho)syntaxique, mais elles marquent surtout le côté phonique . L’origine de ces spécificités réside dans la situation linguistique du français parlé qui, caractérisée par le contact persistant entre l’occitan et le français, a donné naissance à une variété particulière du français, le français parlé.

En guise de conclusion, il semble que notre locutrice fournit un exemple d’une variété de français qui est à la fois urbaine, populaire .


  1. Bibliographie

Belaval, Y., 1962, « Introduction à la poésie expérimentale », Critique, №186, pp. 920-940.

Bellemin-Noël, J., 1972, Le Texte et Г Avant-Texte, Paris, Larousse.

Bilger, M., 1983, Étude distributionnelle de la coordination par ET, Thèse de troisième cycle, Université de Provence.

Blanche-Benveniste, С & Jeanjean, C, 1986, Le Français parlé. Transcription et Édition, Paris, Didier-Érudition.

Blanche-Benveniste, C. et alii, 1990, Le Français parlé : études grammaticales, Paris, Éditions du C.N.R.S.

Bloomfield, Léonard, 1927, «c Literate and illiterate Speech », in CF. Hockett (éd.), 1970, A Leonard Bloomfield Anthology, Indiana University Press, Bloomington, pp. 147-156.

Brown, G. & Yule, G., 1983, Discours Analysis, Cambridge University Press.

Chevalier J.-C, « Exercices portant sur le fonctionnement des présentatifs», Langue française, n° 1, février 1969.

Delesalle S., « L'étude de la phrase », Langue française, n° 22, mai 1974.

Dubois J., Grammaire structurale du français.

— Nom et pronom; Larousse, 1965.

— Le verbe, Larousse, 1967.

Fayol, M., 1989, « Une approche psycholinguistique de la ponctuation : étude en production et en compréhension », Langue Française, № 81, 21-49.

Founau, P.-J., 1987, « La dérive des signes », in Mathieu et Collot (prés.), 243-256.

Genouvrier E., « Quelle langue parler à l'école ? » Langue française, n° 13, février 1972.

Genouvrier E., Peytard J., Linguistique et enseignement du français, Larousse, 1970.

Gougenheim R., Michea P., Rivenc P., Sauvageot A., L' élaboration du français fondamental, étude sur l'établissement d'un vocabulaire et d'une grammaire de base, Didier, 1956, éd. revue et corrigée 1964.

Gresillon, A. & Lebrave, J.-L., 1983, « Avant-Propos », Langages, №89, Manuscrits-Écriture : production linguistique, 5-10.

Jakobson, R., 1963, « Deux aspects du langage et deux types d'aphasie. », Essais de linguistique générale, Paris, éditions de Minuit, 43-67.

Halliday, M.A.K., 1985, An Introduction to Functional Grammar, London-New

York — Melbourne — Auckland, Edward Arnold.

L'Herne (Cahier de), 1966, Henri Michaux, Paris, Éditions de L'Herne.

Mathieu, J.C. & Collot, M., 1987, (textes réunis et présentés par), Passages et langages de Henri Michaux, Paris, Librairie José Corti.

Meschonnic, Henri, 1987, « Le rythme et le poème chez Henri Michaux », in Mathieu & Collot (prés.), 185-208.

Roulet E., « Pour une meilleure connaissance des français à enseigner », Le français dans le Monde, n°100, octobre-novembre 1973.


[1] Y. Liu, E. Shriberg, A. Stolke, and M. Harper. Comparing HMM, Maximum

Entropy, and Conditional Random Fields for Disfluency Detection. InterSpreech

2005, 2005

[2]  M.Lease, Johnson M., and E. Charniak. Recognizing Disfluencies in      

 Conversational Speech. IEEE Transactions on Audio, Speech and Language

 Processing, 14(5) : 1566-1573, 2006.

 

[3]  P.B. de Mareüil, B. Habert, F. Bénard, M. Adda-Decker, C. Barras, G. Adda, and  

  P. Paroubek. A quantitative study of disfluencies in French broadcast interviews.

 Proceeding of the workshop Disfluency In Spontaneous Speech (DISS), Aix-en-

 Provence, France, 2005.

[4] D. Luzzati. Le fenêtrage syntaxique : une méthode d'analyse et dévaluation de

l'oral spontané. In MIDL, Paris, France, 2004.

[5] P. Deléglise, Y. Estève, S. Meignier, and T. Merlin. The LIUM speech transcription system : a CMU Sphinx Ill-based System for French Broadcast News. In Interspeech 2005, Lisbon, Portugal, September 2005.

[6] Cohen J. A  coefficient of agreement for nominal scales. Educational and    Psychological Measurement, 20 :37-46, 1960.

[7] Barbara Di Eugenio and Michael Glass. The kappa statistic : A second look.  Computational Linguistics, 30(1) :95-101, 2004.

[8] Y. Liu, E. Shriberg, A. Stolcke, D. Hillard, M. Ostendorf, and M. Harper.

Enriching speech recognition with automatic detection of sentence boundaries and

disfluencies. IEEE Transactions on Audio, Speech and Language Processing,

14(5) :1526-1540, 2006.

[9] J.-F. Yeh and C.-H. Wu. Edit Disfluencies Detection and Correction Using a

Cleanup Language Model and an Alignment Model. IEEE Transactions on Audio,

Speech and Language Processing, 14(5) :1574-1583, 2006.

[10] E. Shriberg. Phonetic consequences of speech disfluency. Proceedings of the

International Congress of Phonetic Sciences (ICPhS-99), pages 619-622, 1999.

[11]G. Caelen-Haumont. Perlocutory Values and Functions of Melisms in

Spontaneous Dialogue. Proceedings of the 1st International Conference on Speech

Prosody, SP, pages 195-198, 2002.

[12] M.H. Siu and M. Ostendorf. Modeling disfluencies in conversational speech.

  ICSLP 1996, 1, 1996.

[13] Frederic Bechet. LIA_TAGG.

  http://www.lia.univ-avignon.fr/chercheurs/bechet/download_fred.html

[14] Cf. G. BOURQUIN, "Niveaux, aspects et registres de langage", Remarques à

propos de quelques problèmes théoriques et pédagogiques", in Linguistics, 13,

1965, 5-15.