Le sens des données
234 pages
Français
234 pages
Français

Description

Depuis l'avènement des technologues informatiques, des outils d'exploration offrent aux sciences du langage et aux sciences de l'information et de la communication la possibilité de constituer et de traiter des données qui engagent un nouveau rapport à l'empirique et donnent accès à de nouveaux observables. Cet ouvrage propose une réflexion conjointe de la sémiotique et de la linguistique sur les corpus numériques contemporains afin de se demander si, et par quel(s) mode(s) d'exploitation, les données peuvent objectivement faire sens.

Sujets

Informations

Publié par
Date de parution 07 mars 2019
Nombre de lectures 0
EAN13 9782140116018
Langue Français
Poids de l'ouvrage 3 Mo

Informations légales : prix de location à la page 0,1300€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Extrait

Depuis l’avènement des technologies informatiques, des outils d’exploration offrent aux sciences du langage et aux sciences de l’information et de la communication la possibilité de constituer et de traiter des données qui engagent un nouveau rapport à l’empirique et donnent accès à de nouveaux observables. De nombreux travaux consacrés aux corpus questionnent leur statut et s’intéressent aux modalités de leur traitement. Cet ouvrage entend s’en démarquer en proposant une réflexion conjointe de la sémiotique et de la linguistique sur les corpus numériques contemporains afin de se demander si, et par quel(s) mode(s) d’exploitation, les données peuvent objectivement faire sens. L’objectif est également de rendre compte d’une tension constatée entre, d’une part, l’injonction de scientificité à laquelle répondrait le corpus et, d’autre part, le caractère perméable et instable des corpus multimédiatiques numériques qui peuvent être le fruit de co-multi-énonciations.
Sophie ANQUETILest maître de conférences en sciences du langage à l’Université de Limoges. Ses travaux portent sur les actes de langage indirects, sur les relations entre implicite et dialogisme, ainsi que sur les processus de construction du sens à travers les genres de discours.
Carine DUTEIL-MOUGELest maître de conférences en sciences de l’information et de la communication à l’Université de Limoges. Ses travaux portent sur les procédés rhétoriques dans les discours contemporains ; la perspective sémantique-herméneutique adoptée permet de s’intéresser au « pouvoir » du langage.
Vivien LLOVERIAmaître de conférences en sciences du langage, de est l’information et de la communication à l’Université de Limoges. Ses travaux portent sur la réflexivité énonciative des pratiques de signification (dimension épisémiotique), sur la stabilisation et la régulation du sens dans le domaine du design, de l’image et des discours numériques.
Ils sont tous les trois membres du Centre de Recherches Sémiotiques (CeReS – EA 3648).
Illustration de couverture :NomadeCC BY Phil Roeder.
ISBN : 978-2-343-16502-8 30
Sous la direction de SophieANQUETIL,CarineDUTEIL-MOUGEL et VivienLLOVERIA
LE SENS DES DONNéES
Le statut du corpus et herméneutique à l’aune des humanités numériques
Le sens des données
Collection « Humanités numériques » dirigée par Julien Longhi Les humanités numériques connaissent un développement croissant, et deviennent un centre d’intérêt de plus en plus important et partagé (par les chercheurs, mais aussi les institutions, les politiques publiques, les professionnels de l’éducation, etc.). Mais derrière cette dénomination, force est de constater qu’une pluralité d’objets, de pratiques, de méthodes, et d’objectifs, peuvent s’incarner. L’objectif de cette collection « Humanités Numériques », est de proposer un espace capable de se saisir des problématiques et travaux actuels sur le renouvellement des humanités via le numérique, des dispositifs techniques vis-à-vis de la transmission et la circulation des connaissances, des différentes appréhensions du numérique, ou encore de l’accès aux savoirs au regard de la médiation symbolique, sémiotique, et technologique des nouveaux médias et supports. Elle est donc un lieu de production de savoirs transversal des stricts champs disciplinaires académiques, et s’intéresse aux sciences du langage, à l'information-communication, à la sociologie, aux sciences politiques, à l'informatique, aux sciences de l’éducation, à la philosophie, à l’anthropologie, etc. avec pour dénominateur commun le croisement des humanités et du numérique. La collection encourage donc la publication de monographies, d’essais, d’ouvrages collectifs, d’actes de journées ou de colloques, qui donneront à voir des recherches ou pratiques originales dans l’appréhension des objets culturels, textuels, politiques, sociaux, en lien avec leur appréhension, diffusion, réception, numérique. Déjà parus Matthieu BACH,Start-up du vin, Entre vrais apports et faux semblants, 2018. Julien LONGHI,Du discours comme champ au corpus comme terrain. Contribution méthodologique à l’analyse sémantique du discours,2018. Roland CANU, Johann CHAULET, Caroline DATCHARY, Julien FIGEAC (dir.),Critiques du numérique, 2018. Magali GUARESI,Parler au féminin, Les professions de foi des député.e.s sous la Cinquième République(1958-2007), 2018.
Sous la direction de Sophie ANQUETIL, Carine DUTEIL-MOUGEL et Vivien LLOVERIA
Le sens des données
Le statut du corpus et herméneutique à l’aune des humanités numériques
© L’Harmattan, 2019 5-7, rue de l’Ecole-Polytechnique, 75005 Paris http://www.editions-harmattan.fr ISBN : 978-2-343-16502-8 EAN : 9782343165028
SOMMAIREDe la signification des données numériques au corpus des données linguistiques : Sophie ANQUETIL, Carine DUTEIL-MOUGEL, Vivien LLOVERIA .................................................7 CHAPITRE 1 : Épistémologie du corpus numérique 21 François RASTIER : Sémiotique de corpus numériques et accès à la culture ................................................................................23 Mustapha KRAZEM : Grands corpus ou quand le nombre de mots risque de nous détourner du traitement linguistique des données .....................................................................................45 Rossana DE ANGELIS : L’analyse des données textuelles : quels enjeux pour les textes ? ...................................................69 CHAPITRE 2 : Construire le sens des données.......... 99 Jacques FRANÇOIS : La contribution des corpus diachroniques à l’étude du changement lexical .............................................101 Pierre HALTÉ : Intégrer les émoticônes (et interjections) à des outils de traitement automatique de corpus numériques : modélisation, enjeux, projets ..................................................131 Anne PRUNET : Quel usage du corpus en français sur objectif universitaire ...........................................................................155 Florence ANDREACOLA : Les données d’internet : Le sens d’un corpus d’images numériques par la prise en compte de son contexte informatique de production ......................................187 Laetitia EMERIT-BIBIE : Adapter le corpus aux particularités des discours numériques. L’alternative du lieu de corpus ...... 201
5
COMITÉ SCIENTIFIQUESophie Anquetil, CeReS, Université de Limoges Anne Beyaert-Geslin, MICA, Université Bordeaux Montaigne Gérard Chandès, CeReS, Université de Limoges Nicolas Couegnas, CeReS, Université de Limoges Carine Duteil-Mougel, CeReS, Université de Limoges Jacques Fontanille, CeReS, Université de Limoges Agata Jackiewicz, PRAXILING, Université Paul-Valéry, Montpellier 3 Catherine Kerbrat-Orecchioni, ICAR, Université Lyon 2 Dominique Legallois, CLESTHIA, Université Sorbonne Nouvelle, Paris 3 Chantal Parpette, ICAR, Université Lyon 2 Nicole Pignier, CeReS, Université de Limoges Vivien LLoveria, CeReS, Université de Limoges Damon Mayaffre, Bases, Corpus, Langage, Université Nice Sophia Antipolis Régis Missire, LERASS-CPST, Université Toulouse – Jean Jaurès 5 Céline Poudat, Bases, Corpus, Langage, Université Nice Sophia Antipolis Mathieu Valette, Textes, Informatique, Multilinguisme, INALCO
6
DE LA SIGNIFICATION DES DONNÉES NUMÉRIQUES AU CORPUS DES DONNÉES LINGUISTIQUESSOPHIE ANQUETIL, Carine DUTEIL-MOUGEL, Vivien LLOVERIA Université de Limoges, CeReS, EA 3648 LA QUESTION DES DONNÉESSi l’on en croit les propos de Greimas et Courtés (1979), rien ne saurait être dit du sens antérieurement à sa manifestation sous la forme de signification articulée. Dans une perspective similaire, Hjelmslev (cité par Greimas et Courtès 1979) proposait une définition opératoire du sens sous l’identité d’unmatériau premierou d’unsupportpar lequel toute signification se trouve nécessairement manifestée. Le sens devenantmatière sémiotique, l’enjeu de cette première journée d’étude sur le Sens des données fut de consigner, décrire et conceptualiser ensemble cette nouvelle matérialité offerte par les données et plus particulièrement par les données numériques. Une nouvelle matière donnant lieu à de nouvelles articulations, interrogeant tant le plan du signe de la sémiotique, le plan du contenu de la sémantique que celui des usages de la pragmatique. Qu’entendons-nous par données ? Selon les objets d’analyse les données peuvent devenir tour à tour des ensembles signifiants, des énoncés ou des actes de parole. Questionner les données reviendrait à se pencher sur l’être du corpus. Une perspective ontologique sur les données numériques nous engagerait à mieux qualifier leur essence mais également les différentes formes de leur présence prenant place aujourd’hui dans notre quotidien. Mais cette qualification de l’existence des données ne peut manquer de questionner également le faire productif et interprétatif qui l’encadre. Les études qui suivront tenteront de répondre, dans la diversité de leurs approches, à la fois à l’être des données (visée ontologique) et aux différents « faire » qui leur sont sous-jacents (visée praxéologique).
7
Du côté de la sémiotique, l’étude desensembles signifiants a toujours été soumise à trois conditions de validité que sont l’exhaustivité, l’homogénéité et la représentativité.
PRÉSENCE ET SIGNIFICATION DES DONNÉES NUMÉRIQUES
Exhaustivité et données numériques Concernant l’exhaustivité, le numérique provoque de nouvelles résistances dans le passage d’un corpus potentiel, lié à l’objet de la théorie, vers un corpus délimité qui, par sélection, est censé en préparer la description empirique. En effet, le caractère dynamique de la donnée numérique, qu’elle soit issue des blogs, des réseaux sociaux, des directs ou live éditoriaux, ne permet plus de viser la traditionnelle coïncidence entre les manifestations déduites de l’objet de la théorie et la série close des exemplaires constituant un ensemble délimité de structures manifestes nécessaires à l’analyse. Les œuvres matérialisées sur le papier constituaient jusque-là des totalités signifiantes relativement stables (à l’exception des différentes rééditions d’un même ouvrage). L’énoncé se trouvait ainsi structuré, hiérarchisé et encadré strictement par un début et une fin, là où l’énonciation en ligne continue de se dérouler indéfiniment par de possibles suppressions, réorganisations, enrichissements. Si l’être de l’énoncé traditionnel se signalait par saclôture, celui de l’énoncé numérique se présente au contraire comme une œuvre ouverte. Ce terme que nous empruntons à Umberto Eco (1965) traduit bien comment, d’un point de vue aspectuel, la durativité a pris le pas sur la terminativité, fragilisant la validation d’un corpus par le critère d’exhaustivité. Du côté du faire, nous observons un changement dans les méthodes d’analyse associées à l’exhaustivité. Le volume et la versatilité des données d’internet nous poussent à privilégier des techniques de vérification d’hypothèses par sondages. Nous examinons aujourd’hui davantage desprélèvements représentatifs pour les comparer aux modèles produits par l’analyste. Nous cherchons beaucoup moins la saturation du
8
modèle théorique par l’accumulation progressive des occurrences disponibles. L’épuisement des variations structurelles devient alors un objectif irréalisable, un horizon hypothétique en constant recul. Représentativité et données numériques Le critère de représentativité est également modifié par de nouveaux obstacles à la généralisation. En effet, les fréquentations entre genres différents, les diverses hybridations observées sur la toile, entraînent à la fois une révision graphique incessante sur le plan de l’expression nécessairement corrélée à un phénomène d’idéation dynamique sur le plan du contenu. Ce caractère dynamique des corpus numériques ne cantonne les résultats et conclusions de nos recherches qu’à des types passagers, des généralisations évanescentes déjà assaillies par la somme des occurrences nouvelles. Homogénéité et données numériques Enfin, concernant l’homogénéité du corpus, elle est généralement définie par la sémiotique greimassienne comme un ensemble de conditions non-linguistiques, de paramètres de situation situés au niveau des locuteurs, de la distribution des connaissances ou encore du médium utilisé. Dans cette optique, l’énonciation en ligne et son modèle d’auto-publication brouille quelque peu les indications d’homogénéité des locuteurs, des espaces et temps de la production, des garants (chaque lecteur devenant contributeur/écrivant). Du point de vue de la distribution des connaissances, les hiérarchies sont bouleversées puisque l’amateur et le confirmé se retrouvent logés à la même enseigne. Comme le dit Jimmy Wales, fondateur de wikipédia, « il n’y a pas de différence entre un professeur de Harvard et un 1 lycéen, pourvu que l’article soit bon » . Concernant l’homogénéité des paramètres de la situation, lesfonctions ou visées de l’énonciation en ligne ne vont jamais de soi. Nous constatons par exemple comment un simple commentaire en ligne peut être à la fois destiné à modérer une conversation (il
1  A. Smith, “Wales, le nouvel encyclopédiste”,Le figaro, samedi 15 janvier 2011, p. 20
9
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents