L'enjeu des métadonnées dans les corpus textuels
facebook google+ twitter

L'enjeu des métadonnées dans les corpus textuels

un défi pour les sciences humaines

chez Presses universitaires de Rennes

Collection(s) : Rivages linguistiques

Paru le | Broché 204 pages

Professionnels

Grand format Livre broché
26.00 Expédié sous 3 à 6 jours ouvrés
Ajouter au panier Frais de livraison

L'enjeu des métadonnées dans les corpus textuels

Il devient superflu d'insister sur la révolution scientifique que représentent la numérisation et les capacités de mémoire dans la création de bases de données en sciences humaines. Le défi est désormais ailleurs : à la fois quantitatif et qualitatif. En effet la course est désormais à la constitution de très grosses ressources et les possibilités informatiques le permettent.

Ce changement d'échelle a une incidence automatique sur la vie académique : les recherches qui ne reposeront pas sur un fondement quantitatif appréciable risquent fort d'être frappées de caducité. Mais la constitution de ces gros ensembles nécessite un soin méticuleux, des moyens matériels, mais surtout humains qui ne sont pas à la portée de tous les chercheurs.

À supposer que ces conditions soient remplies, reste encore à s'entendre sur le contenu enregistré : aucun texte n'est numérisé et archivé de façon brute. Ce qui est à présent devant nous est donc autre : entre utilisation « maison » et normalisation des données, il s'agit de se frayer un chemin qui tout à la fois autorise les recherches les plus spécifiques sans pour autant priver la communauté d'une donnée échangeable et utilisable pour d'autres recherches.

Ce volume répond à cette préoccupation : comment faire migrer de vieux corpus vers d'autres standards, comment ménager des besoins particuliers et un désir légitime d'exporter ailleurs des documents, de quels outils pouvons-nous disposer pour réaliser au mieux cette quadrature du cercle ?
Etudes sur la migration des anciens corpus vers d'autres standards afin de valoriser et de mutualiser les ressources linguistiques. Elles analysent la mise en place par la TEI (Text encoding initiative) de nouveaux modules adaptés au balisage de types de texte, les méthodologies pour constituer des corpus de données orales anciennes et contemporaines ou encore l'accès au matériel sonore. ©Electre 2019
Format : Broché
Nb de pages : 204 pages
Poids : 290 g
Dimensions : 16cm X 21cm
Date de parution :
ISBN : 978-2-7535-7640-7
EAN : 9782753576407