Scripts réalisés dans le cadre du projet SUMTEC pour la préparation des corpus de transcription en vue d'une exploitation sur RQDA et IRAMUTEQ.

http://www.msh-lorraine.fr/index.php?id=623

Le projet contient 3 programmes PERL.
L'objectif consiste à récupérer des transcriptions d'entretien non structurées afin de les structurer sous la forme d'un arbre xml. L'intérêt consiste à pouvoir, in fine, identifier les tours de parole et séparer les discours des interviewés et des intervieweurs.

Features

  • Conversion de formats (docx -> txt)
  • Nettoyage de chaînes de caractères
  • Etiquettage
  • Structuration de données (txt -> xml)

Project Samples

Project Activity

See All Activity >

License

GNU General Public License version 3.0 (GPLv3)

Follow Projet sumtec

Projet sumtec Web Site

Other Useful Business Software
$300 in Free Credit Towards Top Cloud Services Icon
$300 in Free Credit Towards Top Cloud Services

Build VMs, containers, AI, databases, storage—all in one place.

Start your project in minutes. After credits run out, 20+ products include free monthly usage. Only pay when you're ready to scale.
Get Started

Additional Project Details

Intended Audience

Science/Research

User Interface

Console/Terminal

Programming Language

Perl

Related Categories

Perl Information Analysis Software

Registered

2015-09-22