Scripts réalisés dans le cadre du projet SUMTEC pour la préparation des corpus de transcription en vue d'une exploitation sur RQDA et IRAMUTEQ.
http://www.msh-lorraine.fr/index.php?id=623
Le projet contient 3 programmes PERL.
L'objectif consiste à récupérer des transcriptions d'entretien non structurées afin de les structurer sous la forme d'un arbre xml. L'intérêt consiste à pouvoir, in fine, identifier les tours de parole et séparer les discours des interviewés et des intervieweurs.
Features
- Conversion de formats (docx -> txt)
- Nettoyage de chaînes de caractères
- Etiquettage
- Structuration de données (txt -> xml)
Categories
Information AnalysisLicense
GNU General Public License version 3.0 (GPLv3)Follow Projet sumtec
Other Useful Business Software
$300 in Free Credit Towards Top Cloud Services
Start your project in minutes. After credits run out, 20+ products include free monthly usage. Only pay when you're ready to scale.