Re: [Iramuteq-users] Analyse de similitude versus Classification GNEPA

SourceForge Headquarters 225 Broadway Suite 1600 San Diego, CA 92101 +1 (858) 454-5900

Bonjour,

>
> 1. Je rencontre un problème dans la lecture des données : la forme 
> "personnel" est reliée à facebook au centre d'une "communauté" de 
> formes), tandis qu'information est au centre d'une autre communauté de 
> formes. Or, dans le corpus, personnel est toujours utilisé dans 
> l'expression "informations personnelles". Dès lors, pourquoi la forme 
> personnel est reliée à facebook et non à information puisqu'elle est 
> beaucoup plus proche de la dernière sur le plan syntaxique ?
Le mot "personnel" doit également systématiquement apparaître dans des 
segments de texte qui contiennent facebook. Le mot facebook doit être 
plus fréquent que le mot information. Décocher "arbre maximum" pour 
vérifier ça. Par ailleurs, essayez avec l'indice "jaccard", si 
effectivement "personnel" n'apparaît que avec information (et 
qu'information n'apparaît pas dans un autre contexte) ils seront liés 
dans l'arbre maximum.
> 2. Par ailleurs, lorsque je vais à Classification / GNEPA, j'obtiens 5 
> classes là où l'analyse de similitude me fournissait  7 communautés ; 
> comment expliquer ces différences, et comment choisir la méthode 
> adaptée à mon corpus ?
Il y a des différences parce que c'est deux analyses n'ont absolument 
rien à voir. La détection des communautés n'est pas une classification. 
Toutes deux dépendent des paraître utilisés pour les produire. Il faut 
voir la détection des communautés comme une façon de simplifier la 
lecture des arbres.

> 3. Au niveau graphique, l'affichage du graph 3D plante sur mon ubuntu 
> 13.04
Essayez de recompiler la librairie rgl de R.

Cordialement
Pierre Ratinaud


Le 19/06/2013 20:20, Thibaud Hulin a écrit :
> Bonjour,
>
> Merci pour ce très beau logiciel qui nous est ainsi rendu très accessible.
>
> J'utilise iramuteq pour analyser un petit corpus fait à l'aide de 
> questions thématiques organisées en section. Le document ainsi décrit 
> 5 sections par utilisateur, il est ainsi marqué :
> **** *doc_sebastien *section_ONE
>
> Ci-dessous 3 questions sur le choix d'une méthode d'analyse.
>
> 1. Je rencontre un problème dans la lecture des données : la forme 
> "personnel" est reliée à facebook au centre d'une "communauté" de 
> formes), tandis qu'information est au centre d'une autre communauté de 
> formes. Or, dans le corpus, personnel est toujours utilisé dans 
> l'expression "informations personnelles". Dès lors, pourquoi la forme 
> personnel est reliée à facebook et non à information puisqu'elle est 
> beaucoup plus proche de la dernière sur le plan syntaxique ?
>
>
> 2. Par ailleurs, lorsque je vais à Classification / GNEPA, j'obtiens 5 
> classes là où l'analyse de similitude me fournissait  7 communautés ; 
> comment expliquer ces différences, et comment choisir la méthode 
> adaptée à mon corpus
>
> 3. Au niveau graphique, l'affichage du graph 3D plante sur mon ubuntu 
> 13.04  :
>
>  *** caught segfault ***
> address 0x40244fcdc, cause 'memory not mapped'
>
> Traceback:
>  1: .C(rgl_texts, success = as.integer(FALSE), idata, 
> as.double(adj),     as.character(text), as.numeric(vertex), 
> as.integer(nfonts),     as.character(family), as.integer(font), 
> as.numeric(cex), as.integer(useFreeType), NAOK = TRUE)
>  2: rgl.texts(x = c(-0.735058472799309, -1.96962302060792, 
> -0.715333775607849, -1.47739946559168, -1.39700924104338, 
> -0.732850675505743, -0.133298455831397, -1.80464131635888, 
> -0.636235657405902, -1.15316100431231, 2.75856646301834, 
> -2.79099916675074, -1.66922774913492, -2.24908603536504, 
> 1.32525559077176, 1.61888018144829, -0.385301353489496, 
> -1.84670314339017, -0.971204098989291, -1.37098996402487, 
> -0.590757504357443, 1.30796363250562, -2.03452644223367, 
> 0.0983673833491716, -1.79804333606543, -1.46337275887397, 
> -2.60785112926921, 3, -0.823612805629938, 2.27061773947394, 
> -1.06131087278045, -1.01843219624889, -1.10442053683196, 
> -0.931095099902501, 1.71575187423874, 1.18614187924785, 
> 0.683528301587383, -2.51469846358951, -0.529107248508384, 
> -0.620823063481858, -1.29885112270077, -3, 2.57569430646572, 
> 1.02818875115389, 0.109183643915004, -0.474204638765647, 
> -0.705860698095965), y = c(-0.404303989217442, 2.38946056261405, 
> -0.314612396770821, 1.7043655510396, -3, -0.355889101578894, 
> -0.756128220704277, 2.14105173283957, -0.292004558743437, 
> 1.28011490858866, 0.791586479421881, -0.698466719585639, 
> -0.546998910174944, -0.601654269443388, 0.748882416250807, 
> 0.177128833886597, -0.301273457762945, -2.10988316088636, 
> 0.170123452613751, -2.52944562700729, -0.14583373652215, 
> 0.521055335791751, 2.51622930402762, -0.0971677558073956, 3, 
> -2.02374558399868, 2.86002505359067, 1.76101890298651, 
> 0.838946645283758, 1.05224816673472, -0.579604841221993, 
> -1.11204280089138, -1.0456374125424, -1.46501593368608, 
> 0.894705756818906, 0.655910982968731, 0.546979073658135, 
> 2.67947535850826, -1.34956320756213, -0.13062696424319, 
> -1.57266070742595, 2.91335502892292, 1.48031967270172, 
> 0.44926897274106, 0.459958509156333, 0.369000470794059, 
> -0.115682370745678), z = c(-3, 1.10420638015865, -2.00500554012858, 
> 1.52195707516184, 1.81807076121369, -2.50944763976959, 
> -1.09151592294156, 1.57519367241089, -1.48199010330547, 
> 1.40531806127171, 1.61215039070618, 0.851668609694638, 
> 0.972162975897306, 0.908870365608733, 3, 2.80165416523597, 
> -0.956711532433326, 2.16353139508512, -0.642440924921856, 
> 1.7344495429985, -0.413556724972101, 2.50068188919353, 
> 1.91728978609735, -1.17536932207012, 1.89980471294496, 
> 1.76158879198147, 2.69326649227717, 1.84457176010277, 
> 1.27685381827714, 1.71248848206022, 1.0420274636989, 1.30813238548899, 
> 1.84478016297658, 0.915594843595198, 1.77867058485798, 
> 1.94166285576852, 1.59794190169235, 2.19135021961455, 
> 1.45159935604122, 0.188973897044336, 1.51745040796129, 
> 2.05790262075016, 1.77720498365816, 1.20700669609714, 
> 1.38517337925812, 1.14719879268348, 0.812486238733162), text = 
> c("microblog", "travail", "baser", "internet", "temps", "identica", 
> "service", "site", "message", "consister", "facebook", "partager", 
> "web", "photo", "mettre", "personnel", "fonctionnalités", "possible", 
> "statusnet", "réel", "twitter", "effet", "recherche", "différent", 
> "créer", "réseau", "réseausocial", "information", "moyen", "ami", 
> "publier", "friendfeed", "choisir", "rester", "échanger", "vie", 
> "compte", "connaître", "événement", "voir", "vidéo", "découvrir", 
> "permettre", "but", "utilisateur", "groupe", "échange"), adj = 0.5, 
> color = c("#CCFF00FF", "#FF0000FF", "#CCFF00FF", "#FF0000FF", 
> "#0066FFFF", "#CCFF00FF", "#CCFF00FF", "#FF0000FF", "#CCFF00FF", 
> "#FF0000FF", "#CC00FFFF", "#00FF66FF", "#00FF66FF", "#00FF66FF", 
> "#CC00FFFF", "#CC00FFFF", "#CCFF00FF", "#0066FFFF", "#CCFF00FF", 
> "#0066FFFF", "#CCFF00FF", "#CC00FFFF", "#FF0000FF", "#CCFF00FF", 
> "#0066FFFF", "#0066FFFF", "#FF0000FF", "#FF0000FF", "#FF0000FF", 
> "#00FF66FF", "#00FF66FF", "#00FF66FF", "#00FF66FF", "#00FF66FF", 
> "#CC00FFFF", "#CC00FFFF", "#CC00FFFF", "#FF0000FF", "#0066FFFF", 
> "#CCFF00FF", "#0066FFFF", "#FF0000FF", "#00FF66FF", "#CC00FFFF", 
> "#CCFF00FF", "#FF0000FF", "#CCFF00FF"), alpha = 1,     lit = TRUE, 
> ambient = "#000000", specular = "#FFFFFF", emission = "#000000",     
> shininess = 50, smooth = TRUE, front = "filled", back = "filled",     
> size = 3, lwd = 1, fog = TRUE, point_antialias = FALSE, line_antialias 
> = FALSE,     texture = NULL, textype = "rgb", texmipmap = FALSE, 
> texminfilter = "linear",     texmagfilter = "linear", texenvmap = 
> FALSE, depth_mask = TRUE,     depth_test = "less", cex = c(0.3, 
> 0.295857411373869, 0.295857411373869,     0.295857411373869, 
> 0.225787472133584, 0.225787472133584,     0.222211391353761, 
> 0.222211391353761, 0.222211391353761,     0.222211391353761, 
> 0.207033701971412, 0.201687284171876,     0.177162215325436, 
> 0.170175285220964, 0.159848319272632,     0.159848319272632, 
> 0.156909559819906, 0.146228526467631,     0.121620841893605, 
> 0.121620841893605, 0.118115574594571,     0.114692923023124, 
> 0.094546487738777, 0.094546487738777,     0.094546487738777, 
> 0.0925991170170914, 0.0876303711150938,     0.0782003759234165, 
> 0.066480744852909, 0.059836079905582,     0.0565550552957119, 
> 0.0565550552957119, 0.0565550552957119,     0.0565550552957119, 
> 0.0511024172749924, 0.0511024172749924, 0.0511024172749924, 
> 0.0502526555055296, 0.0502526555055296,     0.0502526555055296, 
> 0.0502526555055296, 0.0502526555055296, 0.0362079818157975, 
> 0.0348979324212091, 0.03, 0.03, 0.03))
>  3: do.call("rgl.texts", c(list(x = x, y = y, z = z, text = texts,     
> adj = adj), new))
>  4: text3d(lo[, 1], lo[, 2], lo[, 3], rownames(x), cex = maxchi,     
> col = cc)
>  5: make.simi.afc(dm, chistabletot, lim = 0, alpha = 0.1, movie = NULL)
> aborting ...
>
>
> N'étant pas familier d'un logiciel de classification, je tâtonne sûrement.
>
> Merci de l'aide,
> Thibaud.
>
>
> ------------------------------------------------------------------------------
> This SF.net email is sponsored by Windows:
>
> Build for Windows Store.
>
> http://p.sf.net/sfu/windows-dev2dev
>
>
> _______________________________________________
> Iramuteq-users mailing list
> Ira...@li...
> https://lists.sourceforge.net/lists/listinfo/iramuteq-users

-- 
Pierre Ratinaud
Maître de conférences
Département des Sciences de l'Education et de la Formation
Laboratoire LERASS : http://www.lerass.com/
Université de Toulouse II - Le Mirail : http://www.univ-tlse2.fr/
tel : 05 61 50 42 28
-- ATTENTION --
Je ne lis pas les documents au format docx, xlsx et pptx. Si vous voulez que je lise un document dans l'un de ces formats, joingez à votre message le montant d'une licence Microsoft Office. Merci de votre compréhension.