Re: [Iramuteq-users] Analyse de similitude versus Classification GNEPA
Brought to you by:
pratinaud
From: Pierre R. <rat...@un...> - 2013-06-20 07:17:22
|
Bonjour, > > 1. Je rencontre un problème dans la lecture des données : la forme > "personnel" est reliée à facebook au centre d'une "communauté" de > formes), tandis qu'information est au centre d'une autre communauté de > formes. Or, dans le corpus, personnel est toujours utilisé dans > l'expression "informations personnelles". Dès lors, pourquoi la forme > personnel est reliée à facebook et non à information puisqu'elle est > beaucoup plus proche de la dernière sur le plan syntaxique ? Le mot "personnel" doit également systématiquement apparaître dans des segments de texte qui contiennent facebook. Le mot facebook doit être plus fréquent que le mot information. Décocher "arbre maximum" pour vérifier ça. Par ailleurs, essayez avec l'indice "jaccard", si effectivement "personnel" n'apparaît que avec information (et qu'information n'apparaît pas dans un autre contexte) ils seront liés dans l'arbre maximum. > 2. Par ailleurs, lorsque je vais à Classification / GNEPA, j'obtiens 5 > classes là où l'analyse de similitude me fournissait 7 communautés ; > comment expliquer ces différences, et comment choisir la méthode > adaptée à mon corpus ? Il y a des différences parce que c'est deux analyses n'ont absolument rien à voir. La détection des communautés n'est pas une classification. Toutes deux dépendent des paraître utilisés pour les produire. Il faut voir la détection des communautés comme une façon de simplifier la lecture des arbres. > 3. Au niveau graphique, l'affichage du graph 3D plante sur mon ubuntu > 13.04 Essayez de recompiler la librairie rgl de R. Cordialement Pierre Ratinaud Le 19/06/2013 20:20, Thibaud Hulin a écrit : > Bonjour, > > Merci pour ce très beau logiciel qui nous est ainsi rendu très accessible. > > J'utilise iramuteq pour analyser un petit corpus fait à l'aide de > questions thématiques organisées en section. Le document ainsi décrit > 5 sections par utilisateur, il est ainsi marqué : > **** *doc_sebastien *section_ONE > > Ci-dessous 3 questions sur le choix d'une méthode d'analyse. > > 1. Je rencontre un problème dans la lecture des données : la forme > "personnel" est reliée à facebook au centre d'une "communauté" de > formes), tandis qu'information est au centre d'une autre communauté de > formes. Or, dans le corpus, personnel est toujours utilisé dans > l'expression "informations personnelles". Dès lors, pourquoi la forme > personnel est reliée à facebook et non à information puisqu'elle est > beaucoup plus proche de la dernière sur le plan syntaxique ? > > > 2. Par ailleurs, lorsque je vais à Classification / GNEPA, j'obtiens 5 > classes là où l'analyse de similitude me fournissait 7 communautés ; > comment expliquer ces différences, et comment choisir la méthode > adaptée à mon corpus > > 3. Au niveau graphique, l'affichage du graph 3D plante sur mon ubuntu > 13.04 : > > *** caught segfault *** > address 0x40244fcdc, cause 'memory not mapped' > > Traceback: > 1: .C(rgl_texts, success = as.integer(FALSE), idata, > as.double(adj), as.character(text), as.numeric(vertex), > as.integer(nfonts), as.character(family), as.integer(font), > as.numeric(cex), as.integer(useFreeType), NAOK = TRUE) > 2: rgl.texts(x = c(-0.735058472799309, -1.96962302060792, > -0.715333775607849, -1.47739946559168, -1.39700924104338, > -0.732850675505743, -0.133298455831397, -1.80464131635888, > -0.636235657405902, -1.15316100431231, 2.75856646301834, > -2.79099916675074, -1.66922774913492, -2.24908603536504, > 1.32525559077176, 1.61888018144829, -0.385301353489496, > -1.84670314339017, -0.971204098989291, -1.37098996402487, > -0.590757504357443, 1.30796363250562, -2.03452644223367, > 0.0983673833491716, -1.79804333606543, -1.46337275887397, > -2.60785112926921, 3, -0.823612805629938, 2.27061773947394, > -1.06131087278045, -1.01843219624889, -1.10442053683196, > -0.931095099902501, 1.71575187423874, 1.18614187924785, > 0.683528301587383, -2.51469846358951, -0.529107248508384, > -0.620823063481858, -1.29885112270077, -3, 2.57569430646572, > 1.02818875115389, 0.109183643915004, -0.474204638765647, > -0.705860698095965), y = c(-0.404303989217442, 2.38946056261405, > -0.314612396770821, 1.7043655510396, -3, -0.355889101578894, > -0.756128220704277, 2.14105173283957, -0.292004558743437, > 1.28011490858866, 0.791586479421881, -0.698466719585639, > -0.546998910174944, -0.601654269443388, 0.748882416250807, > 0.177128833886597, -0.301273457762945, -2.10988316088636, > 0.170123452613751, -2.52944562700729, -0.14583373652215, > 0.521055335791751, 2.51622930402762, -0.0971677558073956, 3, > -2.02374558399868, 2.86002505359067, 1.76101890298651, > 0.838946645283758, 1.05224816673472, -0.579604841221993, > -1.11204280089138, -1.0456374125424, -1.46501593368608, > 0.894705756818906, 0.655910982968731, 0.546979073658135, > 2.67947535850826, -1.34956320756213, -0.13062696424319, > -1.57266070742595, 2.91335502892292, 1.48031967270172, > 0.44926897274106, 0.459958509156333, 0.369000470794059, > -0.115682370745678), z = c(-3, 1.10420638015865, -2.00500554012858, > 1.52195707516184, 1.81807076121369, -2.50944763976959, > -1.09151592294156, 1.57519367241089, -1.48199010330547, > 1.40531806127171, 1.61215039070618, 0.851668609694638, > 0.972162975897306, 0.908870365608733, 3, 2.80165416523597, > -0.956711532433326, 2.16353139508512, -0.642440924921856, > 1.7344495429985, -0.413556724972101, 2.50068188919353, > 1.91728978609735, -1.17536932207012, 1.89980471294496, > 1.76158879198147, 2.69326649227717, 1.84457176010277, > 1.27685381827714, 1.71248848206022, 1.0420274636989, 1.30813238548899, > 1.84478016297658, 0.915594843595198, 1.77867058485798, > 1.94166285576852, 1.59794190169235, 2.19135021961455, > 1.45159935604122, 0.188973897044336, 1.51745040796129, > 2.05790262075016, 1.77720498365816, 1.20700669609714, > 1.38517337925812, 1.14719879268348, 0.812486238733162), text = > c("microblog", "travail", "baser", "internet", "temps", "identica", > "service", "site", "message", "consister", "facebook", "partager", > "web", "photo", "mettre", "personnel", "fonctionnalités", "possible", > "statusnet", "réel", "twitter", "effet", "recherche", "différent", > "créer", "réseau", "réseausocial", "information", "moyen", "ami", > "publier", "friendfeed", "choisir", "rester", "échanger", "vie", > "compte", "connaître", "événement", "voir", "vidéo", "découvrir", > "permettre", "but", "utilisateur", "groupe", "échange"), adj = 0.5, > color = c("#CCFF00FF", "#FF0000FF", "#CCFF00FF", "#FF0000FF", > "#0066FFFF", "#CCFF00FF", "#CCFF00FF", "#FF0000FF", "#CCFF00FF", > "#FF0000FF", "#CC00FFFF", "#00FF66FF", "#00FF66FF", "#00FF66FF", > "#CC00FFFF", "#CC00FFFF", "#CCFF00FF", "#0066FFFF", "#CCFF00FF", > "#0066FFFF", "#CCFF00FF", "#CC00FFFF", "#FF0000FF", "#CCFF00FF", > "#0066FFFF", "#0066FFFF", "#FF0000FF", "#FF0000FF", "#FF0000FF", > "#00FF66FF", "#00FF66FF", "#00FF66FF", "#00FF66FF", "#00FF66FF", > "#CC00FFFF", "#CC00FFFF", "#CC00FFFF", "#FF0000FF", "#0066FFFF", > "#CCFF00FF", "#0066FFFF", "#FF0000FF", "#00FF66FF", "#CC00FFFF", > "#CCFF00FF", "#FF0000FF", "#CCFF00FF"), alpha = 1, lit = TRUE, > ambient = "#000000", specular = "#FFFFFF", emission = "#000000", > shininess = 50, smooth = TRUE, front = "filled", back = "filled", > size = 3, lwd = 1, fog = TRUE, point_antialias = FALSE, line_antialias > = FALSE, texture = NULL, textype = "rgb", texmipmap = FALSE, > texminfilter = "linear", texmagfilter = "linear", texenvmap = > FALSE, depth_mask = TRUE, depth_test = "less", cex = c(0.3, > 0.295857411373869, 0.295857411373869, 0.295857411373869, > 0.225787472133584, 0.225787472133584, 0.222211391353761, > 0.222211391353761, 0.222211391353761, 0.222211391353761, > 0.207033701971412, 0.201687284171876, 0.177162215325436, > 0.170175285220964, 0.159848319272632, 0.159848319272632, > 0.156909559819906, 0.146228526467631, 0.121620841893605, > 0.121620841893605, 0.118115574594571, 0.114692923023124, > 0.094546487738777, 0.094546487738777, 0.094546487738777, > 0.0925991170170914, 0.0876303711150938, 0.0782003759234165, > 0.066480744852909, 0.059836079905582, 0.0565550552957119, > 0.0565550552957119, 0.0565550552957119, 0.0565550552957119, > 0.0511024172749924, 0.0511024172749924, 0.0511024172749924, > 0.0502526555055296, 0.0502526555055296, 0.0502526555055296, > 0.0502526555055296, 0.0502526555055296, 0.0362079818157975, > 0.0348979324212091, 0.03, 0.03, 0.03)) > 3: do.call("rgl.texts", c(list(x = x, y = y, z = z, text = texts, > adj = adj), new)) > 4: text3d(lo[, 1], lo[, 2], lo[, 3], rownames(x), cex = maxchi, > col = cc) > 5: make.simi.afc(dm, chistabletot, lim = 0, alpha = 0.1, movie = NULL) > aborting ... > > > N'étant pas familier d'un logiciel de classification, je tâtonne sûrement. > > Merci de l'aide, > Thibaud. > > > ------------------------------------------------------------------------------ > This SF.net email is sponsored by Windows: > > Build for Windows Store. > > http://p.sf.net/sfu/windows-dev2dev > > > _______________________________________________ > Iramuteq-users mailing list > Ira...@li... > https://lists.sourceforge.net/lists/listinfo/iramuteq-users -- Pierre Ratinaud Maître de conférences Département des Sciences de l'Education et de la Formation Laboratoire LERASS : http://www.lerass.com/ Université de Toulouse II - Le Mirail : http://www.univ-tlse2.fr/ tel : 05 61 50 42 28 -- ATTENTION -- Je ne lis pas les documents au format docx, xlsx et pptx. Si vous voulez que je lise un document dans l'un de ces formats, joingez à votre message le montant d'une licence Microsoft Office. Merci de votre compréhension. |