Descriptif de la formation

L’ANF DataViz s’adresse aux personnels désireux d’utiliser les dernières méthodes et les nouveaux outils de la visualisation des données. Elle vise à consolider les compétences de ceux qui ont déjà une pratique de la visualisation de données avec des connaissances fondamentales en design graphique.

La pédagogie proposée tiendra compte à la fois du type de données à visualiser et du niveau de technicité des stagiaires. Ainsi la formation débutera par un bref rappel de ce qu’il est utile de connaître avant de se lancer dans la dataviz, puis abordera divers types de données : les données textuelles, les données de réseau, les données spatialisées ou géolocalisées.

Afin de tenir compte de l’hétérogénéité des niveaux selon le type de données (un expert réseaux ne sera pas forcément expert des données géolocalisées par exemple), chacun des types de données sera abordé :

  • d’un point de vue théorique.
  • d’un point de vue pratique. Les ateliers pratiques seront dédoublés, afin de présenter une solution facile à prendre en main pour le néophyte, et une solution plus avancée pour l’expert.

Descriptif des ateliers :

Les ateliers pratiques permettront aux stagiaires de tester les outils et langages présentés. Afin de tirer le plus d'avantage possible de cette ANF, il est donc souhaitable de disposer d'un ordinateur portable, ou éventuellement un appareil pour 2 personnes.

* Les données textuelles

Guide d'aide à l'installation

Atelier 1 : Analyse visuelle de corpus textuel avec CorText

Cet atelier propose une prise en main de la plateforme Cortext (https://docs.cortext.net). Vous apprendrez de manière intuitive à explorer le contenu de vos corpus à extraire les termes d’un ensemble de textes, à visualiser l’évolution d’un champ et construire des réseaux d'entités. Plusieurs jeux de données de test provenant de sources variées seront proposés pour cette première prise en main.

Prérequis : aucun

Atelier 2 : Statistique textuelle avec R

Cet atelier abordera la mise en œuvre de la statistique textuelle sur différents types de corpus (questions ouvertes, entretiens, titres d'articles, pages Web etc..) à l'aide du logiciel R. Nous mettrons en œuvre les étapes d'analyse : pré-traiter (nettoyer, normaliser) les données, transformer les données textuelles en objets numériques (tableaux lexicaux), choisir la méthode adaptée à sa problématique (vocabulaire spécifique, analyse factorielle ou classifications pour identifier des univers lexicaux, graphes de mots). La dernière partie de l'atelier sera consacrée à la restitution des résultats à un public, notamment avec l'usage de la datavizualisation (nuages de mots, plans factoriels, dendrogrammes, graphes de mots).

Différentes pratiques du logiciel R seront abordées : de l’usage d'une interface « clé en main » comme IraMuTeQ ou R.TeMis dans l’interface graphique de RCommandeR  à l’écriture de scripts dans R Studio à l'aide des nouvelles fonctionnalités de R.TeMiS .

Prérequis : Connaître les bases de la statistique descriptive et des analyses factorielles et classifications. Ne nécessite pas de savoir programmer.

 

* Les données de réseau

Guide d'aide à l'installation

 

Atelier 1 : Utiliser Gephi pour produire des représentations de réseaix interprétables.
 
Cet atelier pratique avec Gephi montre des bonnes pratiques pour visualiser un réseau. Il y sera question de l'aspect technique mais aussi sémiotique : comment choisir l'apparence, la couleur et la position des noeuds pour utiliser le résultat dans un contexte scientifique. Il n'est pas nécessaire de savoir coder ni d'avoir de l'expérience avec Gephi. Bien que l'outil soit Gephi, une grande partie des acquis sera directement transférable à d'autres logiciels.
 
Prérequis : aucun
Niveau : débutant ou intermédiaire
Logiciels utilisés : Gephi
 
Retrouver une démo de Gephi ici

 

Atelier 2 : Publier un réseau sur le web, créer un dispositif interactif.

Cet atelier expert s'adresse à des personnes familières avec la programmation et propose d'explorer la visualisation de réseaux avec les technologies web. Deux questions seront abordées : comment publier un réseau en ligne, et comment créer un réseau interactif. Une grande partie du travail consistera à reprendre et adapter du code existant, il n'est donc pas nécessaire d'être un expert du Javascript mais une expérience avec le code est recommandée (même si c'est un autre langage). Il sera possible d'aller un peu plus loin avec les participants qui connaissent bien le Javascript.

 

Prérequis : notions de Javascript et de HTML, familiarité avec la programmation
Niveau : intermédiaire et avancé
Technologies utilisées : Javascript, d3.js, Graphology, Sigma.js, HTML
 

* Les données spatialisées ou géolocalisées

Guide d'aide à l'installation

 Atelier 1 : Cartographie avec Magrit
 
Cet atelier propose la réalisation de cartes thématiques à travers l’utilisation de deux logiciels disponibles sur le web (Magrit et Khartis). Vous apprendrez à construire des cartes géographiques de A à Z (import des données, choix d'une représentation adaptée et combinaison de représentations, changement de la projection, habillage et personnalisation de la carte) dans des logiciels simples et intuitifs.

Prérequis : aucun


Atelier 2 : Cartographie avec R
 
Cet atelier propose la réalisation de cartes thématiques dans une démarche reproductible, avec le langage R (packages ‘cartography’ et ‘sf’, sous R Studio). Le but de cet atelier consistera à réaliser pas à pas différentes cartes (et traitements SIG), de l’import des données géographiques et statistiques à la visualisation, et celà à différentes échelles géographiques (du local au global). En fonction des types de données mobilisés dans chaque exercice, plusieurs visualisations seront réalisées (cartes en symboles proportionnels, carte par aplats de couleur, carroyages, discontinuités, etc.)
 
Prérequis :notions minimales de programmation dans le langage R 

Retrouver une demo de R 'cartography' ici

 

Les questions abordées seront :

  • En quoi la datavisualisation permet une meilleure compréhension des donnés (elle n’est pas simplement utilisée pour faire joli) ?

  • Comment explorer des données, et en particulier des données complexe (données réticulaires, données spatialisées, etc.) pour en avoir une première approche (ou visualisation) ?

  • En quoi de tels outils aident-ils à la mise en place des visualisations (quel travail pour le spécialiste du domaine et/ou l’informaticien) ?

 

 

Personnes connectées : 1