Accueil > Big Data, IA > Big Data Analytics avec R
Formation #BSI97

Formation Big Data Analytics avec R

Durée : 5 jours

Code : BSI97


Prochaines dates programmées :

Du 24 au 28 Juin 2024

Du 26 au 30 Août 2024

Du 14 au 18 Oct. 2024

Du 16 au 20 Déc. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Savoir installer R
  • Comprendre le principe de la modélisation statistique
  • Comprendre comment manipuler des données avec R
  • Savoir choisir et réaliser de façon autonome des analyses factorielles et classifications
Programme
1/ Introduction générale
  • Présentation du logiciel R
  • Installation du logiciel R et packages
2/ Types de données dans R
  • Manipulations de scalaires (réels)
  • Manipulations de nombres complexes
  • Manipulations de variables
  • Manipulations de vecteurs
  • Manipulations de matrices
  • Manipulations de textes
  • Manipulations de dates et de durées
3/ Les bases d'utilisation du logiciel R
  • Importation et exportation de données
  • Manipulation de données
  • Tracer des courbes et des graphiques
4/ Analyse en composantes
  • Analyse en Composantes Principales
  • Analyse du nuage des individus
  • Propriétés des composantes principales
  • Analyse du nuage des variables
  • Interprétation des résultats
  • Analyse des correspondances
  • Nuages des profils-lignes et des profils-colonnes, la distance du khi-deux
  • Analyse des nuages des profils
  • Liens entre les analyses
  • Interprétation des résultats
  • Analyse des Correspondances Multiples
  • Analyse des correspondances sur le tableau disjonctif complet
  • Propriétés de l’ACM
  • Analyse du tableau de Burt
  • Analyse Factorielle pour Données Mixtes
  • Classification
  • Classification ascendante hiérarchique : principe, stratégies d’agrégation, aides à l’interprétation
  • Méthodes de partitionnement : les méthodes des centres mobiles, les nuées dynamiques
  • Classification mixte
5/ La modélisation
  • Construction d'un modèle (étapes)
  • Algorithmes supervisés et non supervisés
  • La régression ou la classification
6/ Procédures d'évaluation de modèles
  • Les techniques de ré-échantillonnage
  • Test de représentativité des données d'apprentissage
  • Mesures de performance des modèles prédictifs
  • Matrice de confusion, de coût et la courbe ROC et AUC
7/ Les algorithmes non supervisés
  • Le clustering hiérarchique
  • Le clustering non hiérarchique
  • Les approches mixtes
8/ Les algorithmes supervisés
  • Le principe de régression linéaire univariée
  • La régression multivariée
  • La régression polynomiale
  • La régression régularisée
  • Le Naive Bayes
  • La régression logistique
9/ Analyse de données textuelles
  • Collecte et prétraitement des données textuelles
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique
  • Lemmatisation
  • Représentation vectorielle des textes
  • Pondération TF-IDF
  • Word2Vec
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Ingénieurs
  • Analystes
  • Data Analysts
  • Toute personne intéressée par l'analyse statistique avec R
Dates

Dates

  • Du 24 au 28 Juin 2024
  • Du 26 au 30 Août 2024
  • Du 14 au 18 Oct. 2024
  • Du 16 au 20 Déc. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.