Aller au contenu

TP - Données structurées - Tableur⚓︎

CE TP NÉCESSITE UN COMPTE RENDU.

1. Analyse de données publiques⚓︎

1.1 Téléchargement et Ouverture du fichier⚓︎

  1. Lancez un navigateur web et rendez vous sur la plateforme ouverte des données publiques françaises.
  2. Recherchez accident à l'aide du champs de recherche. Et choisir les donnéees Bases de données annuelles des accidents corporels de la circulation routière - Années de 2005 à 2022.
  3. Téléchargez le fichier carcteristiques-2022.csv. C'est un fichier recensant les accidents de la route en 2022 au format csv.

Fichiers CSV

Les fichiers csv sont des formats de partage de données extrêmement courant, les données sont représentées en ligne et les colonnes sont séparées par des virgules ou des point-virgules.

Cette structure permet l'analyse ou le traitement des données. On parle de données structurées.

  1. Ouvrir le logiciel LibreOffice Calc ou Microsoft Excel, et ouvrez le fichier que vous venez de télécharger avec ce logiciel. Il vous demandera le séparateur du fichier, il faut ici sélectionner le point virgule.
  2. Pour comprendre le sens des colonnes, l'aide est disponible à la page 4 du document suivant

1.2 Analyse sommaire du fichier⚓︎

Questions sur l'accident 202200000045.

  1. Quand a eu lieu l'accident ?
  2. Où a eu lieu cet accident ? Quelle ville ?
  3. Quel était la météo au moment de l'accident ?
  4. Comment s'est passée la collision ?

Autres questions:

  1. Combien y a-t-il eu d'accidents en 2022 en France ?

1.3 Utilisation des filtres⚓︎

  1. Cliquez sur la gauche de la ligne 1 (pour la sélectionner entièrement).
  2. Dans le menu, cliquez sur données puis filtrer.
  3. Filtrez par commune, décochez tous les éléments sauf 93066, puis validez avec le bouton OK. Que voyez vous ?
  4. Dans la cellule M55305, écrivez =SOUS.TOTAL(3;M2:M55303) (cette fonction permet de calculer le nombre de cellules de la colonne M, mais seulement pour les cellules filtrés) et taper sur entrer. Qu'affiche cette cellule ? A quoi cela correspond t-il ?
  5. Supprimez le filtre sur la commune (vous devez à nouveau voir toutes les communes), puis triez la colonne jour de manière ascendante puis la colonne mois de manière ascendante. Les trois premiers films accidents affichés devraient être 202200054829, 202200054846 et 202200052609.
  6. Y a-t-il eu un accident le 31 décembre 2022 dans cette commune ?
  7. On veut connaître, parmi tous ces accidents de 2022, quels sont les trois premiers de l'année ayant eu lieu sous la neige ou la grêle. Décrire sur votre compte-rendu votre démarche pour répondre à cette question : Quels filtres appliqués ? Quels tris ? Répondre à la question.

1.4 Tâche complexe⚓︎

  1. Où y a-t-il eu le plus d'accidents : à Paris ou en Seine-Saint-Denis ?
  2. Quel est le département dans lequel il y a eu le plus d'accidents sous la neige ou la grêle : le Cantal, Paris ou le Rhône ?
  3. Dans quel département y a-t-il eu le plus d'accidents au niveau d'un passage à niveau ?

Un peu de vocabulaire

Dans le monde des données, les titres des colonnes s'appellent des descripteurs.

Exemple: sur la donnée accident peut être décrite via ses descripteurs (département, intersection, condition atmosphérique...) qui prend des valeurs différentes.

Traitement des données

Ce que nous avons fait sur les données (compter, trier, filtrer...), c'est ce qu'on appelle le traitement des données.

2. Pour la prochaine séance⚓︎

La semaine prochaine, nous allons analyser nos données détenues par le groupe Meta (Facebook, Instagram, Whatsapp). Pour cela:

  1. Aller sur le site suivant: https://accountscenter.instagram.com/info_and_permissions/dyi/
  2. Cliquer sur Télécharger ou transférer les informations.
  3. Cliquer sur Toutes les informations disponibles.
  4. Sélectionner Télécharger sur l'appareil puis cliquer sur Suivant.
  5. Ne modifier que la catégorie Qualité du contenu multimédia pour faible puis cliquer sur Créer les fichiers.
  6. C'est terminé, vous recevrez un email vous signalant que vous pouvez télécharger les fichiers. Vous aurez 4 jours après réception du mail pour télécharger les données.

Pour la prochaine fois

IL FAUT VENIR AVEC CE FICHIER DE DONNÉES À LA PROCHAINE SÉANCE.