TP - Données structurées - Tableur⚓︎
CE TP NÉCESSITE UN COMPTE RENDU.
1. Analyse de données publiques⚓︎
1.1 Téléchargement et Ouverture du fichier⚓︎
- Lancez un navigateur web et rendez vous sur la plateforme ouverte des données publiques françaises.
- Recherchez
accidentà l'aide du champs de recherche. Et choisir les donnéeesBases de données annuelles des accidents corporels de la circulation routière - Années de 2005 à 2022. - Téléchargez le fichier
carcteristiques-2022.csv. C'est un fichier recensant les accidents de la route en 2022 au formatcsv.
Fichiers CSV
Les fichiers csv sont des formats de partage de données extrêmement courant, les données sont représentées en ligne et les colonnes sont séparées par des virgules ou des point-virgules.
Cette structure permet l'analyse ou le traitement des données. On parle de données structurées.
- Ouvrir le logiciel LibreOffice Calc ou Microsoft Excel, et ouvrez le fichier que vous venez de télécharger avec ce logiciel. Il vous demandera le séparateur du fichier, il faut ici sélectionner le
point virgule. - Pour comprendre le sens des colonnes, l'aide est disponible à la page 4 du document suivant
1.2 Analyse sommaire du fichier⚓︎
Questions sur l'accident 202200000045.
- Quand a eu lieu l'accident ?
- Où a eu lieu cet accident ? Quelle ville ?
- Quel était la météo au moment de l'accident ?
- Comment s'est passée la collision ?
Autres questions:
- Combien y a-t-il eu d'accidents en 2022 en France ?
1.3 Utilisation des filtres⚓︎
- Cliquez sur la gauche de la ligne 1 (pour la sélectionner entièrement).
- Dans le menu, cliquez sur
donnéespuisfiltrer. - Filtrez par commune, décochez tous les éléments sauf 93066, puis validez avec le bouton OK. Que voyez vous ?
- Dans la cellule
M55305, écrivez=SOUS.TOTAL(3;M2:M55303)(cette fonction permet de calculer le nombre de cellules de la colonne M, mais seulement pour les cellules filtrés) et taper sur entrer. Qu'affiche cette cellule ? A quoi cela correspond t-il ? - Supprimez le filtre sur la commune (vous devez à nouveau voir toutes les communes), puis triez la colonne jour de manière ascendante puis la colonne mois de manière ascendante. Les trois premiers films accidents affichés devraient être
202200054829,202200054846et202200052609. - Y a-t-il eu un accident le 31 décembre 2022 dans cette commune ?
- On veut connaître, parmi tous ces accidents de 2022, quels sont les trois premiers de l'année ayant eu lieu sous la neige ou la grêle. Décrire sur votre compte-rendu votre démarche pour répondre à cette question : Quels filtres appliqués ? Quels tris ? Répondre à la question.
1.4 Tâche complexe⚓︎
- Où y a-t-il eu le plus d'accidents : à Paris ou en Seine-Saint-Denis ?
- Quel est le département dans lequel il y a eu le plus d'accidents sous la neige ou la grêle : le Cantal, Paris ou le Rhône ?
- Dans quel département y a-t-il eu le plus d'accidents au niveau d'un passage à niveau ?
Un peu de vocabulaire
Dans le monde des données, les titres des colonnes s'appellent des descripteurs.
Exemple: sur la donnée accident peut être décrite via ses descripteurs (département, intersection, condition atmosphérique...) qui prend des valeurs différentes.
Traitement des données
Ce que nous avons fait sur les données (compter, trier, filtrer...), c'est ce qu'on appelle le traitement des données.
2. Pour la prochaine séance⚓︎
La semaine prochaine, nous allons analyser nos données détenues par le groupe Meta (Facebook, Instagram, Whatsapp). Pour cela:
- Aller sur le site suivant: https://accountscenter.instagram.com/info_and_permissions/dyi/
- Cliquer sur
Télécharger ou transférer les informations. - Cliquer sur
Toutes les informations disponibles. - Sélectionner
Télécharger sur l'appareilpuis cliquer surSuivant. - Ne modifier que la catégorie
Qualité du contenu multimédiapourfaiblepuis cliquer surCréer les fichiers. - C'est terminé, vous recevrez un email vous signalant que vous pouvez télécharger les fichiers. Vous aurez 4 jours après réception du mail pour télécharger les données.
Pour la prochaine fois
IL FAUT VENIR AVEC CE FICHIER DE DONNÉES À LA PROCHAINE SÉANCE.