Nos tutelles

CNRS

Rechercher




Accueil > Actions > Actions 2018

ANF « Sciences des données : un nouveau challenge pour les métiers liés aux bases de données » - du 5 au 7 novembre 2018 à Sète

par Chloé MARTIN, QUIDOZ Marie-Claude - publié le , mis à jour le

Dans un contexte de plus en plus responsabilisant pour les administrateurs de données aussi bien d’un point de vue juridique que technique (protection, sécurisation), on constate une attente forte des acteurs de tous bords autour de la data science, et son cortège de mots clés (big data, linked data, data mining, geovizualisation, data driven models, data lake).

Ce contexte place le(s) métier(s) des bases de données face à de nouvelles exigences technologiques, institutionnelles et organisationnelles pour résoudre les questions de qualité et de qualification, de traçabilité, de recherche, de diffusion et d’exploration des données. Ce contexte redessine les frontières de métiers en pleine mutation, dont on peut se demander quelles en sont les limites. Comment ces nouvelles technologies et ces nouveaux métiers interagissent avec les bases de données ? C’est à ces questions que nous nous avons tenté d’apporter des réponses.

Cette formation, ouverte aux personnels CNRS et non CNRS, s’est déroulée à Sète du 5 novembre au 7 novembre 2018, en résidentiel, au Lazaret.

Lundi 5 novembre

Atelier–Débat : Évolution des métiers, témoignages de datascientist
Télécharger le fichier ZIP des présentations des intervenants (ZIP)
- Avec Mathilde Boissel, Nadine Mandran, Sandrine Auzoux, Chloé Martin, Christine Plumejeaud-Perreau, Sandrine Julien, Laurent Pelletier, Christophe Tuffery.
- Animation : Nadine Mandran

Les réseaux métiers et le cycle de vie des données (compte-rendu du Groupe de travail « Données » de la Mission pour les Initiatives Transverses et Interdisciplinaires)
Télécharger la présentation (PDF)
- Intervenantes : Geneviève ROMIER et Marie-Claude QUIDOZ

Mardi 6 novembre

8h30-12h avec pause à 10h
14h-17h30 avec pause à 15h30

1. Atelier traçabilité des données
Présentation de l’atelier traçabilité des données

Création de DOI sur les données et produits grillés du Service National d’observation SSS

Retour d’expérience sur l’attribution de DOI à l’OSU OREME

- e maj : un cas d’utilisation pour tracer les données
Intervenants : Marie-Claude QUIDOZ, Philippe BEAUDOIN

Lien vers la VM :
https://mycore.core-cloud.net/index.php/s/Z10y966y4c5Wt3L

2. Atelier qualité des données
Quelles sont les différentes notions de qualité des données ?
Comment contrôler la qualité des données dans la BDD : avant ou pendant l’insertion de données
Faut-il automatiser le contrôle de la qualité dans les bases ?
Quels sont les outils disponibles et comment les utiliser ?

- Introduction méthodologique et terminologique

- OpenRefine pour traiter son fichier d’entrée
Cours et TPs :

Documentation OpenRefine de Mathieu SABY :
https://osf.io/uf98g/
- le traitement et l’analyse des données (R ou/et Python)

Intervenants : Christine PLUMEJEAUD, Jean-Baptiste PRESSAC, Chloé MARTIN, Nadine MANDRAN

Mercredi 7 novembre

Questions juridiques concernant la nouvelle législation sur les données personnelles (RGPD)
https://intranet.cnrs.fr/protection_donnees/Pages/default.aspx
http://www.cil.cnrs.fr/CIL/spip.php?article3055
- Intervenante : Emilie MASSON (Règlement général sur la protection des données du CNRS)

9h45-10h15 PAUSE

- 10h15-11h15  : Questions juridiques autour de l’ouverture des données
Intervenante : Natalie LE BA (DAJ du CNRS)

- 11h15-11h45 : Les entrepôts de données
Intervenant : Laurent PELLETIER

- 11h45-12h : Clôture des journées
Intervenante : Chloé MARTIN

INSCRIPTIONS CLOSES

FORMULAIRE D’EVALUATION


Conditions d’utilisation des données :
- Vos données personnelles seront accessibles aux membres du comité d’organisation et de programme de l’ANF
- elles seront conservées pendant 3 ans maximum et pourront être utilisées pour information par les membres du comité d’organisation et de programme des prochaines ANF organisées par le réseau
- certaines données personnelles ne sont pas obligatoires (institut et BAP) mais nous permettront d’établir des statistiques des participants à l’ANF pour les rapports d’activité du réseau, pour le rapport final de l’ANF. Les autres données (motivations, ...) nous aideront à sélectionner les candidats et à adapter le contenu de l’ANF aux connaissances et pratiques des stagiaires.
Conformément à la loi « informatique et libertés » et à la RGPD, vous pouvez exercer vos droits d’accès, de modifications, d’opposition et de portabilité en vous adressant à rbdd-cp@services.cnrs.fr

Agenda

Ajouter un événement iCal