Ceci est une ancienne révision du document !
Le réseau ARAMIS (http://aramis.resinfo.org) organise sa 8ème journée annuelle le 7 avril 2016 à l'ISC à Bron. Le thème cette année est Les données : maîtrise et enjeux.
Quand nous parlons de données, nous pensons aussitôt aux traitements des données et aux statistiques, mais il y a de nombreux autres aspects à considérer. Depuis quelques années, nous voyons se développer de nombreux outils pour analyser, exploiter, stocker, transmettre et visualiser des données. Le but de cette journée est d'aborder des techniques et des technologies sur lesquelles nos utilisateurs peuvent s'appuyer pour exploiter leurs données. Pourront être présentés des sujets sur le data-mining, la visualisation, l'accessibilité des données à distance, la sécurité du réseau, l'optimisation du stockage, les formats de fichiers, les protocoles d'échange, l'indexation… Ainsi, le participant aura une vue d'ensemble sur les processus, les outils et les enjeux des données qu'il a en charge au sein de son service.
Mots clés : fouilles de données, big data, data science, data-mining, R, Pandas, HDF5, Hadoop, MapReduce, LogStash, ElasticSearch, Lucene, d3.js, NoSQL
<note tip> Un créneau est réservé pour des lightning talks (courte présentations de 5 min, 1-2 transparents). </note>
Programme prévisionnel
Lightning talks (courtes présentations sur les données 5 min, 1-2 transparents) : inscription dès à présent !
Matin | 8h30-9h00 | Accueil | |
---|---|---|---|
9h00-9h15 | Introduction – Présentation ARAMIS | Liliane Gommet, Formation permanente CNRS et Béatrice Montbroussous du comité d'animation | |
9h15-9h45 | État de l'art sur le Big Data | Foudil Bretel, IN2P3 | |
9h45-10h45 | Le stockage : des usages aux outils, mais pour quels enjeux ? | Emmanuel Quemener, CBP/ENS Lyon | |
10h45-11h05 | Pause 20min | ||
11h05-11h35 | Gestion de grandes masses de données cosmiques avec Qserv | Fabrice Jammes, IN2P3 | |
11h35-12h30 | Gestion des événements/logs au Centre de Calcul de l'IN2P3 | Fabien Wernli, IN2P3 | |
Midi | 12h30-14h00 | Pause repas | |
Après-midi | 14h00-14h20 | Lightning Talks | |
14h20-14h50 | Processus de publication des données primaires sur la biodiversité via les outils et le réseau GBIF | Sophie Pamerlon, GBIF | |
14h50-15h20 | Apache Camel | Stéphane Deraco, DSI CNRS | |
15h20-15h50 | Developments HPC in the field on Next Generation Sequencing | Frédéric Jarlier, Philippe Hupé, INSERM | |
15h50-16h10 | Pause 20min | ||
16h10-16h40 | Capture intelligente de réseaux d'auteur | Sonia Guérin-Hamdi, Sofiane Bouzid, ISH | |
16h40-17h10 | Données et pouvoir : une enquête sur les plateformes d'intermédiation | Aurélien Faravelon | |
17h10-17h30 | Discussions sur le réseau ARAMIS |
Webcast
Cette journée sera vidéo-diffusée par la cellule Webcast du CC-IN2P3.