- Compact style
- Indico style
- Indico style - inline minutes
- Indico style - numbered
- Indico style - numbered + minutes
- Indico Weeks View
Help us make Indico better by taking this survey! Aidez-nous à améliorer Indico en répondant à ce sondage !
PREDONx 2016 : Atelier sur la Préservation des Données Scientifiques
Thématique: "Cycle de vie des données"
Vendredi 2 décembre 2016,
LIPADE Université Paris Descartes, Paris
L'atelier PREDONx 2016 a comme thématique principale le cycle de vie des données et est organisé par le projet PREDON, développé au sein du programme de grandes masses de données MASTODONS de la Mission Interdisciplinarité du CNRS, et action au sein du GdR MADICS.
Les sessions sont organisées suivant plusieurs présentations invitées avec des plages de discussion. Les propositions de présentation sont à soumettre aux organisateurs avant le 14 Novembre 2016 (titre, description, courte présentation de l'orateur).
Un document réunissant les principales conclusions de cet atelier sera produit et diffusé.
Inscriptions:
L'intendance sur place est assurée pour les inscrits; nombre de participants limité à 40, les repas seront confirmés ; support pour le voyage en France selon les disponibilités (contacter les organisateurs).
=====
PREDON est aussi une action au sein du GDR MADICS http://www.madics.fr/
Scientists spend a significant part of their time to design, collect and analyze data. While the lifetime of a project is often identified with the lifetime of its data, a clear and strong case have been presented in a majority of disciplines to preserve and re-use the scientific data, well after the initial project ends. In this session, concrete examples of scientific projects where data preservation is relevant will be discussed, in order to emphasize the need for a coherent long term perspective of scientific data preservation.
Luca Comparini, Blockchain Leader chez IBM France, dirige une équipe d’experts IBM afin de faciliter l’adoption et la diffusion de la Blockchain sur le marché. Fort de 10 ans d’expérience en infrastructure IT, logiciels Linux et Open Source, il nous fait part de son expertise sur la blockchain, cette technologie complexe qui nécessite quelques explications.
Methods, practices and projects for data preservation: community projects, work on data preservation standards, exchanges with libraries and information sciences, policies, legal aspects of data preservation.
Hardware providers, computing centers, industry actors etc. are providing various pieces and parts to preserve digital data long term; are these adapted for scientific data preservation? Do we understand the requirements and the limits of the present technology?
Le Centre de Calcul de l'IN2P3 fournit des ressources informatiques à plusieurs milliers d'utilisateurs réparties dans des thématiques scientifiques variées. En 2016, plus de 50 petaoctets de données sont accédés en ligne depuis le monde entier. Grace à la mise en place d'un plan de gestion et d'un inventaire précis des données, le centre de calcul sera en mesure d'accompagner chaque équipe de recherche sur la vie des données durant un projet. Le plan de gestion détaillera le devenir des données à la fin d'un projet ou au départ d'une personne.
L'équipe d'Archipolis (http://archipolis.hypotheses.org/), plus de détails sur : http://www.bequali.fr/fr/nos-pratiques/. Le Centre de données socio-politiques (CDSP) est spécialisé dans la documentation et la mise à disposition des données en sciences humaines et sociales. S’il a d’abord traité des données et enquêtes quantitatives (bases de données électorales, fichiers d’enquêtes par questionnaires déposés au CDSP par des institutions et des chercheurs etc.), son périmètre s’est élargi en 2012. Avec la mise en place de l’équipement d’excellence DIME-SHS il œuvre dorénavant à la mise à disposition des données issues de méthodes qualitatives (entretiens, observations ethnographiques, etc.) et à la production d’enquêtes quantitatives. Le CDSP s’attèle aujourd’hui à archiver de manière pérenne au CINES les jeux de données mis à disposition dans le cadre de DIME-SHS. Cette étape supplémentaire dans la gestion du cycle de vie des données garantit la conservation des enquêtes à long terme, tout en préservant leur intelligibilité et accessibilité. L’originalité de ce projet d’archivage réside dans la nature des objets archivés : des enquêtes en sciences humaines et sociales et non pas seulement des bases de données ou des corpus regroupés sur les critères de formes ou de supports (comme des banques d’images par exemple). Ici chaque paquet d'archivage, organisé selon un plan de classement, contient, dans le cas des données qualitatives, les documents de l’enquête - ce que les chercheurs ont produit lors de leur travail sur le terrain mais aussi en amont lors de la préparation de l’enquête et en aval lors du travail d’analyse des données - ainsi que l’ensemble de la documentation réalisée par le CDSP en vue d’une réutilisation scientifique ou pédagogique de ces corpus. Dans le cas des enquêtes quantitatives, le cycle de vie des données est pris en charge par l’équipe du CDSP en lien avec les chercheurs, dès l’étape de leur conception et production en passant par leur documentation et finalement leur mise à disposition et archivage. La constitution des paquets d’archivage peut débuter dès l’étape de réalisation des enquêtes et être finalisée une fois l’enquête documentée et diffusée. Cet archivage de corpus complexes suit donc une logique utilisateur, tout comme le travail de mise à disposition en vue de la réutilisation des données d’une enquête.
Décrire ces processus pour les enquêtes qualitatives et quantitatives de DIME-SHS fera l’objet de notre présentation.
L’imagerie biomédicale fait une place croissante aux approches multimodales provenant d’images acquises avec plusieurs instruments (IRM, TEP, échographie, …), et aux données multi-sources croisant les images médicales avec des données démographiques, psychologiques, pharmacologiques, métaboliques, génétiques etc. Ces quantités de données sont hétérogènes, multi-formats et leur provenance est complexe. Le PLM biomédical permet de gérer les données d’une étude tout au long de son cycle de vie dans un environnement intégré, afin de faciliter leur partage entre les acteurs d’une étude, leur reproductibilité par des personnes extérieures à l’étude et leur réutilisation dans d’autres contextes, différés dans le temps (études longitudinales, méta-analyses, constitution de cohortes de grandes taille).
THOR is a 30 month project funded by the European Commission under the Horizon 2020 programme. It will establish seamless integration between articles, data, and researchers across the research lifecycle. This will create a wealth of open resources and foster a sustainable international e-infrastructure. The result will be reduced duplication, economies of scale, richer research services, and opportunities for innovation.
La plate-forme ActivePapers a été développée pour faciliter le partage, l'archivage, et la publication de calculs. Elle ne gère pas seulement les résultats et leur provenance mais aussi les logiciels qui ont été utilisés pour les obtenir. J'illustrerai son fonctionnement et ses caractéristiques à l'exemple de quelques projets de recherche en simulation biomoléculaire des dernières années.
Registered participants (who have confirmed their attendance at the dinner) are invited to join the social dinner (location to be determined).