Alors que le méga et le téra sont devenus familiers, les plus grands data center sont aux échelles du zetta ou du yottaoctet. Derrière le terme populaire de Big Data, il y aussi de nombreux enjeux scientifiques. 15 pétabytes, soit quelques 3 millions de DVD, c’est ce que produit l’accélérateur de particules LHC en un an de collecte de données.
Jim Gray, décrit le Big Data comme une nouvelle vision du monde, un nouveau paradigme pour les sciences. Comment ces capacités de traitement et de stockage des données massives ont-elles changé la vie des laboratoires ? Les biologistes ou les physiciens ont de nouveaux acolytes : les data scientists.
Invités
Marc Gelgon, professeur à l’Université de Nantes, animateur de la thématique « science des données » au Lina.
Jérémie Bourdon, maître de conférences à l’Université de Nantes, chercheur au Lina, Laboratoire d’Informatique Nantes Atlantique, dans une équipe de bio-informatique.
Ressources
– The Fourth paradigm, Tony Hey, Stewart Tansley, Kristin Tolle, Microsoft Research, 2007.
Ouvrage collectif de référence disponible en libre accès sur Internet. Bonne illustration de la manière dont les traitements de données sont devenus des outils centraux dans le réflexions scientifique.
– La stratégie Big Data, Thomas Davenport, Pearson, 2014.
Ouvrage complet sur les bouleversements économiques du Big Data et les façons d’en tirer profit.
– Combien valent vos données ? Quel prix peut-on donner aux informations concernant votre vie privée ? Le Financial Times vous propose un simulateur capable d’en donner une estimation. What is your data worth ?
– Un moteur de recherche, méta-moteur qui regroupe les résultats des autres moteurs en les anonymisant.
Duckduckgo.
– Big data, entreprises et sciences sociales – Usages et partages des données numériques de masse, un colloque en podcast du Collège de France.
– tosdr.org : un site qui vous explique les « terms of services », ces contrats que – presque – personne ne lit.
Crédits
Une émission animée par Pierre-Antoine Rault et Guillaume Mézières.