• Race to a Cure Authors

Tout sur la science des données

Cliquez ici pour accéder l’article en Anglais/Click here to view this article in English


À l’ère numérique d’aujourd’hui, les données sont données et collectées au cours de nombreuses activités et interactions. Des informations que nous saisissons dans nos appareils personnels aux enquêtes de recensement que nous remplissons pour le gouvernement, il est plus facile que jamais de trouver et d’analyser des données à diverses fins; et ainsi a émergé le domaine de la science des données, un domaine interdisciplinaire au carrefour des mathématiques, de la technologie et des sciences. Lisez la suite pour en savoir plus sur l’histoire, les carrières et l’avenir de ce domaine particulier lié aux STEM!


Photo gracieuseté de Energepic via Pexels.


L’histoire de la science des données


Avant la création du domaine de la science des données, il était connu sous le nom d’étude des statistiques, selon Forbes. Cela inclut des activités telles que la recherche de modèles dans les données, la collecte d’informations utiles, ainsi que le traitement des données. Puis, au début des années 2000, le mot “Data Science” a commencé à être utilisé dans diverses revues et publications, comme méthode “pour élargir les grandes ères du travail technique dans le domaine des statistiques”, selon un article écrit par William S. Cleveland intitulé “Data Science : An Action Plan for Expanding the Technical Areas of the Field of Statistics”. Le terme réel , cependant, a été attribué à DJ Patil et Jeff Hammerbacher, deux scientifiques des données, comme l’explique l’université du Wisconsin. Ce nouveau domaine a créé une intersection indispensable entre l’étude actuelle des statistiques et le domaine en évolution de l’informatique. Et donc, ce nouveau sujet a depuis gagné en popularité en en utilité dans notre monde axé sur le données et la technologie aujourd’hui.


Qu’est-ce que la science des données?


La science des données implique des données et de la technologie, mais qu’est-ce que c’est réellement? La Berkeley School of Information déclare qu’en 2009, une définition est inventée par Hal Varian, économiste en chef chez Google et professeur de sciences de l’information, de commerce et d’économie à l’UC Berkeley. C’est comme suit: la science des données, c’est “la capacité de prendre des données – d’être capable de les comprendre, de les traiter, d’en extraire de la valeur, de les visualiser, de ls communiquer – cela va être une compétence extrêmement importante dans les prochaines décennies.” En conséquence, la science des données permet aux gens de collecter des données et de les appliquer afin de comprendre et résoudre des problèmes qui se trouvent dans le monde réel. Il y a quelques étapes dans le cadre du cycle de vie de la science des données, capturer, maintenir, traiter, analyser et communiquer, chacune ayant ses propres utilités.


Photo gracieuseté de Berkeley School of Information


Les carrières en science des données


Avec le début de la science des données est venu un nouvel ensemble de carrières. Comme il s’agit d’un domaine en plein essor, la recherche d’une opportunité d’emploi dans ce domaine présente de nombreux avantages, tels que le perfectionnement des compétences du 21e siècle et la capacité de résoudre des problèmes complexes, entre autres. Le blog edX suggère qu’il existe deux voies principales pour faire carrière dans la science des données: prolonger directement dans le métier de scientifique des données ou assumer le rôle d’analyste.


Les Data Scientists sont ceux qui collaborent concrètement avec les données brutes et identifient les modèles et les informations pertinentes. Cela implique une bonne vérification de la recherche et de la modélisation, ainsi que l’utilisation de divers logiciels et technologies. Certaines compétences de base des scientifiques des données incluent la visualisation des données, l’apprentissage automatique, la programmation, les statistiques et la compréhension du Big Data.


D’autre part, les analystes de données sont chargés d’appliquer les données collectées pour répondre aux questions et, à leur tour, résoudre les problèmes. Au lieu de prédire les tendances futures, ils utilisent des données actuelles et historiques lors de l’exécution de leur travail. Certaines compétences de base des analystes de données incluent Excel, la visualisation des données, la programmation et la création de rapports.


De plus, au-delà du rôle de data scientist et d’analyste, des rôles plus spécialisés ont également émergé. Selon Discover Data Science, ceux-ci incluent:

  • Les ingénieurs de données, qui sont les constructeurs d'infrastructures de données et aident à la création de systèmes d’information. Ils connaissent bien divers langages de programmation et ont plusieurs années d’expérience dans le domaine du génie logiciel.

  • Les analystes d’affaires, qui connaissent mieux les différents processus et stratégies d'affaires. Leurs compétences incluent l’utilisation d’outils de visualisation de données et de modélisation de données et ont généralement un intérêt pour la gestion de projet et le développement commercial.

  • Spécialiste de l’exploration de données, qui sont chargés d’analyser et d’identifier des modèles spécifiques dans les données afin de prédire les tendances futures et les relations actuelles. Ils utilisent diverses compétences en recherche et en logiciels pour mener à bien leurs tâches.

  • Les ingénieurs en apprentissage automatique, qui travaillent avec des applications de données volumineuses et la programmation de logiciels afin de créer des méthodes permettant aux ordinateurs de collecter des données auprès de personnes réelles grâce aux technologies.

  • Développeurs de bases de données, qui créent et mettent en pratique de nouvelles bases de données. Cela implique des opérations de stockage d'informations et d’exploration de données.


L’avenir de la science des données


Analytics Vidhya montre qu’avec l’avancement de la science des données, elle a eu l’opportunité de s’intégrer dans d'autres domaines, d’utiliser des méthodes et des technologies basées sur les données pour mener à bien leurs propres projets respectifs. Par exemple, dans le domaine de la santé, la science des données complètes sur les patients et leur informations relatives à la santé ce qui a permis aux spécialistes d’identifier les apparitions précoces de maladies spécifiques et de créer des ressources à partager avec des institutions du monde entier, telles que bases de données sur les donneurs d’organes. Un autre exemple est le domaine de la banque et de la finance, où la sécurité financière s’est accrue. Ici, la science des données peut être utilisée pour identifier les activités frauduleuses, ainsi que pour fournir des prévisions sur où investir son argent. Enfin, la crypto-monnaie est une innovation majeure liée à la science des données, car elle a créé un besoin de gérer les données via des moyens en ligne de manière sécurisée et complète.


Dans l’ensemble, il est évident qu’il y a beaucoup à venir pour la science des données. De la collecte de données centrées sur l’humain aux interfaces d’apprentissage automatique, il existe de nombreuses façons pour vous d’utiliser votre propre expertise actuelle ou d’acquérir une nouvelle compétence dans ce domaine!


Explorer la science des données


La science des données vous semble-t-elle un domaine intéressant? Que savoir de plus sur ce domaine en plein essor? Il existe divers cours en ligne qui enseignent les compétences de base en matière de collecte de données et de programmation liées à ce domaine. Voici quelque suggestions (en aucun cas approuvé par R2AC):


https://www.coursera.org/browse/data-science

https://www.edx.org/learn/data-analysis

https://www.themuse.com/advice/learn-data-science-beginner-online-classes



L'auteur d'article: Asima Hudani

Traduction: Sarah Westerik