Machine Learning

Clusteriser un DataSet selon 3 variables avec TensorFlow et Python

Principe En Data science ou Data engineering, il est courant de devoir partitionner un groupe de populations selon plusieurs variables. Par exemple, on souhaite identifier un groupe de populations jeune dont le poids et la taille sont élevés. Dans cet article, nous vous proposons d’utiliser TensorFlow et Python pour traiter cette problématique. Très généralement, pour ce cas[…]

Spark comme hub d’échange de données

Introduction à Spark Spark est un framework de calcul distribué très en vogue actuellement. Il dispose de nombreux avantages parmi lesquels: La simplicité de ses structures de données (RDD, DataFrame, DataSets) Sa puissance du fait que ces structures de données soient chargées, distribuées et sécurisées en mémoire. Sa facilité d’intégration aux plateformes de cluster tels[…]