Des plus en plus de sociétés souhaitent intégrer de la data-science dans leurs projets. Difficile de ne pas se sentir perdu au milieu des nombreuses bibliothèques proposées, et il est encore plus difficile de sélectionner la librairie qui correspond le mieux à nos besoins métiers.
Ce talk vous présentera, benchmark à l’appuie, différentes bibliothèques scala et python proposant des fonctionnalités de prétraitement, de calcul scientifique ou encore de machine learning, afin de vous guider dans votre sélection d’outils pour la data-science.
Nous allons comparer les bibliothèques Saddle, Smile, Breeze et Spark Mllib qui profitent de l’aspect fonctionnel de scala et de ses prédispositions à la scalabilité, avec les bibliothèques Pandas, Scipy, StatsModels et Scikit-Learn, qui permettent un développement rapide et flexible en python, pour être plus confiant dans le choix de l'outil le plus adapté à votre projet.
#FuZzy humanist, Data Science Witch, Lambda Whisperer | Learning (machine, human or whatever) | former couturier | permaculture newbie | for a better world