Utiliser Scala et Spark pour l'analyse des données, l'apprentissage machine et l'analyse.

Description
Enseigné par une équipe de 4 personnes dont 2 Stanford, ex-Googler et 2 ex-Flipkart Lead Analysts, cette équipe a des décennies d'expérience pratique dans le travail avec Java et avec des milliards de lignes de données.

Faites voler vos données à l'aide de Spark et Scala pour l'analyse, l'apprentissage machine et la science des données.

Laissezâs analyser cela.

Si vous êtes un analyste ou un scientifique des données, vous avez l'habitude d'avoir plusieurs systèmes pour travailler avec des données SQL, Python, R, Java, etc. avec Spark, vous avez un seul moteur où vous pouvez explorer et jouer avec de grandes quantités de données, exécuter des algorithmes d'apprentissage machine et ensuite utiliser le même système pour produire votre code.

Scala : Scala est un langage de programmation à usage général - comme Java ou C+++, sa nature fonctionnelle et la disponibilité d'un environnement REPL le rendent particulièrement adapté à un cadre de calcul distribué comme Spark.
Analytics : En utilisant Spark et Scala, vous pouvez analyser et explorer vos données dans un environnement interactif avec un retour d'information rapide, ce cours vous montrera comment tirer parti de la puissance des RDD et des Dataframes pour manipuler les données avec facilité.
Apprentissage machine et science des données : Les fonctionnalités de base de Spark et les bibliothèques intégrées facilitent l'implémentation d'algorithmes complexes comme les Recommandations avec très peu de lignes de code et nous couvrirons une variété d'ensembles de données et d'algorithmes, y compris les ensembles de données PageRank, MapReduce et Graph Graph.  Nous couvrirons une variété d'ensembles de données et d'algorithmes, y compris les ensembles de données PageRank, MapReduce et Graph.

Ce qui est couvert :

Scala Programming Constructs : Classes, Traits, First Classes, First Class Functions, Closures, Currying, Case Classes.

Beaucoup de trucs cool....

Recommandations musicales utilisant les moindres carrés alternés et l'ensemble de données Audioscrobbler.
Dataframes et Spark SQL pour travailler avec les données Twitter.
Utilisation de l'algorithme PageRank avec l'ensemble de données du graphique Web de Google.
Utilisation de la technologie Spark Streaming pour le traitement des flux ?
Travailler avec des données graphiques en utilisant l'ensemble de données du réseau social Marvel.
... et bien sûr toutes les fonctions de base et avancées de Spark : ... :

Résilient Distributed Datasets, Transformations (map, filter, flatMap), Actions (réduire, agréger) , Actions (réduire, agréger) ................................................................................................................................................................
Couplez les RDD, réduisezByKey, combinezByKey .
Variables de diffusion et d'accumulation.
Étincelle pour MapReduce : le Spark pour MapReduce
L'API Java pour Spark : l'API Java pour Spark
Spark SQL, Spark Streaming, MLlib et GraphX.

CLIQUEZ ICI pour accéder à ce cours