Titre : |
Apache Spark |
Type de document : |
texte imprimé |
Auteurs : |
Nastasia Saby, Auteur |
Année de publication : |
C 2022 |
Importance : |
1 vol. (308 p.) |
Présentation : |
ill. |
Format : |
21 cm |
ISBN/ISSN/EAN : |
978-2-409-03378-0 |
Prix : |
39 EUR |
Note générale : |
Index |
Langues : |
Français (fre) |
Mots-clés : |
Apache Spark (langage de programmation) Apprentissage automatique Python (langage de programmation) |
Index. décimale : |
005.1 |
Résumé : |
Ce livre sur le framework Apache Spark vous permet d'apprendre ?a d?evelopper des applications en Python en vous appuyant sur l'analyse et le traitement de donn?ees volumineuses ainsi que sur la notion d'apprentissage automatique.Apr?es quelques d?efinitions de termes li?es au domaine de la data, vous d?ecouvrez les fondements de Spark. Vous appr?ehendez l'architecture logicielle du framework, ses composants et les diff?erents langages avec lesquels il est possible de d?evelopper. Vous entrez ensuite concr?etement dans la transformation de donn?ees. Fonctions num?eriques, alphanum?eriques, ajouts d'information, suppressions, agr?egations de premier ordre et plus complexes sont ?a l'honneur. Des fonctionnalit?es plus avanc?ees telles que les fonctions de fen?etrage et celles d?efinies par les utilisateurs sont ?etudi?ees et les nombreuses API de Spark parcourues, tout en ?etant illustr?ees par des exemples. Dans la suite du livre, l'auteur d?evoile l'apprentissage machine. Apprentissage supervis?e, non supervis?e, profond et moteurs de recommandation sont autant de concepts d?etaill?es. Vous d?ecouvrez les diff?erents algorithmes pr?esents dans Spark, les mani?eres de pr?eparer des donn?ees ?a l'entra?inement ainsi que les possibilit?es d'?evaluation d'un syst?eme pr?edictif au travers de plusieurs mises en pratique. Les notions d'arbres de d?ecision, de for?ets al?eatoires, de r?eseaux de neurones, de r?egressions lin?eaires et de factorisation de matrices vous sont expliqu?ees ainsi que le traitement des informations num?eriques et la vectorisation de textes. Pour finir, un chapitre met en avant l'industrialisation de Spark. D?eployer, d?eboguer et tester son application ainsi que les subtilit?es de l'outil pour assurer une performance optimale sont autant d'?el?ements cruciaux d?etaill?es. Si les exemples de code du livre sont en Python, langage aujourd'hui le plus utilis?e avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision compl?ete du framework. |
Apache Spark [texte imprimé] / Nastasia Saby, Auteur . - C 2022 . - 1 vol. (308 p.) : ill. ; 21 cm. ISBN : 978-2-409-03378-0 : 39 EUR Index Langues : Français ( fre)
Mots-clés : |
Apache Spark (langage de programmation) Apprentissage automatique Python (langage de programmation) |
Index. décimale : |
005.1 |
Résumé : |
Ce livre sur le framework Apache Spark vous permet d'apprendre ?a d?evelopper des applications en Python en vous appuyant sur l'analyse et le traitement de donn?ees volumineuses ainsi que sur la notion d'apprentissage automatique.Apr?es quelques d?efinitions de termes li?es au domaine de la data, vous d?ecouvrez les fondements de Spark. Vous appr?ehendez l'architecture logicielle du framework, ses composants et les diff?erents langages avec lesquels il est possible de d?evelopper. Vous entrez ensuite concr?etement dans la transformation de donn?ees. Fonctions num?eriques, alphanum?eriques, ajouts d'information, suppressions, agr?egations de premier ordre et plus complexes sont ?a l'honneur. Des fonctionnalit?es plus avanc?ees telles que les fonctions de fen?etrage et celles d?efinies par les utilisateurs sont ?etudi?ees et les nombreuses API de Spark parcourues, tout en ?etant illustr?ees par des exemples. Dans la suite du livre, l'auteur d?evoile l'apprentissage machine. Apprentissage supervis?e, non supervis?e, profond et moteurs de recommandation sont autant de concepts d?etaill?es. Vous d?ecouvrez les diff?erents algorithmes pr?esents dans Spark, les mani?eres de pr?eparer des donn?ees ?a l'entra?inement ainsi que les possibilit?es d'?evaluation d'un syst?eme pr?edictif au travers de plusieurs mises en pratique. Les notions d'arbres de d?ecision, de for?ets al?eatoires, de r?eseaux de neurones, de r?egressions lin?eaires et de factorisation de matrices vous sont expliqu?ees ainsi que le traitement des informations num?eriques et la vectorisation de textes. Pour finir, un chapitre met en avant l'industrialisation de Spark. D?eployer, d?eboguer et tester son application ainsi que les subtilit?es de l'outil pour assurer une performance optimale sont autant d'?el?ements cruciaux d?etaill?es. Si les exemples de code du livre sont en Python, langage aujourd'hui le plus utilis?e avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision compl?ete du framework. |
|