Spark folosind Python

Acest program de formare este conceput pentru a vă oferi cunoștințele și aptitudinile necesare pentru a deveni un dezvoltator de succes Spark folosind Python și vă pregătesc pentru examenul de certificare Clouda Hadoop și Spark Developer Certification (CCA175). De-a lungul trainingului PySpark, veți obține o cunoaștere aprofundată a Apache Spark și a Ecosistemului Spark
Cerințe preliminare
- Abilități generale de programare în orice limbă (preferabil Python)
Rezultatele instruirii
La sfârșitul acestui curs veți / putea să:
- Utilizați Python și Spark împreună pentru a analiza datele mari
- Afla cum să utilizați noua sintaxă DataFrame Spark 2.0
- Lucrați pe consultanță Proiecte care imită situațiile din lumea reală!
- Clasificați comportamentul clienților cu regresie logistică
- Utilizați Spark cu păduri aleatoare pentru clasificare
- Afla cum să utilizați copaci Boosted Spark’s Gradient
- Utilizați MLlib pentru a crea modele puternice de învățare în mașină
- Afla mai multe despre platforma DataBricks!
- Fi pregătiți pe Amazon Web Services EC2 pentru o analiză a datelor
- Afla cum să utilizați serviciul AWS Elastic MapReduce!
- Afla cum să utilizați puterea Linux-ului cu un mediu Spark!
- Creați un filtru de spam utilizând Spark și procesarea limbajului natural!
- Utilizați Streaming Spark pentru a analiza Tweets în timp real!
Caracteristicile cursului
- Prelegeri 0
- Chestionare 0
- Studenți 0
- Evaluări Da