Auto-generate Flow Chart from Java/C++ Codes:

Raptor Flowchart Tutorial For Beginners

Thursday, July 21, 2016

Apa itu Apache Spark?

Apakah Apache Spark?
.
Spark adalah projek Apache yang diiklankan sebagai "lightning fast cluster computing" (perkomputeran teragih sepantas kilat)
.
Apache Spark adalah Rangka Kerja Perkomputeran Kluster Sumber Terbuka. Asalnya dibangunkan oleh Berkeley's AMPLab, Universiti California, kod pangkalnya kemudiannya didermakan kepada Yayasan Perisian Apache yang semenjak itu menyelenggaranya sehingga sekarang. Spark menyediakan antaramuka untuk pengaturcaraan seluruh kluster dengan bercirikan Data Parallelism (Apakah Data Parallelism?) dan Fault Tolerance (Apakah Fault Tolerance?)

Apache Spark menyediakan pengaturcara antaramuka pengaturcaraan yang berpusat pada struktur data yang di panggil Resilient Dataset, RDD, iaitu sejenis data pelbagai set yang diagihkan pada kluster-kluster mesin, yang diselenggara secara Fault-Tolerant. Apache Spark dibangunkan sebagai jawapan kepada kekangan Paradigma Pengaturcaraan Kluster MapReduce, yang memaksa penggunaan struktur aliran data linear di dalam perisian teragih; perisian MapReduce membaca input dari cakera storan, memetakan fungsi bagi data, mengurangkan hasil pemetaan dan menyimpan hasil pengurangan pemetaan ke dalam cakera storan. RDD Spark berfungsi sebagai set kerja bagi perisian teragih yang menawarkan perkongsian memori teragih terhad.
.
Rujukan:
https://en.wikipedia.org/wiki/Apache_Spark
https://www.toptal.com/spark/introduction-to-apache-spark

No comments: