.
Hadoop adalah satu kerangkakerja berdasarkan Bahasa Pengaturcaraan Java yang menyokong pemprosesan set data yang besar di dalam persekitaran perkomputeran teragih (distributed computing). Ia merupakan sebahagian dari project Apache yang dibiayai oleh Yayasan Perisian Apache (Apache Software Foundation).
Hadoop telah membolehkan aplikasi dijalankan di dalam satu sistem yang terdiri daripada ribuan unit (node) melibatkan data yang bersaiz terabyte. Ciri-ciri Sistem Fail Teragih (Distributed File System) yang dimilikinya membenarkan sistem berjalan tanpa terganggu walaupun berlaku kegagalan pada unit (node). Pendekatan ini mengurangkan risiko kegagalan sistem yang teruk meskipun jumlah unit (node) yang gagal itu ketara.
Hadoop diilhamkan dari MapReduce oleh Google, iaitu satu kerangkakerja perisian yang membolehkan aplikasi dipecahkan kepada bahagian-bahagian kecil. Setiap bahagian ini (yang dipanggil fragment atau block) boleh dijalankan di dalam node atau cluster. Pencipta Hadoop, Doug Cutting, telah menamakan sistem ini bersempena nama permainan lembut anaknya iaitu seekor gajah yang bernama Hadoop.
Ekosistem Apache Haddop sekarang mengandungi Hadoop kernel, MapReduce, Hadoop distributed file system (HDFS) dan beberapa projek lain yang berkaitan seperti Apache Hive, HBase dan Zookeeper.
Kerangkakerja Hadoop digunakan oleh pemain gergasi seperti Google, Yahoo dan IBM, terutamanya dalam aplikasi yang melibatkan enjin carian dan periklanan. Pelantar sistem yang dipilih adalah Windows dan Linux. Walaubagaimanapun Hadoop juga dapat dijalankan di atas BSD dan OSX.
Diterjemah dari: http://searchcloudcomputing.techtarget.com/definition/Hadoop
No comments:
Post a Comment