Tugas Minggu Ke-1 Big Data
Nama : Intan Tamara Febrinzky
NIM : 1401164228
Kelas : MB-40-05
A. Latar Belakang
Dengan semakin berjalannya waktu, perkembangan teknologi semakin berkembang juga. Dari yang dulunya selalu memakai cara-cara tradisional dalam kehidupan sehari-hari, sekarang perlahan-lahan tapi pasti telah mulai digantikan dengan teknologi informasi. Contohnya saja ketikas berbelanja kebutuhan sehari-hari dulu, kita harus mendatangi pasar atau swalayan sekarang dengan adanya teknologi kita hanya cukup membuka aplikasi atau website, memilih barang yang diinginkan dan tinggal duduk manis untuk menunggu pesanan.
Untuk mendapatkan peluang menjaring konsumen, banyak perusahaan yang memanfaatkan big data dalam proses bisnisnya. Big data sendiri sudah tidak asing seiring dengan berkembanganya teknologi informasi. Big data sendiri adalah kumpulan data dalam skala besar, yang mempunyai karakteristik data yang variatif, sangat cepat pertumbuhannya dan kompleks datanya. Data yang kompleks merupakan data yang tidak terstruktur yang perlu diolah khusus dengan suatu infrastruktur yang dapat mengelola data dalam volume besar.
Pembuatan jurnal yang saya dapatkan dibuat untuk mengatasi masalah data yang terus bertambah besar sehingga penulis membuat sebuah system yang dapat memproses big data tersebut. Metode yang digunakan yaitu MapReduce. MapReduce adalah model pemrograman untuk menulis aplikasi yang dapat mengolah data besar. MapReduce memberikan kemampuan analitis untuk menganalisis volume besar data yang kompleks. MapReduce sendiri mempunyai banyak platform, salah satunya Apache Spark. Apache Spark adalah teknologi komputasi klaster kilat cepat, dirancang untuk perhitungan cepat. Fitur utama dari Apache Spark adalah di memori klaster komputasi yang meningkatkan kecepatan pemrosesan aplikasi.
B. Tujuan
Tujuan pembuatan jurnal ini adalah:
a. Memimplementasikan Apache Spark sebagai pengganti alternatif Hadoop MapReduce untuk memproses suatu big data.
b. Menganalisa dan membandingkan Apache Spark dan Hadoop MapReduce dari segi efiensi waktu.
c. Menganalisa penggunaan sistem memory, processor, dan disk dalam menjalankan Apache Spark dan Hadoop MapReduce.
C. Permasalahan
Permasalahan yang muncul dari penulisan jurnal ini, ditulisakan oleh penulis seperti lamanya proses dalam memproses data pada suatu big data, dikarenakan besarnya data itu sendiri. Kemudian keanekaragaman jenis data dalam suatu big data yang sangat bervariasi misalnya data medis social, data transaksi keuangan, dan lain sebagainya.
D. Solusi
Digunakannnya Apache Spark untuk memproses big data untuk menurunkan response time dari 50% sampai 70% dari Hadoop Mapreduce.
Sumber :
Oliviandi, Sevian, Andrew B.O., Roswan Latuconsina. 2018. Pada Big Data Berbasis Hadoop Distibuted File System. E-Proceeding of Engineering . Vol.5: hal.1005 (http://libraryeproceeding.telkomuniversity.ac.id/index.php/engineering/article/view/6123)
LEAVE A COMMENT