60 Top Open Source Tools Untuk Big Data - Part 1 (8 Tool untuk Platform Big Data Analytic)

Setiap kali analis atau wartawan membuat daftar tren untuk tahun 2016 ini, "big data" hampir pasti selalu berada di dalam daftar
60 Top Open Source Tools Untuk Big Data: Tool Untuk Platform Big Data AnalyticBig Data DBA.  Setiap kali analis atau wartawan membuat daftar tren untuk tahun 2016 ini, "big data" hampir pasti selalu berada di dalam daftar. Sementara slogannya yang cukup baru, di satu sisi, big data adalah tidak benar-benar konsep yang baru. Komputer selalu bekerja dengan sekumpulan besar data dan terus berkembang, dan disimpan dalam database serta data warehouse selama bertahun tahun.

Apa yang baru adalah berapa banyak data yang lebih besar, seberapa cepat tumbuh dan bagaimana rumit data itu. Usaha memahami bahwa data dalam sistem mereka merupakan tambang emas wawasan yang dapat membantu mereka meningkatkan proses dan kinerja mereka. Tapi mereka membutuhkan alat yang akan memungkinkan mereka untuk mengumpulkan dan menganalisis data tersebut sehingga dinamakan tool big data analytic.

60 Top Open Source Tools Untuk Big Data

Tidak mengherankan, data pasar yang besar berkembang sangat cepat dalam menanggapi permintaan dari perusahaan. Menurut IDC, pasar untuk produk dan layanan big data adalah senilai $ 3,2 milyar 2010, dan mereka pada saat itu memprediksi pasar akan tumbuh hingga menpai $ 16,900,000,000 pada tahun 2015. Peningkatan tersebut berada pada tingkat pertumbuhan tahunan sebesar 39,4 persen, yang merupakan tujuh kali lebih tinggi dari tingkat pertumbuhan IDC untuk pasar TI secara keseluruhan.

Menariknya, banyak dari yang terbaik dan paling terkenal dari tool untuk big data yang tersedia adalah proyek open source. Yang paling terkenal saat ini adalah Hadoop, yang pengembangan seluruh industri jasa dan produk terkait dengan produk hadoop ini. Kali ini, profil kita Hadoop, serta 59 proyek Big data lainnya. Di sini Anda akan menemukan banyak proyek Apache yang berkaitan dengan Hadoop, serta open source database NoSQL, tool business intelligence, tool development dan masih banyak lagi.

Menariknya, banyak dari yang terbaik dan paling terkenal dari tool untuk big data yang tersedia adalah proyek open source. Yang paling terkenal saat ini adalah Hadoop, yang pengembangan seluruh industri jasa dan produk terkait dengan produk hadoop ini.

Di bagian pertama ini, kita akan membahas 8 Tool untuk Platform Big Data Analytic sebagai bagian dari 60 top open source tool untuk big data.

Tool untuk Platform Big Data Analytic


1 Hadoop

Tool untuk Platform Big Data Analytic


Anda tidak dapat berbicara tentang data yang besar tanpa menyebutkan Hadoop. Perangkat lunak pengolahan data Apache terdistribusi begitu meresap yang sering disebut dengan istilah "Hadoop" dan "big data" digunakan secara sinonim. Apache Foundation juga mensponsori sejumlah proyek terkait yang memperluas kemampuan Hadoop, dan banyak dari mereka yang disebutkan di bawah ini. Selain itu, banyak vendor menawarkan versi Hadoop dan teknologi terkait yang didukung. Sistem operasi: Windows, Linux, OS X.

2 MapReduce


Awalnya dikembangkan oleh Google, website MapReduce menggambarkannya sebagai "model pemrograman dan kerangka kerja perangkat lunak untuk menulis aplikasi yang cepat dalam memproses data dalam jumlah besar secara paralel pada kelompok besar dari node komputasi." Ini digunakan oleh Hadoop, serta banyak aplikasi pengolahan data lainnya. Sistem operasi: OS Independen.

3 GridGain

Tool untuk Platform Big Data Analytic

GridGrain menawarkan alternatif untuk MapReduce Hadoop yang kompatibel dengan File System Hadoop Distributed. Menawarkan pengolahan di memori untuk analisis cepat dengan menggunakan data real-time. Anda dapat men-download versi open source dari GitHub atau membeli versi komersial didukung dari link di atas. Sistem operasi: Windows, Linux, OS X.

4 HPCC

Tool untuk Platform Big Data Analytic

Dikembangkan oleh LexisNexis Solusi Risiko, HPCC adalah singkatan dari " high performance computing cluster (kinerja tinggi cluster komputasi)." Ini klaim untuk menawarkan kinerja yang unggul untuk Hadoop. Kedua versi komunitas gratis dan versi enterprise yang merupakan versi berbayar tersedia. Sistem operasi: Linux.

5 Disco

Tool untuk Platform Big Data Analytic

Awalnya dikembangkan oleh Nokia, Disco adalah kerangka komputasi terdistribusi yang, seperti Hadoop, didasarkan pada MapReduce. Ini termasuk filesystem yang terdistribusi dan database yang mendukung miliaran kunci dan nilai-nilai. Sistem operasi: Linux, OS X.

6 Lumify

Tool untuk Platform Big Data Analytic

Dimiliki oleh Altamira, yang dikenal untuk teknologi keamanan nasional, Lumify merupakan open source integrasi big data, analisis dan platform visualisasi. Anda bisa melihatnya dalam tindakan dengan mencoba demo di Try.Lumify.io. Sistem operasi: Linux.

7 Pandas

Tool untuk Platform Big Data Analytic

Proyek Pandas meliputi struktur data dan tool analisis data berdasarkan bahasa pemrograman Python. Hal ini memungkinkan organisasi untuk menggunakan Python sebagai alternatif untuk R untuk proyek-proyek analisis data yang besar. Sistem operasi: Windows, Linux, OS X.

8 Storm

Tool untuk Platform Big Data Analytic

Sekarang proyek Apache, Storm menawarkan pemrosesan real-time big data (tidak seperti Hadoop, yang hanya menyediakan batch processing). Pengguna Storm termasuk Twitter, The Weather Channel, WebMD, Alibaba, Yelp, Yahoo! Jepang, Spotify, Group, Flipboard dan banyak perusahaan lainnya. Ini sangat scalable, kuat, toleran terhadap kesalahan dan bekerja dengan hampir semua bahasa pemrograman. Sistem operasi: Linux.

Demikian untuk 8 Tool untuk Platform Big Data Analytic, mungkin anda tertarik untuk mempelajari salah satunya. Untuk tool lainnya yang berguna dalam penanganan proses big data bisa anda baca pada artikel-artikel selanjutnya di blog big data dba.