Untuk postingan kali ini, saya ingin membahas mengenai sistem HA untuk level enterprise yang diluncurkan oleh sebuah perusahaan IT yang sudah sangat legendaris yaitu IBM yang bernama High Availability Cluster Multi Processing (HACMP). Supaya tidak terlalu panjang, berikut ini adalah pembahasannya.
Arsitektur Sistem HACMP
System ini nampaknya lebih rumit ketimbang system lain yang ada dalam kajian ini. Namun, disamping itu system ini juga memiliki kelebihan, salah satunya adalah pengiriman paket heartbeat dapat dilakukan tidak hanya melalui satu atau dua private network, melainkan dapat juga dikirimkan melalui jaringan TCP/IP, jaringan point-to-point maupun shared disk. Berikut ini adalah beberapa pion penting yang ada dalam HACMP:
1. Seperti tampak pada gambar, secara fisik HACMP cluster terbagi atas 4 komponen yaitu:
a. Networks
HACMP dapat bekerja dengan berbagai macam jaringan yang berbasis TCP/IP (telah diuji dengan jaringan Ethernet, Token Ring, ATM dan jaringan lainnya). Seluruh node dalam cluster HACMP menggunakan network untuk:
· Memungkinkan clients untuk mengakses seluruh node dalam cluster
· Memungkinkan seluruh node dalam cluster untuk bertukar heartbeat message
· Mengakses data
b. Client
Client menjalankan aplikasi front end yang melakukan request kepada aplikasi server yang berjalan pada cluster node. Meskipun client termasuk dalam struktur HACMP, namun HACMP tidak membuat client menjadi Highly Available. Untuk mengetahui status dari cluster, client dapat menggunakan tool Clinfo.
c. Nodes
· Client node
Menjalankan front end application yang me-retrieve data dari server node. Client node dapat menjalankan HACMP software untuk melakukan memonitor keadaan dari seluruh node dan melakukan tindakan jika terjadi failure. Client node melakukan komunikasi dengan server nodes melalui Service IP Address. Client node dapat dibagi menjadi 2 kategori, yaitu naïve client dan intelligent client:
· Naïve client melihat cluster sebagai satu entitas, jika sebuah server mengalami failure dan koneksi terputus, naïve client harus melakukan restart atau setidaknya melakukan reconnect ke server.
· Intelligent client adalah cluster aware client. Saat terjadi failure, client ini melakukan reconnect ke server lain, dan mungkin melakukan masking failure untuk kenyaman user.
· Server node
Adalah core dari HACMP system. Server nodes menjalankan service ataupun back end application yang mengakses data dari shared external disk. Dalam server nodes berjalan HACMP daemon.
d. Shared disk
Menyimpan mission-critical data, umumnya mirrored atau menggunakan RAID untuk data redundancy dan terhubung ke beberapa server node. Shared disk juga dapat digunakan untuk mentransmisikan heartbeat dari satu node ke node lain.
2. Yang dilakukan oleh HACMP pada saat terjadi failure (misalkan pada salah satu node):
a. HACMP mendeteksi adanya failure pada salah satu node dengan hilangnya heartbeat (jika terjadi shutdown atau network failure) atau pesan error pada heartbeat (jika failure pada application, internal disk atau failure lainnya yang membuat node masih dapat mengirimkan heartbeat)
b. Node lain (yang telah dikonfigurasi) melakukan takeover seluruh task/job dan resource (shared disk, client, dll) yang dimiliki oleh failure node sementara node lain tersebut menjalankan task/job dan resourcenya sendiri.
c. Jika node yang melakukan takeover mengalami kelebihan load, maka HACMP akan melakukan load balancing.
d. Business continue.
3. Poin-poin penting untuk sistem HACMP:
a. Menggunakan konsep Shared Availability
b. Node bertugas untuk menyimpan dan menjalankan aplikasi server
c. Shared disk menyimpan mission critical data
d. Dapat menggunakan berbagai macam jaringan berbasis TCP/IP
e. Cluster dapat terdiri dari 1 standalone System P Server hingga 32 System P server dengan sistem operasi AIX
4. Kelebihan dan kekurangan
a. Kelebihan
· Very high degree availability
· Increased scalability
· Dapat berfungsi sebagai load balancer
· Tidak bergantung pada 1 network untuk mentransmisikan heartbeat
· Antara satu node dengan node lain tidak harus identik untuk dapat melakukan takeover
· Tidak menggunakan teknik virtualization sehingga aplikasi yang berada di dalam setiap node dapat berjalan lebih ringan ketimbang dengan virtualization
b. Kekurangan
· Hanya bekerja pada platform System P dan i series dengan sistem operasi AIX
· Kompleksitas yang lebih tinggi sehingga membutuhkan skill khusus untuk melakukan implementasi dan administrasi
Sistem HA ini sangat cocok untuk diterapkan untuk level Enterprise yang menginginkan HA dengan SLA yang lebih tinggi.
Isi dari postingan ini saya kutip dari dokumentasi “High Availability Cluster Multi-Processing for AIX, Concepts and facilities guide” oleh IBM. Saya rasa cukup sekian postingan kali ini, jika anda memiliki pertanyaan, saran, atau kritik, silahkan sampaikan melalui komentar atau email: adie_ndonk@yahoo.co.id.
Thanks & Regards,
Adhie Indi Arysanto.