Mengapa Server Canggih Amazon Bisa 'Tumbang'?

|
Layaknya 'kapal Titanic', hampir tidak ada yang menyangka komputasi awan milik Amazon bisa gagal. Padahal didesain dengan backup data ganda yang ‘seharusnya’ antirusak. Lalu, kenapa?

Amazon memiliki pusat penyimpanan komputasi awan (cloud computing) bernama Amazon Web Services (AWS) yang dimanfaatkan oleh situs ternama seperti Reddit, Quora, FourSquare, Hootsuite, New York Times, ProPublica dan 70 situs lain. Sayangnya, pemadaman besar muncul menimbulkan pertanyaan besar soal kedigdayaan AWS.

Dalam keadaan normal, ribuan perusahaan menggunakan AWS untuk mengaktifkan situs mereka memanfaatkan layanan bernama Elastic Compute Cloud (EC2). Daripada membeli server sendiri untuk menggunakan situs mereka, perusahaan cenderung memanfaatkan Amazon untuk mendapatkan fitur yang sama. Amazon mengklaim memiliki kapasitas server yang sempurna dan sangat rumit.

Pada dasarnya EC2 tersimpan di lima kota di seluruh dunia yaitu Northern Virginia, California Utara, Irlandia, Tokyo dan Singapura. Masing-masing wilayah memiliki ‘zona ketersediaan’ ganda serta pusat data yang ganda pula.

Untuk meyakini keselamatan data pengguna, Amazon menghubungan beberapa pusat data yang berbeda dalam satu kesatuan untuk mencegah data pengguna mengalami kegagalan akses. Yang menarik, Amazon bahkan menjanjikan 10% penurunan biaya pengeluaran perusahan setiap bulan.

Sayangnya, Amazon gagal memenuhi janji. Beberapa situs terpaksa mengalami kesulitan akses selama 4,4 jam. Bahkan, ada beberapa pihak yang merasakan ‘kesunyian’ selama 36 jam. Di sisi lain, Amazon malah membungkam. Mereka menolak berikan keterangan soal situasi ini sampai sepenuhnya menemukan penyebab masalah tersebut.

Sayangnya, beberapa ahli internet sudah mulai berargumentasi. Beberapa pihak menyebutkan adanya kerusakan di pusat data Amazon di Northern Virginia. Dalam status perusahaan, Amazon mengatakan adanya ‘masalah jaringan’ yang diperkirakan menyebabkan efek domino di zona ketersediaan data di wilayah lain. Secara tidak langsung, volume penyimpanan data menciptakan backup baru yang mencegah beberapa situs mengakses data mereka sendiri.


Doug Willoughby, direktur strategi komputasi awan di Compuware berteori bahwa masalah muncul di sistem kabel atau konektivitas, dikenal dengan nama Elastic Block Store (EBS). Pada dasarnya, ini adalah sebuah hard drive berbasis jaringan yang memungkinkan pengguna menyimpan data sekitar 1 GB atau 1 TB (terabytes) per volume.

Reddit misalnya, mengalami masalah dengan 700 volume EBS di Amazon. Karena itu, Reddit dan Amazon bekerja sama untuk re-mirror atau menggandakan volume pusat data ke zona ketersediaan lain. Sayangnya, proses ini membutuhkan waktu panjang.

“Kami selalu menyimpan data di beberapa zona untuk menghindari masalah ini. Alasan kerusakan adalah adanya kegagalan dalam beberapa zona ketersediaan itu sendiri,” kata Pengembang Produk Senior di Reddit, Jeremy Edburg.

Situs seperti Quora dan Reddit pada akhirnya memang bekerja dengan normal namun dalam bentuk read-only. Tapi sayangnya, pengguna tidak dapat posting konten baru selama berjam-jam. Banyak ahli yang menyalahkan situs itu sendiri terkait kerusakan parah tesebut. Mereka mengklaim seharusnya perusahaan menyebarkan data mereka di berbagai kawasan Amazon sekaligus back-up data.

“Produk Amazon hanya bagus digunakan bila perusahaan memiliki arsitektur yang cukup baik,” ujar salah satu pendiri layanan komputasi awan Bluewolf, Michael Kirven. “Kalau kamu menaruh satu telur dalam satu keranjang, kamu menempatkan risiko di diri kamu sendiri.”  (inilah)

0 komentar:

Posting Komentar

Next Prev
▲Top▲