حفظ و نگهداری داده ها به عنوان بخشی از فرآیند تأمین امنیت آنها همیشه از اهمیت بالایی برخوردار است و به همین جهت همیشه برای نگهداری از آنها نه تنها اطلاعات اصلی با دقت به شیوه های مختلف نگهداری میشوند بلکه با تهیه نسخه های پشتیبان سعی در فراهم آوردن شرایطی برای بازیابی اطلاعات در مواقع خرابی میشود. در میان عوامل مهم و تأثیر گذار در نگهداری اطلاعات زنده و همینطور اطلاعات پشتیبان محل نگهداری و ذخیره سازی آنهاست که در نهایت در همه موارد هارد دیسک ها به عنوان هسته اصلی ذخیره سازی از اهمیت ویژه ای برخوردار هستند لیکن به دلیل ماهیت و ساختار کاری که دارند بیشترین خرابی را متحمل میشوند.
شرکت Backblaze یک از ارائه دهندگان فضای ابری است که به صورت خاص هدف اصلی آن ارائه فضای ابری برای پشتیبان گیری است. این شرکت در گزارشی به بررسی پایداری و قابل اعتماد بودن هارد دیسک های مورد استفاده در مرکز داده خود پرداخته و بر اساس میزان خرابی و فراوانی هارد دیسک های هر سازنده قابل اطمینان بودن (reliability) هارد دیسک ها را بررسی نموده که در ادامه به بررسی آن میپردازیم.
براساس این گزارش، در سه ماهه نخست سال 2016 در مرکز داده این شرکت 61590 هارد دیسک جهت نگهداری داده های رمزنگاری شده مشتریان شرکت مورد استفاده قرار گرفته اند که این میزان 9.5% بیشتر از گزارش قبلی این شرکت است که طی آن 56224 هارد دیسک مورد بررسی قرار گرفته بود. این هارد دیسک ها در مجموع در سه ماهه نخست سال 2016 معادل یک میلیارد ساعت یا به عبارتی 42 میلیون روز که برابر با 114155 سال میباشد گردش داشته و فعال بوده اند.
قبل از ادامه مطلب ابتدا نحوه محاسبه نرخ خرابی هر نوع/مدل از هارد دیسک را بیان میکنیم. اگرچه روش های آماری و متفاوتی برای محاسبه میتوانند مورد استفاده قرار گیرند لیکن انجام محاسبات برای تهیه این گزارش به شیوه زیر صورت میگیرد. در این روش به 4 مشخصه نیاز است:
– تعدادی مشخص از هارد دیسک ها برای بررسی که در هر حالت میتواند بر اساس مدل، سازنده و یا ظرفیت متفاوت باشد (E)،
– بازه زمانی مشخص برای بررسی که معمولا بازه زمانی یکساله است (P)،
– تعداد خرابی هارد ها در دسته مشخص شده طی بازه زمانی یکساله (N)،
– ساعات سرویس دهی دسته هارد دیسک مورد بررسی طی بازه زمانی بررسی (H)
پس از گرد آوری هریک از مشخصه های بالا از رابطه زیر برای محاسبه نرخ خرابی استفاده می شود:
گزارش پایداری هارد دیسک در Backblaze در سه ماهه نخست سال 2016
در جدول زیر میزان خرابی هارد دیسک ها در سه ماهه نخست سال 2016 نشان داده شده است. لازم به ذکر است این جدول فقط برای بازه زمانی ذکر شده تهیه شده است.
با بررسی جدول بالا مشخص میشود که:
-مجموع هارد دیسک های مورد اشاره در گزارش بالا 61529 عدد است. در این گزارش هارد دیسک هایی که تعداد آنها کمتر از 45 عدد هستند مدنظر قرار نگرفته است.
– نرخ خرابی برخی مدل از هارد دیسک ها در سه ماهه نخست سال 2016 صفر بوده است. از این مدل هارد دیسک ها در این بازه زمانی هیچ هارد دیسک خرابی در مرکز داده گزارش نشده است.
– نرخ خرابی هایی که با خرابی تعداد کمی هارد دیسک به دست میآیند ممکن است گمراه کننده باشد. به عنوان مثال برای هارد دیسک Toshiba 3 TB میزان خرابی 8.65% گزارش شده که بر اساس خرابی یک هارد دیسک بدست آمده و ملاک مناسبی برای تصمیم گیری نیست.
– میزان خرابی 1.84% کمترین نرخ خرابی در یک بازه سه ماهه است که تا کنون مشاهده شده است.
نرخ قابلیت اطمینان تجمیعی هارد دیسک ها
بررسی میزان قابلیت اطمینان هارد دیسک ها در مرکز داده Backblaze از 31 آوریل 2013 شروع شده است. جدول زیر میزان قابل اطمینان بودن هارد دیسک ها را از 31 آوریل 2013 تا پایان سه ماهه نخست 2016 نشان میدهد.
هارد دیسک هایی با یک میلیارد ساعت گردش!
هارد دیسک ها در مرکز داده شرکت از گذشته تا زمان تهیه این گزارش در مجموع یک میلیارد ساعت کار کرده اند. به عنوان مثال هارد دیسک های WDC 1 TB که پس از 6 سال فعالیت کنار گذاشته شده اند بخشی از این میزان کارکرد هستند. در جدول زیر میزان ساعات کارکرد هر مدل هارد دیسک بر اساس ساعات سرویس دهی ذکر شده است:
سطر آخر جدول، “Others”، شامل هارد دیسک هایی با تعداد کمتر از 45 میشود.
با نگاهی به جدول بالا میبینیم که هارد دیسک های Seagate 4 ترابایتی بیشترین ساعات سرویس دهی را دارند. اما به واقع کدام سازنده بیشترین ساعت سرویس دهی را دارد؟ نمودار زیر ساعات سرویس دهی سازندگان هارد دیسک ها را نشان میدهد:
هارد دیسک های 2 و 3 ترابایتی HGST در سالهای اخیر به بهترین شکل سرویس دهی کرده اند و در مقام مقایسه باعث سنگین تر شدن کفه ترازو نسبت به هارد دیسک های 4 ترابایتی Seagate میشوند که حدود یک سال از خرید و استفاده از آنها میگذرد.
مقایسه دیگری که مطرح میشود میزان ساعات سرویس دهی هارد دیسک ها بر اساس حجم ذخیره سازی داده در آنهاست:
دیسک های 4 ترابایتی 580 میلیون ساعت کارکرد داشته اند. 48041 عدد هارد دیسک 4 ترابایتی موجود است که هر درایو به طور متوسط 503 روز معادل 1.38 سال سرویس دهی داشته است. نرخ از کار افتادگی هاردهای 4 ترابایتی در سال چیزی حدود 2.12% است.
نرخ خرابی بر اساس سازنده
هارد دیسک های مورد استفاده در مرکز داده این شرکت توسط 4 سازنده تأمین میشود که عمده آنها ساخت HGST و Seagate هستند. با توجه به این نکته نرخ خرابی هارد دیسک های موجود فارغ از حجم ذخیره سازی داده در اینجا آورده شده است. نتیجه بررسی در بازه زمانی یک ساله منتهی به 31 مارچ سالهای 2014، 2015 و 2016 بیان شده است.
تهیه هارد دیسک از Toshiba و Western Digital
در روال تهیه هارد دیسک عوامل مختلفی تأثیرگذار هستند. یکی از این عوامل تعداد هارد دیسک است که در نهایت در تعیین قیمت واحد نهایی هر عدد هارد دیسک اثرگذار است. بنا بر گفته های شرکت تعداد هارد دیسک هایی که در هر مرحله تهیه میشوند به طور معمول چیزی بین 5000 تا 10000 عدد است. خرید در این مقیاس باعث میشود قیمت نهایی هر هارد دیسک متعادل باشد.
در میان تأمین کنندگان هارد دیسک، عمده هارد دیسک ها توسط Seagate و HGST تأمین میشوند. درباره Toshiba محدودیت در تعداد هارد های عرضه شده در هر خرید مانع از تهیه هارد دیسک های بیشتر شده است و در مورد WDC اگر چه تعداد هارد دیسک های عرضه شده مناسب بوده لیکن عوامل جانبی بر خرید هارد دیسک از این شرکت تأثیر گذاشته و مانع از نهایی شدن معامله شده است.
چه هارد دیسکی خراب (Failed) به حساب میآید؟
سوالی که بعضا ذهن بسیاری از افراد را به خود مشغول میکند، معیار و ملاک برای کنار گذاشتن یک هارد دیسک چیست؟
در مجموعه Backblaze 3 معیار برای تعریف هارد دیسک “خراب” یا “از کار افتاده” وجود دارد:
– عدم چرخش هارد دیسک و ارتباط با سیستم عامل،
– عدم همگام سازی با سایر دیسک های موجود در یک آرایه از دیسک ها (RAID)،
– آمار اعلام شده از جانب S.M.A.R.T هر هارد دیسک کمتر از حدود تعریف شده شرکت باشد.
در هریک از حالات فوق هارد دیسک از چرخه استفاده کنار گذاشته میشود.
جمع بندی
در نگاه اول این گزارش شاید یک سری محاسبات آماری و داده حاصل از آنها باشد لیکن اهمیت این محاسبات و اعداد و ارقام را برای مراکز داده میتوان در جنبه های مختلف مورد بررسی و استفاده قرار داد. کیفیت کاری هارد دیسک های هر سازنده، نسبت قیمت به فضای ذخیره سازی و هزینه مدل/فضای ذخیره سازی/ ساعات سرویس دهی معیار هایی هستند که کاهش هزینه ها تأثیرگذار خواهد بود.
مرسی