رشته فناوری اطلاعات (IT)
پایان نامه زمانبندی در رایانش ابری با عنوان طراحي و پياده سازي يک زمانبندِ کار اشکال آگاه در سيستمهاي محاسبات ابري می باشد.در این پایان نامه سیستمهای محاسبات ابری را به عنوان یکی از سیستم های پردازش موازی مبتنی بر مبادله پیام مورد بررسی قرار میدهیم. این محیط ها به علت ویژگی خاص خود که ارتباط کارهای موازی فقط از پیامهای رد و بدل شده انجام میپذیرد، دارای توانمندیهای بالقوه برای انجام عملیات بازیافت میباشند.
از این رو، آنچه ما به طور خلاصه مورد مطالعه قرار خواهیم داد، قراردادهای بازیافت مختلف برای محیط مبادله پیام خواهد بود. این قراردادها برای توانمند کردن محیط پردازش موازی به منظور تحملپذیر کردن در برابر اشکال، اطلاعاتی نظیر حالت ماشینهای مجازی یا محتوی پیامها را در طول اجرای عادی نگه داری میکنند تا در زمان وقوع اشکال با استفاده از آن-ها، عملیات بازیافت انجام پذیرد.
در این پایان نامه در فصل دوم با قابلیت دسترسیبالا آشنا خواهیم شد و سپس در فصل سوم قراردادهای بازیافت در یک محیط پردازش موازی مبتنی بر مبادله پیام را مورد بررسی و مقایسه قرار میدهیم. در فصل چهارم به مطالعه کارهای اخیر انجام شده در زمینه برخورد پیشکنشی با اشکالهای محتمل میپردازیم. فصل پنجم را به معرفی الگوریتم پیشنهادی اختصاص داده و در آخر به پیاده سازی و ارزیابی الگوریتمهای پیشنهادی و مقایسه آن با روش کلاسیک پرداخته و نتیجه گیری مینماییم.
فهرست مطالب
1 مقدمه 2
2 قابليت دسترسي بالا 9
2-1 مفاهيم پايه قابليت دسترسي بالا 10
2-1-1 تعريف قابليت دسترسي بالا 10
2-1-2 مفاهيم و مباحث مرتبط با قابليت دسترسي بالا 11
2-1-3 معيارهاي سنجش قابليت دسترسي 13
2-1-4 سطوح قابليت دسترسي بالا 15
2-1-5 توقف برنامهريزي شده و توقف برنامهريزي نشده 16
2-1-6 عوامل مؤثر بر ميزان دسترسي سيستم 18
2-2 دستيابي به قابليت دسترسي بالا در سيستمهاي كلاستر 19
2-2-1 تعريف نقاط منفرد بروز خرابی 19
2-2-2 از بين بردن نقاط منفرد بروز خرابی در اجزاي سختافزاري 19
2-2-3 از بين بردن نقاط منفرد بروز اشكال در اجزاي نرمافزاري 28
2-2-4 تشخيص دهندۀ خرابي در كلاسترهاي با قابليت دسترسي بالا 30
2-2-5 معماري کلاسترهاي با قابليت دسترسيبالا 32
2-2-6 اتصالات و شبکه کلاستر 34
2-2-7 مديريت و نظارت بر کلاستر 34
2-2-8 تصوير يکپارچه سيستم (SSI) 41
3 روالهای تحملپذیر اشکال برای رسیدن به قابلیت دسترسی بالا در سیستمهای مبادله پیام 36
3-1 پيشزمينه و تعاريف 39
3-1-1 مدل سيستم 39
3-1-2 حالتهاي سيستم يكپارچه 40
3-1-3 تعامل با دنياي خارج 42
3-1-4 پيام در حال گذر 43
3-1-5 قراردادهاي ثبت وقايع 44
3-1-6 ذخيرهساز پايدار 46
3-1-7 جمعآوري دادههاي زائد 47
3-2 بازيافت براساس نقطه مقابله 48
3-2-1 نقطه مقابله گرفتن به صورت غيرهماهنگ 48
3-2-2 نقطه مقابله گرفتن به صورت هماهنگ 53
3-2-3 نقطه مقابله گرفتن بر اساس ارتباطات 57
3-3 بازيافت بر اساس ثبت وقايع 62
3-3-1 شرط يكپارچگي بدون پروسههاي يتيم 63
3-3-2 ثبت بدبينانه وقايع 64
3-3-3 ثبت خوشبينانه وقايع 68
3-3-4 ثبت علّي وقايع 71
3-3-5 مقايسه قراردادهاي بازيافت 74
3-4 مباحث مطرح در پيادهسازي 74
3-4-1 بررسي 74
3-4-2 پيادهسازي تکنيکهاي نقطه مقابله گرفتن 75
3-4-3 مقايسة قراردادهاي نقطه مقابله گرفتن 77
3-4-4 قراردادهاي ارتباطي 78
3-4-5 بازيافت بر اساس روش ثبت وقايع 79
3-4-6 ذخيرهساز پايدار 80
3-4-7 دنبال كردن وابستگي 81
3-4-8 بازيافت 82
4 کارهاي انجام شده اخیر 71
4-1 مروري بر روشهاي پيشبيني اشکال 72
4-1-1 کلاسه بندي و اشکالهاي ريشه آماری 73
4-1-2 مدل آماري زمان ميان خرابيها 74
4-1-3 جمعآوري و پيشپردازش دادههاي مرتبط با خرابي 74
4-2 تکنيکهاي پيشبيني اشکال 76
4-2-1 حدآستانه مبتني بر آمار 76
4-2-2 آناليز سريهاي زماني 76
4-2-3 کلاسهبندي مبتني بر قانون 77
4-2-4 مدلهاي شبکه بيزي 78
4-2-5 مدلهاي پردازش شبه مارکوف 79
4-3 مطالعات انجام گرفته 80
5 روش پيشنهادي 86
5-1 مدل اشکال 86
5-1-1 متوسط زماني تا خرابي 90
5-2 مبانی احتمال و پیشبینی 92
5-2-1 مفاهیم اولیه 92
5-2-2 رابطه قانون بيز و احتمال درستي پيشبيني 94
5-3 رابطه الگوريتم پيشبيني و مدل اشکال 96
5-3-1 تحليل روابط احتمالي 96
5-4 مدل پيشنهادي 100
5-4-1 ارائه الگوريتم 103
5-4-2 مدل مبتني بر هزينه 105
5-4-3 اثر پيشبينيکننده بر روي مدلهاي هزينه 110
5-4-4 تصميمگيري سيستم در کارگزار ابر 112
6 نتایج آزمایشها 109
6-1 معرفی شبیهساز CloudSim 109
6-1-1 اجزای ابر 110
6-1-2 اجزای اصلی هسته 112
6-1-3 سرویسهای موجود و الگوریتمهای آنها 116
6-1-4 روند کار شبیهساز 118
6-2 نحوه پیادهسازی سیستم تحملپذیر اشکال در شبیهساز 119
6-2-1 FaultInjector 121
6-2-2 FaultPredictor 124
6-2-3 FTHost 126
6-2-4 FTDatacenter 126
6-2-5 FTDatacenterBroker 127
6-3 نتایج آزمایشات 130
6-3-1 بررسی اثر سربار نقطه مقابلهگیری 133
6-3-2 بررسی عملهای انتخابی 134
6-3-3 خرابیهای متوقف سازنده و غیر متوقف سازنده 137
7 نتیجه گیری و پیشنهادات 140
منابع 142
فهرست شکل ها
شکل 1 1رویکرد یه تکنولوژیهای مختلف محاسبات توزیع شده [1] 3
شکل 2 1 سهم عوامل مختلف در از کارافتادگی سیستم HA [11] 16
شکل 2 2 برخی SPOFها در سیستم سرویسدهنده/سرویسگیرنده 18
شکل 2 3 SPOFها در یک شبکه اترنت نوعی 22
شکل 2 4 حذف SPOFهای شبکه به روش افزونگی کامل 23
شکل 2 5 نمونهای از تشخیص خرابی با سیگنال ضربان قلب 26
شکل 2 6 نمای ساده از نظارت 31
شکل 2 7 ارتباط اجزا مختلف EMS 31
شکل 3 1 مثالی از يك سيستم مبادله پيام با سه واحد موازی 38
شکل 3 2 مثالی از حالت يكپارچه و غيريكپارچه سيستم 40
شکل 3 3 پيادهسازي مكانيسمهاي بازيافت 42
شکل 3 4 ثبت كردن پيام براي اجراي مجدد قطعي 43
شکل 3 5 انديس نقطه مقابله و بازه نقطه مقابله 46
شکل 3 6 (a) يك اجراي مثال (b) گراف وابستگي بازگشت به عقب (c) گراف نقطه مقابله 47
شکل 3 7 انتشار بازگشت به عقب، خط بازيافت و اثر دومينو 48
شکل 3 8 نقطه مقابله گرفتن به صورت هماهنگ و غيربلوكه شونده (a) غيريكپارچگي نقطه مقابله (b) با كانال FIFO (c) با كانال غيرFIFO 49
شکل 3 9 مسير Z سيكل Z 52
شکل 3 10 روش ثبت بدبينانه وقايع 57
شکل 3 11 روش ثبت خوشبينانه وقايع 60
شکل 3 12 روش ثبت علّي وقايع (الف) حالتهاي قابل بازيافت حداكثر (ب)گراف مقدم را براي پروسه P0 در حالت X 62
شکل 5 1 منحنی وان 88
شکل 5 2 نمودار مثبت واقعی، منفی واقعی و دقت پیشبینی 95
شکل 5 3 اثر تغییرات MTTF بر روی دقت پیشبینی 96
شکل 5 4 اثر حساسیت و ویژگی بر روی دقت پیشبینی 97
شکل 5 5 شماتیک خط زمانی نقطه مقابلهگیری هماهنگ دورهای 98
شکل 5 6 شماتیک خط زمانی نقطه مقابلهگیری هماهنگ دورهای در برخورد با اشکال 99
شکل 5 7 شماتیک خط زمانی الگوریتم تطبیقی پیشنهادی 101
شکل 6 1دیاگرام کلی شبیهساز[92] 116
شکل 6 2 جریان کار اجزای برنامههای موازی در شبیهساز [92] 116
شکل 6 3 نمونهای از محتویات یک فایل سناریوی خرابی گرها در یک مرکز داده 118
شکل 6 4 ماشین حالت خرابی یک گره محاسباتی در ابر 119
شکل 6 5 تکه کد تغییر وضعیت حالت میزبانهای یک مرکزداده به صورت بهینه 120
شکل 6 6 تکه کد پیشبینی وضعیت یک گره محاسباتی در زمان آینده time 121
شکل 6 7 در صد بهبود زمان اجرای الگوریتمهای پیشنهادی نسبت به الگوریتم آزمون نقطه مقابلهگیری دورهای کلاسیک 126
شکل 6 8 در صد بهبود زمان اجرای الگوریتمهای پیشنهادی نسبت به الگوریتم آزمون نقطه مقابلهگیری دورهای کلاسیک با افزایش زمان نقطه مقابلهگیری به 5 دقیقه 127
شکل 6 9 تعداد عملهای انتخابی در طول زمان اجرا با الگوریتم نقطه مقابلهگیری دورهای 128
شکل 6 10 تعداد عملهای انتخابی در طول زمان اجرا با الگوریتم تطبیقی اولیه 128
شکل 6 11 تعداد عملهای انتخابی در طول زمان اجرا با الگوریتم تطبیقی تصحیح شده 129
شکل 6 12 تعداد اشکالهایی که در طول اجرای برنامه سبب توقف یا عدم توقف ابر میشوند 130
فهرست جداول
جدول 1 1 قابلیت اطمینان در مراکز داده مختلف[4] 5
جدول 2 1 مقایسه کلاسترهای HA و FT [13] 11
جدول 2 2 زمانهای توقف و کارکرد یک سیستم 52×7×12 14
جدول 2 3 زمانهاي توقف و كاركرد يك سيستم 52×5×12 14
جدول 3 1 مقايسه بين قراردادهاي مختلف بازيابي [47] 64
جدول 5 1 رابطه وضعیت محیط و الگوریتم پیشبینی 91
جدول 5 2 تعاریف پارامترهای استفاده شده در مدلها 102
جدول 5 3 مدل هزینه عمل مهاجرت 103
جدول 5 4 مدل هزینه عمل نقطه مقابلهگیری 104
جدول 5 5 مدل هزینه عمل اجرای بلافاصل 105
جدول 6 1 مقداردهی اولیه متغیرهای شبیهساز 125