کامپیوتر و IT
این نوشتار مبانی نظری و پیشینه تحقیق داده کاوی توزیع شده می باشد. در بخش اول چارچوب و مبانی نظری داده کاوی توزیع شده تشریح می شود و در بخش دوم پیشینه نظری تحقیق داده کاوی توزیع شده در پژوهش های داخلی و خارجی مورد بررسی قرار می گیرد.
مقدمه مبانی نظری داده کاوی توزیع شده داده کاوی توزيع شده عبارت است از کشف نيمه خودکار الگوهای پنهان موجود در داده ها، در حالتی که داده ها و يا مکانيزمهای استنتاج، به صورت توزيع شده باشند. غيرمتمرکز بودن داده ها بدان معناست که دادهها به صورت توزيع شده بين دو يا چند سايت بوده و هزينه انتقال تمام يا بخشی از داده ها به يک سايت مرکزی، قابل صرفنظر نباشد. توزيع شده بودن مکانيزمهای استنتاج، به معنای لزوم لحاظ کردن هزينه ارتباط بين مکانيزمهای مختلف در حال استخراج دانش میباشد. اين توزیعشدگی ممکن است به دلايل مختلفی از جمله ارائه شدن مکانيزم استخراج دانش در قالب يک سرويس اينترنتی و يا صرفاً ناشی از توزیعشدگی داده ها باشد.
چنين رويکردی به داده کاوی، برخلاف جهت کلی تحقيقات انجام شده است که به طور عمده به تکنيکهای متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه ای) داده های هدف متکی می باشند. مسائلی نظير استخراج دانش در حالت عدم دسترسی به تمام داده های موجود، برقراری ارتباط موثر و بهينه با ساير مکانيزمهای در حال استخراج دانش و نيز تبادل دانش يا اطلاعات ميانی به جای اطلاعات خام، فقط تعدادی از مسائل اوليه داده کاوی توزيع شده با توجه به تعريف آن می باشند. بنابراين، داده کاوی توزيع شده در عين حال که به عنوان راه حلی کليدی برای مشکلات اصلی پيش روی داده کاوی مطرح می باشد، خود سرمنشأ چالشها و مسائل متعددی گرديده است؛ حل مؤثر اين مشکلات منجر به استفاده هرچه بيشتر از داده کاوی و ايجاد امکانات جديد و بهره برداری از پتانسيلهای موجود در قلمروهائی خواهد شد که عليرغم نياز مبرم به داده کاوی، استفاده بسيار محدودی از آن به عمل می آورند.
بحث داده کاوی توزيع شده به طور کلی از دو جهت قابل بررسی می باشد. اول حالتی که در آن داده ها به صورت همسان بين پايگاههای مختلف توزيع شده اند و داده های هر پايگاه تمام خصوصيات را دارا هستند. در این حالت داده ها ممکن است ذاتاً توزيع شده باشند و يا اينکه داده های متمرکز به دلایل امنيتی يا غیره بين پايگاههای مختلف تقسيم شده باشند. اصطلاحاً به اين حالت ، تقسيم شده به صورت افقی نيز گفته می شود.[9] حالت دوم حالتی است که در آن داده های موجود در هر پايگاه داده دارای خصوصيتهای مختلف می باشند. معمولاً در اين موارد داده ها خود بين پایگاههای مختلف تقسيم گرديده اند و ذاتاً توزيع شده نيستند.
از اينرو به این حالت تقسيم شده عمودی نيز گفته می شود.[9] برای ايجاد ارتباط بين خصوصيتهای مختلفی که در پايگاههای مختلف نگهداری می شوند اما متعلق به يک داده هستند، معمولاً يک خصوصيت مشترک که به عنوان شناسه مورد استفاده قرار می-گيرد، بين تمام پايگاههای مختلف نگهداری می شود که رکوردهای مختلف را بهم ارتباط می دهد. در داده کاوی توزيع شده نيز مسأله کشف و استخراج دانش مشابه داده کاوی عادی در زمينه های خوشه بندی توزيع شده، کشف قواعد وابستگی به صورت توزيع شده و طبقه بندی توزيع شده (که با نام يادگيری توزيع شده طبقه بند هم از آن نام برده می شود) مورد تحقيق و بررسی قرار میگیرد. ضمن اينکه در بحث داده کاوی توزيع شده، مسأله مربوط به محرمانگی داده ها حتماً بايد مدنظر قرار گيرد. برای مطالعه بيشتر در مورد داده کاوی توزيع شده می توانيد به مرجع [9] مراجعه نماييد.
فهرست مطالب
مبانی نظری در مورد داده کاوی توزیع شده 2-1- مقدمه 7
2-2- دادهکاوی 7
2-2-1- خوشهبندی 8
2-2-1-1- روشهای تقسيمبندی 8
2-2-1-2- روشهای سلسله مراتبی 8
2-2-1-3- روشهای مبتنی بر چگالی 9
2-2-2- طبقهبندی 9
2-2-2-1- طبقهبندی مبتنی بر قواعد 10
2-2-3- کشف قواعد انجمنی 12
2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنی 12
2-2-3-1-1- تقسیم بندی قواعد انجمنی 14
2-2-3-1-2- استخراج قواعد تکسطحی تک بعدی دودویی 14
2-2-3-1-2-1- مرحله پیوست 16
2-2-3-1-2-2- مرحله هرس 17
2-2-3-1-3- محاسبه اطمینان و استخراج قواعد نهایی 17
2-3- دادهکاوی توزيع شده 17
2-6-1- دادهکاوی توزيع شده 33
2-6-2- کارهای مهم انجام شده در زمينه دادهکاوی با استفاده از عامل 36
2-7- جمعبندی
پیشینه تحقیق در مورد داده کاوی توزیع شده
منابع
توضیحات:
فصل دوم پایان نامه کارشناسی ارشد (پیشینه و مبانی نظری پژوهش)
همراه با منبع نویسی درون متنی به شیوه APA جهت استفاده فصل دو پایان نامه
توضیحات نظری کامل در مورد متغیر
پیشینه داخلی و خارجی در مورد متغیر مربوطه و متغیرهای مشابه
رفرنس نویسی و پاورقی دقیق و مناسب
منبع : انگلیسی وفارسی دارد (به شیوه APA)
نوع فایل: WORD و قابل ویرایش با فرمت doc