(Web Mining) ، در حجم 39 اسلاید قابل ویرایش.
بخشی از متن:
وب، محيطي وسيع، متنوع و پويا است که کاربران متعدد اسناد خود را در آن منتشر مي کنند. در حال حاضر بيش از دو بيليون صفحه در وب موجود است و اين تعداد با نرخ 7.3 ميليون صفحه در روز افزايش مي يابد.
با توجه به حجم وسيع اطلاعات در وب، مديريت آن با ابزارهاي سنتي تقريبا غير ممکن است و ابزارها و روش هايي نو براي مديريت آن مورد نياز است.
با توسعه سيستم هاي اطلاعاتي، داده به يکي از منابع پراهميت سازمان ها مبدل گشته است. بنابراين روش ها و تکنيک هايي براي دستيابي کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از اين اطلاعات، مورد نياز مي باشد.
مشکلات کاربران در استفاده از وب :
يافتن اطلاعات مورد نياز در وب دشوار مي باشد و کاربران معمولا از موتورهاي جستجو که مهمترين و رايج ترين ابزار براي يافتن اطلاعات در وب مي باشند، استفاده ميکنند.
اما موتورهاي جستجو داراي دو مشکل اصلي هستند.
دقت موتورهاي جستجو پايين است، چراکه اين موتورها در پاسخ به يک پرس و جوي کاربر صدها يا هزاران سند را بازيابي مي کنند .
ميزان فراخوان اين موتورها کم مي باشد، به آن معني که قادر به بازيابي کليه اسناد مرتبط با نياز اطلاعاتي کاربر نيستند. چرا که حجم اسناد در وب بسيار زياد است و موتورهاي جستجو قادر به نگهداري اطلاعات کليه اسناد وب، در پايگاه داده هاي خود نمي باشند .
و...
فهرست مطالب:
مقدمه
مشکلات کاربران در استفاده ازوب
Web Mining
مراحل وب کاوي
وب کاوي و زمينه هاي تحقيقاتي مرتبط
وب کاوي و داده کاوي
تفاوت وب کاوي و داده کاوي
وب کاوي و يادگيري ماشين
انواع وب کاوي
چالش هاي وب کاوي
انواع الگوریتم های وب کاوی
درخت تصميم
شبکه عصبي
HITS
Page Rank
کاربردهاي وب کاوی
ساختار وب کاوی
روش های وب کاوی
وب کاوی و بازیابی اطلاعات
وب کاوی و استخراج اطلاعات
الگوریتم های کاوش ساختار وب
کاربردهای کاوش ساختار وب
داده ها در وب
Googleو وب کاوی
Ebay و وب کاوی
نتيجه گيري
فهرست مراجع
این فایل با فرمت پاورپوینت در 39 اسلاید قابل ویرایش تهیه شده است.
کامپیوتر