پاورپوینت وب کاوی (pptx) 26 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 26 اسلاید
قسمتی از متن PowerPoint (.pptx) :
Web Mining
وب کاوی
1
فهرست مطالب
درخت تصميم
شبکه عصبي
HITS
Page Rank
کاربردهاي وب کاوی
Google
و وب و کاوی
Ebay
و وب و کاوی
نتيجه گيري
فهرست
منابع
مقدمه
مشکلات کاربران در استفاده
ازوب
Web Mining
مراحل وب
کاوي
وب کاوي و زمينه هاي تحقيقاتي
مرتبط
وب کاوي و داده
کاوي
تفاوت وب کاوي و داده
کاوي
وب کاوي و يادگيري
ماشين
انواع وب
کاوي
چالش هاي وب کاوي
انواع الگوریتم های وب
کاوی
2
مقدمه
. وب، محيطي وسيع، متنوع و پويا است که کاربران متعدد اسناد خود را در آن منتشر مي کنند. در حال حاضر بيش از دو بيليون صفحه در وب موجود است و اين تعداد با نرخ 7.3 ميليون صفحه در روز افزايش مي
يابد.
با توجه به حجم وسيع اطلاعات در وب، مديريت آن با ابزارهاي سنتي تقريبا غير ممکن است و ابزارها و روش هايي نو براي مديريت آن مورد نياز
است.
با توسعه سيستم هاي اطلاعاتي، داده به يکي از منابع پراهميت
سازمان
ها مبدل گشته است. بنابراين روش ها و تکنيک هايي براي دستيابي کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از اين اطلاعات، مورد نياز مي
باشد.
3
مشکلات کاربران در استفاده از
وب
يافتن اطلاعات مورد نياز در وب دشوار مي
باشد
و
کاربران معمولا از موتورهاي جستجو که مهمترين و رايج ترين ابزار براي يافتن اطلاعات در وب مي باشند، استفاده
ميکنند.
اما موتورهاي جستجو داراي دو مشکل اصلي هستند
.
دقت موتورهاي
جستجو پايين است، چراکه اين موتورها در پاسخ به يک پرس و جوي کاربر صدها يا هزاران سند را بازيابي مي
کنند .
ميزان
فراخوان اين
موتورها کم مي باشد، به آن معني که قادر به بازيابي کليه اسناد مرتبط با نياز اطلاعاتي کاربر نيستند. چرا که حجم اسناد در وب بسيار زياد است و موتورهاي جستجو قادر به نگهداري اطلاعات کليه اسناد وب، در پايگاه داده هاي خود نمي
باشند .
4
مشکلات کاربران در استفاده ازوب (
ادامه)
ايجاد دانش جديد با استفاده از اطلاعات موجود در
وب
بتوان
داده هاي فراوان موجود در وب را به دانشي قابل استفاده تبديل کرد، به طوري که يافتن اطلاعات مورد نياز در آن به سادگي صورت
بگيرد .
خصوصي
سازي اطلاعات
براي اين منظور با توجه به خواسته ها و تمايلات کاربران متفاوت، نحوه ارائه اطلاعات به آنها بايد سفارشي گردد
.
تکنيک هاي وب
کاوي قادر
به حل اين مشکلات مي
باشند
5
Web Mining
وب کاوي، فرآيند کشف اطلاعات و دانش ناشناخته و مفيد از داده هاي وب مي باشد
.
وب کاوي به کارگيري تکنيک هاي
داده
کاويبراي
کشف و استخراج
خودکار
اطلاعات از اسناد و سرويس هاي
وب
مي باشد
.
6
مراحل وب کاوي
پيدا کردن
منبع
اين
مرحله شامل بازيابي اسناد وب مورد نظر مي
باشد
در مرحله اول داده ها از منابع موجود در وب مانند خبرنامه هاي الکترونيکي، گروه هاي خبري، اسناد
HTML
، پايگاه داده هاي متني و ... بازيابي مي
شوند.
انتخاب اطلاعات و پيش
پردازش
در
اين مرحله به صورت خودکار اطلاعات خاصي از اسناد بازيابي شده، انتخاب و پيش پردازش مي
شوند.
اين پيش پردازش مي تواند کاهش کلمات به ريشه
آنها،
حذف کلمات
زائد،
پيدا کردن عبارات موجود در متن و تبديل بازنمايي داده ها به قالب رابطه اي يا منطق مرتبه اول باشد.
7
مراحل وب
کاوي (ادامه)
تعميم
در اين مرحله به صورت خودکار الگوهاي عام در يک يا چندين سايت وب کشف مي شود
در
این مرحله از
تکنيک هاي داده کاوي و يادگيري ماشين براي تعميم استفاده مي شود.
تحليل
در
اين مرحله الگوهاي به دست آمده در مرحله قبل اعتبار
سنجي و
تفسير مي
شوند
کاربران
نقش مهمي در
فرآيند تحليل ايفا
مي
کنند.
8
وب کاوي و زمينه هاي تحقيقاتي مرتبط
وب کاوي با زمينه هاي مختلف تحقيقاتي علوم کامپيوتر همچون
داده
کاوي،
پايگاه
داده،
بازيابي
اطلاعات،
هوش
مصنوعي،
يادگيري
ماشين،
پردازش
زبان طبيعي،
استخراج
اطلاعات،
انبار
داده
ها،
طراحي
واسط کاربر و ... در ارتباط تنگاتنگ است
.
9
وب کاوي و داده کاوي
وب کاوي و داده کاوي ارتباط بسيار نزديکي با يکديگر دارند.
داده کاوي فرآيند ارائه پرسوجوها و استخراج الگوها و اطلاعات مفيد و ناشناخته از داده هايي است که معمولا در پايگاه داده ها ذخيره شده اند.
بسياري
از تکنيک هاي داده کاوي قابل استفاده در وب کاوي هستند.
حوزه
وب کاوي وسيع تر از داده کاوي است
.
10