وب کاوی
مقدمه
- وب، محیطی وسیع، متنوع و پویا است که کاربران متعدد اسناد خود را در آن منتشر می کنند. در حال حاظر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ 7.3 میلیون صفحه در روز افزایش می یابد.
- با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیرممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است.
- با توسعه سیستم های اطلاعاتی، داده به یکی از منابع پر اهمیت سازمان ها مبدل گشته است. بنابراین روش ها و تکنیک هایی برای دستیابی کارا به داده ها، اشتراک داده ها، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد نیاز می باشد.
مشکلات کاربران در استفاده از وب
- یافتن اطلاعات مورد نیاز در وب دشوار می باشد و کاربران معمولاً از موتورهای جستجو که مهمترین و رایج ترین ابزار برای یافتن اطلاعات در وب می باشند، استفاده می کنند.
- اما موتورهای جستجو دارای دو مشکل اصلی هستند:
1- دقت موتورهای جستجو پایین است، چراکه این موتورها در پاسخ به یک پرس و جوی کاربر صدها یا هزاران سند را بازیابی می کنند.
2- میزان فراخوان این موتورها کم می باشد، به آن معنی که قادر به بازیابی کلیه اسناد مرتبط با نیازهای اطلاعاتی کاربر نیستند. چرا که این حجم اسناد در وب بسیار زیاد است و موتورهای جستجو قادر به نگهداری اطلاعات کلیه اسناد وب، در پایگاه داده های خود نمی باشد.
- ایجاد دانش جدید با استفاده از اطلاعات موجود در وب
- بتوان داده های فراوان موجود در وب را به دانشی قابل استفاده تبدیل کرد، به طوری که یافتن اطلاعات مورد نیاز در آن به سادگی صورت بگیرد.
- خصوصی سازی اطلاعات
برای این منظور با توجه به خواسته ها و تمایلات کاربران متفاوت، نحوه ارائه اطلاعات به آنها باید سفارشی گردد. تکنیک های وب کاوی قادر به حل این مشکلات می باشند.
Web Mining
- وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وب می باشند.
- وب کاوی به کارگیری تکنیک های داده کاوی برای کشف و استخراج خودکار اطلاعات از اسناد و سرویس دهی وب می باشند.
مراحل وب کاوی
-
پیدا کردن منبع:
این مرحله شامل بازیابی اسناد وب مورد نظر می باشد در مرحله اول داده ها از منابع موجود در وب مانند خبرنامه های الکترونیکی، گروه های خبری، اسناد HTML، پایگاه های متنی و… بازیابی می شوند.
-
انتخاب اطلاعات و پیش پردازش:
در این مرحله به صورت خودکار خاصی از اسناد بازیابی شده، انتخاب و پیش پردازش می شوند.
این پیش پردازش می تواند کاهش کلمات به ریشه آنها، حذف کلمات زائد، پیدا کردن عبارات موجود در متن و تبدیل بازنمایی داده ها به قالب رابطه ای یا منطق مرتبه اول باشد.
-
تعمیم:
در این مرحله به صورت خودکار الگوهای عام در یک یا چندین سایت وب کشف می شود در این مرحله از تکنیک های داده کاوی و یادگیری ماشین برای تعمیم استفاده می شود.
-
تحلیل:
در این مرحله الگوهای به دست آمده در مرحله قبل اعتبارسنجی و تفسیر می شوند کاربران نقش مهمی در فرایند تحلیل ایفا می کنند.
وب کاوی و زمینه های تحقیقاتی مرتبط
- وب کاوی با زمینه های مختلف تحقیقاتی علوم کامپیوتر همچون
- داده کاوی
- پایگاه داده
- بازیابی اطلاعات
- هوش مصنوعی
- یادگیری ماشین
- پردازش زبان طبیعی
- استخراج اطلاعات
- انبار داده ها
- طراحی واسط کاربر و… در ارتباط تنگاتنگ است.
وب کاوی و داده کاوی
- وب کاوی و داده کاوی ارتباط بسیار نزدیکی با یکدیگر دارند.
- داده کاوی فرآیند ارائه پرس و جوها و استخراج الگوها و اطلاعات مفید و ناشناخته از داده هایی است که معمولاً در پایگاه داده ها ذخیر شده اند.
- بسیاری از تکنیک های داده کاوی قابل استفاده در وب کاوی هستند.
- حوزه وب کاوی وسیع تر از داده کاوی است.
#وب کاوی#داده کاوی#دانلود پاورپوینت وب کاوی#پاورپوینت وب کاوی
نقد و بررسیها
هیچ دیدگاهی برای این محصول نوشته نشده است.