پاورپوینت وب نامرئی و وب عمیق (pptx) 19 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 19 اسلاید
قسمتی از متن PowerPoint (.pptx) :
بنام خدا
وب
نامرئی و وب عمیق
مقدمه
مرور نوشتارها حاكي از آن است كه به احتمال قريب به يقين عبارت «وب نامرئي» نخستين بار درسال 1994 توسط «ژيل السورث»ابداع شده است. البته معدودي از منابع نيز شخص ديگري به نام «متيوكل» را به عنوان مبدع اين اصطلاح معرفي ميكنند.
در خصوص وب نامرئي كلماتي نظير وب پنهان، وب عميق، وب تاريك، به طور مترادف در متون مختلف به كار برده شدهاند. اما اينها در حقيقت معادل يكديگر نيستند و هر يك به جنبهاي از نامرئي بودن اشاره
ميكنند.
وب نامرئی
یکی از
اصطلاحاتی
که اخیرا
از آن یاد میشود وب
نامرئی یا
invisible web
است
که البته اسم دیگرش
deep
وب هست. صفحات اینترنتی ای که ما به طور عادی می بینیم، وب سطحی نام دارند. افراد قبل از هر مرجع دیگری از وب برای جستجوی تحقیقاتشان استفاده می کنند. اما موتورهای جستجو لزوما بهترین نتایج را نمایش نمی دهند. آنها اطلاعات مخفی یا عمیق موجود در اینترنت را نمایش نمی دهند
.
اصطلاح وب نامرئی یا وب “ژرف” به مخزن عظیمی از اطلاعات اطلاق می شود که موتورهای جستجو به آنها دسترسی مستقیم ندارند به طور مثال پایگاه داده کتابخانه های دانشگاهها، سایتهایی که برای مشاهده آنها نیاز به رمز عبور داریم و سایتهایی که به هر دلیل، موتورهای جستجو از فهرست بندی آنها، منع شده اند. بر خلاف صفحات قابل مشاهده (یعنی همین وبی که می توانید توسط موتورهای جستجو ببینید) اطلاعاتی در پایگاههای داده موجود است که اسپایدرها و رباتهای خزنده بدانها دسترسی ندارند.
بعنوان نمونه، اغلب مردم گوگل را بعنوان دارنده بزرگترین پایگاه داده جستجو تصور می کنند که حدودا ۸ بیلیون صفحه را فهرست بندی کرده است. این رقم بزرگ است ولی اگر وب مخفی را در نظر بگیریم
این
رقم را بایستی در ۵۰۰ ضرب کنیم. بعلاوه گوگل فقط صفحات قابل جستجو را که حدودا ۲۵۰ بیلیون است ذخیره کرده است ولی از رقم دقیق صفحات غیر قابل جستجو خبری نیست.
وب ژرف چیست؟
آمارهای جالب:
– اطلاعات موجود در وب ژرف، بین ۴۰۰ تا ۵۵۰ برابر وب عمومی هستند که ما می بینیم
– وب ژرف حاوی ۷۵۰۰ ترابایت اطلاعات است، در مقابل وب سطحی ۱۹ ترابایت ذخیره کرده است
– وب ژرف دارای نزدیک به ۵۵۰ بیلیون مستند می باشد در حالیکه این رقم برای وب سطحی ۱ بیلیون است
– بیش از ۲۰۰ هزار وب سایت ژرف وجود دارند
– جالب است بدانید که بیش از نیمی از محتوای وب عمیق در عنوان سایتهایشان از کلمه
Database
استفاده کرده اند و اگر این کلمه را در جستجوهایتان بکار برید، امکان دسترسی تان را به این سایتها افزایش می دهید.
دسترسی به
وب عمیق
دسترسی
به آنچه که در لایه های پایین وب می گذرد زیاد ساده نیست. چرا که بیشتر ارتباط ها و خرید و فروش های اصلی توسط لینک ارتباطی امن بین طرفین برقرار می شود. ارتباطی که از نظرگاه همه موتورهای جستجوگر فرسنگ ها فاصله دارد. ولی وب سایت هایی هم هستند که عموم مردم را مورد هدف قرار می دهند. این وب سایت ها بر روی سرورهای
TOR
راه اندازی شده اند و از طریق مرورگرهای معمولی قابل دستیابی نیستند.
root name
این وب سایت ها اغلب
onion.
است که در
DNS
های
root
ثبت نشده و فقط بر روی سرورهای
TOR
تعریف شده است. همچنین
URL
آنها، بسادگی به یاد سپردنی نیست و هرچند وقت یکبار به کل تغییر می کند. اغلب این وبسایتها دارای صفحات سیاه رنگی حاوی چند متن مختصر هستند. یکی از مراجعی که اطلاعات دسته بندی شده این وب سایت ها را در اختیار کاربران میگذارد
HiddenWiki
است
.
همه چیز درباره وب عمیق یا پنهان
منظور از وب عمیق یا وب پنهان بخشی از شبکه جهان گستر وب است که منابع موجود در آن، خارج از حوزه جستجو و بازیابی مقدماتی موتورهای جستجوی عمومی قراردارد و بازیابی اطلاعات موجود در این بخش از محیط وب، با استفاده و جستجوی مستقیم از این موتورها میسر نیست. به عبارت دیگر امکان بازیابی منابع اطلاعاتی وب پنهان یا از نظر فنی برای موتورهای جستجو مقدور نیست و یا آنها به دلیل محدودیت های دیگر از دسترسی و ایندکس گذاری این منابع بازمانده اند.
برخی از دلایل عدم دسترسی به
وب عمیق یا پنهان
۱-
نقاطی
از وب هستند که به خاطر احتیاج به نام کاربری و رمز عبور امکان دسترسی به آنها وجود ندارد
.
۲-
برخی اطلاعات در صورتی قابل مشاهده می گردند که خریداری شوند، این بخش که به وب ملکی شهرت دارد نیز از دید موتورهای جستجوگر پنهان است
.
۳-
بخش
دیگری از وب نامرئی، به مجموعه ای از اطلاعات الکترونیکی پیوسته اطلاق میشود که آنها معمولا خارج از حوزه جستجوی موتورهای جستجوگر قرار دارند هریک از این پایگاه ها صفحه جستجوی مبتنی بر وب دارند، که امکان جستجو در آنها برای کاربران را فراهم می کند، اما خزنده های موتورهای جستجو توان ورود به آن ها را ندارند و در نتیجه حجم انبوهی از اطلاعات، نمایه نشده باقی می ماند
.
۴-
منابع
اطلاعاتی غیرمتنی نیز جزء وب پنهان بشمار میروند چون موتورهای جستجوگر برای ایندکس گذاری منابع ابرمتن
Hypertext
طراحی شده اند درحالیکه بسیاری از منابع موجود در وب در قالب های دیگر و معمولا غیرمتنی (تصویر، منابع دیداری شنیداری و …) ظاهر می شوند و امکان ایندکس گذاری آنها در موتورهای جستجوگر وجود ندارد
.
۵-
با
توجه به استفاده اغلب موتورهای جستجوگر از الگوریتم عنکبوتی، در صورتی که صفحه وبی به هیچ جا متصل نشده باشد، دسترسی به آن از طریق موتورهای جستجو غیرممکن است.
اهمیت وب عمیق
به دو دلیل می توان گفت که وب پنهان اهمیت دارد. نخست از نظر کمی باید گفت که حجم اطلاعات موجود در این بخش خیلی بیشتر از سطح آشکار است.
بهترین
موتورهای جستجو فقط قادر هستند که حدود ۱۶ درصد از اطلاعات موجود در وب را بازیابی کنند و بنابراین ۸۴ درصد آنها جزء وب پنهان به حساب میآیند.
اندازه وب نامرئی تقریباً ۵۰۰ برابر وب مرئی است. وب نامرئی ۵۵۰ میلیون سند و وب مرئی تقریباً یک میلیون سند را دارا می باشد. هر چند مطالعات انجام شده در این باره با یکدیگر متفاوتند اما بر اساس همه آنها دیپ وب از نظر داده ها بسیار غنی تر از وب معمولی یا وبی است که ما میشناسیم. میتوان گفت که کل وب یک کوه یخی است که دیپ وب قسمتی از آن است که در زیر آبها پنهان و
قسمت
دیگر که در سطح آب نمایان است همان وبی است که ایندکس شده است
.
و از منظر کیفی باید گفت:
اطلاعات
بخشهای مختلف این مجموعه به ویژه منابع اطلاعاتی موجود در وب عمیق، معمولاً منابع ارزشمند و مفیدی هستند و در بسیاری از موارد ﭘﺎسخگوی نیاز کاربران می باشند. تقریباً بیش از نیمی از وب نامرئی را ﭘﺎیگاه های اطلاعاتی موضوعی تشکیل میدهند.