دنیای اینترنتی، در ساده ترین تعریف، عبارتست از کامپیوترهایی که در سراسر دنیا به
هم متصل هستند، شبکه ای که این کامپیوترها را به یکدیگر متصل می سازد، و
متدهای انتقال اطلاعات روی این شبکه.
منشاء اینترنت را می توان در
سالهای جنگ سرد یافت، زمانی که احتمال شروع یک جنگ هسته ای بین ایالات
متحده و اتحاد جماهیر شوروی کاملا وجود داشت. در آن سالها وزارت دفاع
آمریکا بدنبال یک سیستم مخابراتی بود که بتواند حتی در مقابل ضربات یک جنگ
اتمی دوام آورد و از هم نپاشد.
این پروژه که Arpanet نام گرفت،
در سال 1968 شروع شد. این شبکه در اولین قدم (محکم) خود چهار کامپیوتر را
در نقاط مختلف آمریکا به هم متصل کرد. خوب، این اقدام در آن سال ها بسیار
فوق العاده بود .
بزودی معلوم شد که چنین شبکه ای بطور بالقوه
دارای توانائیهای بسیار بیشتری از آنچه مسئولان وزارت دفاع در تصور
داشتند، است. تبادل اطلاعات علمی و مهندسی از این نمونه بود.
همچنین
معلوم شد که یک شبکه واحد هرگز نمی تواند به هدفی که برای آن در نظر گرفته
شده بود (توانایی مقاومت در مقابل ضربه هسته ای) دست یابد. به جای آن
تصمیم گرفته شد تا شبکه های موجود به هم متصل شوند و به عبارت دیگر شبکه
ای از شبکه ها ساخت شود. نام اینترنت هم از همین جا نشات گرفت. اینترنت
اولیه فقط دانشگاهها و مراکز تحقیقاتی را به هم متصل می کرد و چون تحت
کنترل دولت قرار داشت افراد و شرکتهای خصوصی راهی به آن نداشتند.
این
وضع تا سال 1991 ادامه داشت، اما از این تاریخ اوضاع بسرعت دگرگون شد. در
این سال بنیاد ملی علوم (NSF)، که بزرگترین تامین کننده مالی اینترنت بود،
سرمایه خود را از آن خارج کرد و اینترنت را بر روی شرکتهای تجاری گشود. و
بزودی سیل خروشانی ، که امروز آنرا می شناسیم تبدیل شد، و شروع این رشد
انفجاری با شبکه تارعنکبوتی جهانی (وب) همراه بود.
اینترنت یک چیز
مستقل نیست که دیگران کامپیوترهایشان را به آن متصل کنند. بلکه اینترنت
خود حاصل بهم پیوستن این کامپیوترهاست. در واقع وقتی به کامپیوترهای یک
سرویس دهنده اینترنت (ISP) متصل می شوید، کامپیوتر شما هم جزئی از اینترنت
می شود.
اینترنت به انواع بسیار گوناگونی از سرویس های مخابراتی ،
از خطوط ساده تلفنی گرفته تا کابل های نوری پر سرعت و کانال های ماهواره
ای، متکی است. اگر این کانال های مخابراتی را بزرگراه اینترنت بدانیم،
مسیریاب ها (routers ) کامپیوترهایی که بر انتقال اطلاعات بین نقاط مختلف
نظارت می کنند، پلیس های راهنمایی آن هستند.
ینترانت از نظر تکنولوژی و پروتکل های مورد استفاده اساساً شبیه اینترنت
است. فرق اینترانت با اینترنت این است که کامپیوترهای یک اینترانت اصولا
از سایر نقاط ایزوله هستند و در واقع یک شبکه محلی (LAN) محسوب می شوند.
البته این شبکه محلی می تواند دارای دسترسی به اینترنت هم باشد.
از
اینترانت معمولا در شرکتهایی که مایلند به اینترنت دسترسی داشته باشند ولی
نمی خواهند شبکه آنها از خارج قابل دسترسی باشد، استفاده می شود. معمولا
اتصال بین اینترانت و اینترنت از طریق یک فایروال (fire-wall) کامپیوتری
با یک نرم افزار خاص برای جلوگیری از ارتباطات غیر مجاز بین اینترانت و
اینترنت، صورت می گیرد.
ینترنت از ترکیب واژه های " Interconnected" و " Network" انتخاب شده است . ( شبکه های بهم مرتبط ).
اینترنت
فعالیت اولیه خود را از سال 1969 و با چهار دستگاه کامپیوتر میزبان (host)
آغاز و پس از رشد باورنکردنی خود ، تعداد کامپیوترهای میزبان در شبکه به
بیش از ده ها میلیون دستگاه رسیده است . اینترنت به هیچ سازمان و یا موسسه
خاصی در جهان تعلق ندارد. عدم تعلق اینترنت به یک سازمان ویا موسسه به
منزله عدم وجود سازمانها و انجمن های خاصی برای استانداردسازی نیست .یکی
از این انجمن ها، "انجمن اینترنت " است که در سال 1992 با هدف تبین سیاست
ها و پروتکل های مورد نظر جهت اتصال به شبکه تاسیس شده است
در اعماق وب
امروزه
در مورد اعماق وب یا وب عمیق بسیار صحبت می شود. وب یا همان شبکه جهانی
اینترنت امروزه دارای ماهیت پیچیده ای شده است که شامل اطلاعاتی از منابع
متفاوتی است. و این بیش از صفحات معمولی اینترنتی است که مشاهده می کنید.
در حقیقت قسمتی از وب می باشد که به طور دینامیک عرضه می شود و چیزی بیش
از صفحات ثابتی هستند که در اینترنت یافت می شوند. و به اشتباه بعضی ها آن
را به دلایلی که در ادامه مطلب به آنها اشاره می کنیم « وب نامرئی » یا
"invisible web" می نامند.
•محتویات بانکهای اطلاعاتی که در وب
قابل دسترسی هستند. بانکهای اطلاعاتی شامل اطلاعاتی هستند که در جداولی که
بوسیله نرم افزارهایی مانند Access , Oracle , SQL Server و DB2 بوجود
آمده اند و با درخواست شما قابل دستیابی هستند. مقدار قابل توجهی از
اطلاعات با ارزش در بانکهای اطلاعاتی تولید می شوند. تخمین ها نشان می دهد
که محتویات وب عمیق پانصد برابر بزرگتر از صفحات وب معمولی است.
•فایلهای غیر متنی یا none-textual مانند فایلهای صتوتی و تصویری، فایلهای گرافیکی و پرونده هایی مانند فایلهای PDF.
پدیده
بانکهای اطلاعاتی سالها قبل از این که اصطلاحات وب نامرئی یا وب عمیق
مصطلح شوند وجود داشته اند. همچنان که تکنولوژی پیشرفت می کند مقدار
بیشتری اطلاعات روی اینترنت قرار می گیرد و این بانکهای اطلاعاتی به عنوان
اولین ابزار پیدا کردن اطلاعات استفاده می شود.
همینطور که موتور های
جستجو مانند گوگل برای جمع آوری محتویات بانکهای اطلاعاتی در توابع جستجوی
خود راههای جدید پیدا می کنند مفهوم وب عمیق هم پیچیده تر می شود و این
شامل هر چیزی از اطلاعات پرواز تا پرونده های پستی می شود. به طوری که یک
موتور جستجوی پیشرفته مانند گوگل به قسمت کوچکی از اعماق وب ( یا همان وب
عمیق ) دسترسی دارد.
یک کمپانی به نام Bright Planet اولین بار
اصطلاح وب عمیق را بکار برد تا پدیده بانکهای اطلاعاتی قابل جستجو در
اینترنت را توصیف کند.
چند نکته برای کار با وب عمیق
زمانیکه با اعماق وب سر و کار دارید این نکات را بخاطر داشته باشید:
•اطلاعاتی
که باید در بانکهای اطلاعاتی ذخیره شوند جزئی از وب عمیق هستند. این
اطلاعات می تواند لیست بزرگی باشد از چیزهایی با یک موضوع مشخص و همچنین
همه دایرکتورها قسمتی از وب عمیق هستند.
-دفتر تلفنهای دیجیتال
-جستجو گر های اشخاص مانند لیست افراد بر اساس حرفه آنها از قبیل وکلا ، پزشکان و ...
-اختراعات
-قوانین
-دایره المعارف ها
-هر آنچه که در فروشگاه ها و حراجی ها اینترنتی به فروش می رسد.
-اشکال گرافیکی
-فایل های گرافیکی صوتی و تصویری
•اطلاعاتی که تازه هستند و مرتب تغییر می کنند قسمتی از وب عمیق هستند. این قسمت از وب عمیق شامل موارد زیر است:
-اخبار
-موقعیت های شغلی
-لیست پرواز شرکتهای هواپیمایی، اتاق های قابل رزرو هتل ها و غیره
-قیمت اجناس به صورت کلی و جزئی و ...
•یک
دایرکتوری موضوعی مناسب به سایتهای دارای بانک اطلاعاتی پیوند می دهند.
علت این است که هر یک از بانکهای اطلاعاتی در وب سایت های بخصوصی آدرس
داده شده اند. پس بسته به نیاز خود باید دایرکتوری مناسب را پیدا کنید.
•وب سایتهایی که از طریق آنها می توانید به بانکهای اطلاعاتی مورد نظر برسید خود بوسیله موتور های جستجو قابل دستیابی هستند
•بسیاری
از موتورهای جستجو و سایتهای پرتال بانکهای اطلاعاتی قابل جستجو را به
عنوان بخشی از پکیج خود در اختیار قرار می دهند. مثلاً AltaVista امکان
جستجوی جداگانه ای برای اخبار ، نقشه ها ، شغل ، حراجی ها ، هر آنچه قابل
خرید فروش باشد و ... در اختیار شما قرار می دهد. یا گوگل در سرویس جستجوی
خود یک بانک اطلاعاتی از فایلهای PDF و مطالب موجود در آن دارد.
•بعضی
از موتور های جستجو مشابه نتایج جستجوی شما را در اعماق وب پیدا می کنند.
مثلاً اگر "World Trade Center" را در گوگل جستجو کنید و سپس روی لینک
Images کلیک کنید فهرستی از صفحاتی که عکسی مرکز تجارت جهانی دارند را
برای شما نمایش می دهد.
•سر فصل ها در وب عمیق به شدت در حال تغییر هستند. این یک مبارزه سخت برای داشتن اطلاعات صحیح از بانکهای اطلاعاتی است.