MAHDIAR
20th December 2009, 09:29 PM
امروزه در مورد اعماق وب يا وب عميق بسيار صحبت مي شود. وب يا همان شبكه جهاني اينترنت امروزه داراي ماهيت پيچيده اي شده است كه شامل اطلاعاتي از منابع متفاوتي است. و اين بيش از صفحات معمولي اينترنتي است كه مشاهده مي كنيد. در حقيقت قسمتي از وب مي باشد كه به طور ديناميك عرضه مي شود و چيزي بيش از صفحات ثابتي هستند كه در اينترنت يافت مي شوند. و به اشتباه بعضي ها آن را به دلايلي كه در ادامه مطلب به آنها اشاره مي كنيم « وب نامرئي » يا "invisible web" مي نامند.
محتويات بانكهاي اطلاعاتي كه در وب قابل دسترسي هستند. بانكهاي اطلاعاتي شامل اطلاعاتي هستند كه در جداولي كه بوسيله نرم افزارهايي مانند Access , Oracle , SQL Server و DB2 بوجود آمده اند و با درخواست شما قابل دستيابي هستند. مقدار قابل توجهي از اطلاعات با ارزش در بانكهاي اطلاعاتي توليد مي شوند. تخمين ها نشان مي دهد كه محتويات وب عميق پانصد برابر بزرگتر از صفحات وب معمولي است.
فايلهاي غير متني يا none-textual مانند فايلهاي صتوتي و تصويري، فايلهاي گرافيكي و پرونده هايي مانند فايلهاي PDF.
پديده بانكهاي اطلاعاتي سالها قبل از اين كه اصطلاحات وب نامرئي يا وب عميق مصطلح شوند وجود داشته اند. همچنان كه تكنولوژي پيشرفت مي كند مقدار بيشتري اطلاعات روي اينترنت قرار مي گيرد و اين بانكهاي اطلاعاتي به عنوان اولين ابزار پيدا كردن اطلاعات استفاده مي شود.
همينطور كه موتور هاي جستجو مانند گوگل براي جمع آوري محتويات بانكهاي اطلاعاتي در توابع جستجوي خود راههاي جديد پيدا مي كنند مفهوم وب عميق هم پيچيده تر مي شود و اين شامل هر چيزي از اطلاعات پرواز تا پرونده هاي پستي مي شود. به طوري كه يك موتور جستجوي پيشرفته مانند گوگل به قسمت كوچكي از اعماق وب ( يا همان وب عميق ) دسترسي دارد.
يك كمپاني به نام Bright Planetاولين بار اصطلاح وب عميق را بكار برد تا پديده بانكهاي اطلاعاتي قابل جستجو در اينترنت را توصيف كند.
چند نكته براي كار با وب عميق
زمانيكه با اعماق وب سر و كار داريد اين نكات را بخاطر داشته باشيد:
اطلاعاتي كه بايد در بانكهاي اطلاعاتي ذخيره شوند جزئي از وب عميق هستند. اين اطلاعات مي تواند ليست بزرگي باشد از چيزهايي با يك موضوع مشخص و همچنين همه دايركتورها قسمتي از وب عميق هستند.
-دفتر تلفنهاي ديجيتال
-جستجو گر هاي اشخاص مانند ليست افراد بر اساس حرفه آنها از قبيل وكلا ، پزشكان و ...
-اختراعات
-قوانين
-دايره المعارف ها
-هر آنچه كه در فروشگاه ها و حراجي ها اينترنتي به فروش مي رسد.
-اشكال گرافيكي
-فايل هاي گرافيكي صوتي و تصويري
اطلاعاتي كه تازه هستند و مرتب تغيير مي كنند قسمتي از وب عميق هستند. اين قسمت از وب عميق شامل موارد زير است:
-اخبار
-موقعيت هاي شغلي
-ليست پرواز شركتهاي هواپيمايي، اتاق هاي قابل رزرو هتل ها و غيره
-قيمت اجناس به صورت كلي و جزئي و ...
يك دايركتوري موضوعي مناسب به سايتهاي داراي بانك اطلاعاتي پيوند مي دهند. علت اين است كه هر يك از بانكهاي اطلاعاتي در وب سايت هاي بخصوصي آدرس داده شده اند. پس بسته به نياز خود بايد دايركتوري مناسب را پيدا كنيد.
وب سايتهايي كه از طريق آنها مي توانيد به بانكهاي اطلاعاتي مورد نظر برسيد خود بوسيله موتور هاي جستجو قابل دستيابي هستند
بسياري از موتورهاي جستجو و سايتهاي پرتال بانكهاي اطلاعاتي قابل جستجو را به عنوان بخشي از پكيج خود در اختيار قرار مي دهند. مثلاً AltaVista (http://www.altavista.com/) امكان جستجوي جداگانه اي براي اخبار ، نقشه ها ، شغل ، حراجي ها ، هر آنچه قابل خريد فروش باشد و ... در اختيار شما قرار مي دهد. يا گوگل (http://google.com/) در سرويس جستجوي خود يك بانك اطلاعاتي از فايلهاي PDF و مطالب موجود در آن دارد.
بعضي از موتور هاي جستجو مشابه نتايج جستجوي شما را در اعماق وب پيدا مي كنند. مثلاً اگر "World Trade Center" (http://www.google.com/search?q=%22World+Trade+Center%22&btnG=Google+Search) را در گوگل جستجو كنيد و سپس روي لينك Images كليك كنيد فهرستي از صفحاتي كه عكسي مركز تجارت جهاني دارند را براي شما نمايش مي دهد.
سر فصل ها در وب عميق به شدت در حال تغيير هستند. اين يك مبارزه سخت براي داشتن اطلاعات صحيح از بانكهاي اطلاعاتي است.
منابع وب عميق
همانطور كه اشاره شد سايتهاي با محتواي وب عميق مي توانند از دايركتوري هاي موضوعي و موتورهاي جستجو يافت شوند. به علاوه وب سايتهايي هستند كه اختصاصاً روي جمع آوري آدرسها و لينكهاي بانكهاي اطلاعاتي كار مي كنند. البته توجه داشته باشيد كه هر آنچه در اين سايتها پيدا مي كنيد مربوط به وب عميق نمي شود. هيچ كدام از اين سايتها نمي توانند به طور دائم و كافي در دسترسي شما به اعماق وب را ضمانت كنند. ولي به عنوان مكمل موتورهاي جستجو و دايركتوري ها بسيار مفيد واقع مي شوند.
در اينجا چند آدرس براي كمك به شما ارائه مي شود:
داراي يك سيستم جستجو براي دستيابي به هزاران موتور جستجوCompletePlanet (http://aip.completeplanet.com/)منبع بزرگي از آدرسها و لينكهاي جمع آوري شده به منابع تحقيقاتي مختلفDirect Search (http://www.freepint.com/gary/direct.htm)يك دايركتوري از منابع عالي براي وب عميقInvisible-web.net (http://www.invisible-web.net/)يك متا موتور كه بر اساس موضوع در وب عميق به طور عمودي جستجو در اعماق وب را انجام مي دهد.ProFusion (http://www.profusion.com/)
اگر به اين موضوع علاقه مند شده ايد CompletePlanet (http://aip.completeplanet.com/) جزئيات بيشتري در مورد وب عميق در اختيار شما قرار مي دهد. مخصوصاً قسمت Deep Web FAQ را حتماً ببينيد. همچنين يك مجموعه ازمنابع وب عميق در Deep Web Research (http://www.deepwebresearch.info/) يافت مي شود.
محتويات بانكهاي اطلاعاتي كه در وب قابل دسترسي هستند. بانكهاي اطلاعاتي شامل اطلاعاتي هستند كه در جداولي كه بوسيله نرم افزارهايي مانند Access , Oracle , SQL Server و DB2 بوجود آمده اند و با درخواست شما قابل دستيابي هستند. مقدار قابل توجهي از اطلاعات با ارزش در بانكهاي اطلاعاتي توليد مي شوند. تخمين ها نشان مي دهد كه محتويات وب عميق پانصد برابر بزرگتر از صفحات وب معمولي است.
فايلهاي غير متني يا none-textual مانند فايلهاي صتوتي و تصويري، فايلهاي گرافيكي و پرونده هايي مانند فايلهاي PDF.
پديده بانكهاي اطلاعاتي سالها قبل از اين كه اصطلاحات وب نامرئي يا وب عميق مصطلح شوند وجود داشته اند. همچنان كه تكنولوژي پيشرفت مي كند مقدار بيشتري اطلاعات روي اينترنت قرار مي گيرد و اين بانكهاي اطلاعاتي به عنوان اولين ابزار پيدا كردن اطلاعات استفاده مي شود.
همينطور كه موتور هاي جستجو مانند گوگل براي جمع آوري محتويات بانكهاي اطلاعاتي در توابع جستجوي خود راههاي جديد پيدا مي كنند مفهوم وب عميق هم پيچيده تر مي شود و اين شامل هر چيزي از اطلاعات پرواز تا پرونده هاي پستي مي شود. به طوري كه يك موتور جستجوي پيشرفته مانند گوگل به قسمت كوچكي از اعماق وب ( يا همان وب عميق ) دسترسي دارد.
يك كمپاني به نام Bright Planetاولين بار اصطلاح وب عميق را بكار برد تا پديده بانكهاي اطلاعاتي قابل جستجو در اينترنت را توصيف كند.
چند نكته براي كار با وب عميق
زمانيكه با اعماق وب سر و كار داريد اين نكات را بخاطر داشته باشيد:
اطلاعاتي كه بايد در بانكهاي اطلاعاتي ذخيره شوند جزئي از وب عميق هستند. اين اطلاعات مي تواند ليست بزرگي باشد از چيزهايي با يك موضوع مشخص و همچنين همه دايركتورها قسمتي از وب عميق هستند.
-دفتر تلفنهاي ديجيتال
-جستجو گر هاي اشخاص مانند ليست افراد بر اساس حرفه آنها از قبيل وكلا ، پزشكان و ...
-اختراعات
-قوانين
-دايره المعارف ها
-هر آنچه كه در فروشگاه ها و حراجي ها اينترنتي به فروش مي رسد.
-اشكال گرافيكي
-فايل هاي گرافيكي صوتي و تصويري
اطلاعاتي كه تازه هستند و مرتب تغيير مي كنند قسمتي از وب عميق هستند. اين قسمت از وب عميق شامل موارد زير است:
-اخبار
-موقعيت هاي شغلي
-ليست پرواز شركتهاي هواپيمايي، اتاق هاي قابل رزرو هتل ها و غيره
-قيمت اجناس به صورت كلي و جزئي و ...
يك دايركتوري موضوعي مناسب به سايتهاي داراي بانك اطلاعاتي پيوند مي دهند. علت اين است كه هر يك از بانكهاي اطلاعاتي در وب سايت هاي بخصوصي آدرس داده شده اند. پس بسته به نياز خود بايد دايركتوري مناسب را پيدا كنيد.
وب سايتهايي كه از طريق آنها مي توانيد به بانكهاي اطلاعاتي مورد نظر برسيد خود بوسيله موتور هاي جستجو قابل دستيابي هستند
بسياري از موتورهاي جستجو و سايتهاي پرتال بانكهاي اطلاعاتي قابل جستجو را به عنوان بخشي از پكيج خود در اختيار قرار مي دهند. مثلاً AltaVista (http://www.altavista.com/) امكان جستجوي جداگانه اي براي اخبار ، نقشه ها ، شغل ، حراجي ها ، هر آنچه قابل خريد فروش باشد و ... در اختيار شما قرار مي دهد. يا گوگل (http://google.com/) در سرويس جستجوي خود يك بانك اطلاعاتي از فايلهاي PDF و مطالب موجود در آن دارد.
بعضي از موتور هاي جستجو مشابه نتايج جستجوي شما را در اعماق وب پيدا مي كنند. مثلاً اگر "World Trade Center" (http://www.google.com/search?q=%22World+Trade+Center%22&btnG=Google+Search) را در گوگل جستجو كنيد و سپس روي لينك Images كليك كنيد فهرستي از صفحاتي كه عكسي مركز تجارت جهاني دارند را براي شما نمايش مي دهد.
سر فصل ها در وب عميق به شدت در حال تغيير هستند. اين يك مبارزه سخت براي داشتن اطلاعات صحيح از بانكهاي اطلاعاتي است.
منابع وب عميق
همانطور كه اشاره شد سايتهاي با محتواي وب عميق مي توانند از دايركتوري هاي موضوعي و موتورهاي جستجو يافت شوند. به علاوه وب سايتهايي هستند كه اختصاصاً روي جمع آوري آدرسها و لينكهاي بانكهاي اطلاعاتي كار مي كنند. البته توجه داشته باشيد كه هر آنچه در اين سايتها پيدا مي كنيد مربوط به وب عميق نمي شود. هيچ كدام از اين سايتها نمي توانند به طور دائم و كافي در دسترسي شما به اعماق وب را ضمانت كنند. ولي به عنوان مكمل موتورهاي جستجو و دايركتوري ها بسيار مفيد واقع مي شوند.
در اينجا چند آدرس براي كمك به شما ارائه مي شود:
داراي يك سيستم جستجو براي دستيابي به هزاران موتور جستجوCompletePlanet (http://aip.completeplanet.com/)منبع بزرگي از آدرسها و لينكهاي جمع آوري شده به منابع تحقيقاتي مختلفDirect Search (http://www.freepint.com/gary/direct.htm)يك دايركتوري از منابع عالي براي وب عميقInvisible-web.net (http://www.invisible-web.net/)يك متا موتور كه بر اساس موضوع در وب عميق به طور عمودي جستجو در اعماق وب را انجام مي دهد.ProFusion (http://www.profusion.com/)
اگر به اين موضوع علاقه مند شده ايد CompletePlanet (http://aip.completeplanet.com/) جزئيات بيشتري در مورد وب عميق در اختيار شما قرار مي دهد. مخصوصاً قسمت Deep Web FAQ را حتماً ببينيد. همچنين يك مجموعه ازمنابع وب عميق در Deep Web Research (http://www.deepwebresearch.info/) يافت مي شود.