آبجی
19th February 2010, 01:41 PM
Google Sitemaps چيست ؟
موتورهاي جستجويي چون گوگل براي جمع آوري اطلاعات وب سايت هاي مختلف از نرم افزارهايي به نام عنكبوت (spider) استفاده مي كنند. وظيفه ي اين نرم افزارها اين است كه به هنگام ورود به يك وب سايت تمامي لينكهاي موجود در آن را شناسايي كرده و به سمت آنها هدايت شوند.
بدين ترتيب تمامي صفحات لينك داده شده، مرور شده و اطلاعات آنها در بانكهاي اطلاعاتي گوگل ذخيره مي گردد. اين نرم افزارها به صورت دوره اي اين وب سايت ها را مجددا بررسي مي كنند و از آخرين تغييرات اعمال شده در آنها مطلع مي گردند.
با استفاده از Google Sitemaps كه يكي از جديدترين امكانات موتور جستجوي گوگل است، ارتباط بين وب سايت و اين موتور جستجو بسيار دقيقتر بوده و به عمل به روز رساني اطلاعات در موتور جستجوي گوگل سرعت مي بخشد.
اين مقاله به معرفي اين ابزار مي پردازم و در مقالات آتي نحوه استفاده از آن را شرح خواهم داد.
عنكبوت هاي موتورهاي جستجو به راحتي رد لينكهاي صفحات پويا (dynamic) را نمي گيرند و اين بدان معني است كه در صورتي كه وب سايت شما شامل صفحاتي پوياست امكان ثبت نشدن بعضي از صفحات آن در موتورهاي جستجو وجود دارد.
در اين هنگام است كه Google Sitemaps به كمك شما مي آيد و كار معرفي چنين لينكهايي را انجام مي دهد.
وجود چنين تكنيكي به هيچ عنوان به اين معني نيست كه نحوه كار سنتي موتور جستجوگر گوگل از بين مي رود. اين تكنيك تنها روشي براي تسريع در عمل جمع آوري اطلاعات سايتها است و مجهز نبودن سايتها به اين ابزار به عنوان ضعف وب سايت مذكور تلقي نمي شود.
برنامه Google Sitemaps به صورت مجاني عرضه شده است و بايد به اين نكته توجه نمود كه استفاده از آن به هيچ عنوان در رتبه وب سايت شما در نتايج گوگل تاثيري نخواهد داشت.
اين برنامه در راستاي اهداف شركت گوگل طراحي شده است و اميد آن مي رود كه با استفاده از آن نتايج سودمندي به هنگام جستجوي وب مشاهده گردد.
لازم به ذكر است Google Sitemaps هنوز به عنوان ابزار رسمي معرفي نگرديده و تنها نسخه بتاي آن معرفي شده است.
نحوه استفاده از Google Sitemaps
براي استفاده از اين ابزار، طي مراحل زير الزاميست:
1. ساخت sitemap معتبر
2. اضافه كردن sitemap مذكور به حساب كاربري خود در Google Sitemaps
3. به روز نمودن فايل sitemap خود به هنگام تغيير در سايت خود
استفاده از Google Sitemaps براي همه وب سايتها امكان پذير است. لذا چه سايت شما در برگيرنده يك صفحه است و چه شامل ميليونها صفحه پوياست اين روش براي معرفي وب سايتتان به موتورهاي جستجو توصيه مي گردد.
ساخت sitemap
جهت ساخت sitemap سايت خود چندين راه وجود دارد. در زير به بعضي از اين راه ها اشاره شده است:
1. در صورتي كه ليست صفحات موجود در وب سايت خود را در فايل متني خاصي ذخيره كرده ايد، مي توانيد از نرم افزار Google Sitemap Generator براي sitemap سايت استفاده نماييد.
2. در صورتي كه امكان استفاده از نرم افزار Google Sitemap Generator را نداريد (براي مثال اگر زبان Python بر سرور شما نصب نمي باشد)، مي توانيد از نرم افزارهاي جانبي ديگر استفاده نماييد.
3. همچنين امكان آماده سازي sitemap به صورت دستي و بر اساس پروتكل sitemap نيز وجود دارد.
براي مشاهده sitemap نمونه شركت گوگل به اينجا مراجعه نماييد : http://www.google.com/sitemap.xml
http://www.irinfotech.com/articles/images/art-img/sample_xml.png
قالبهاي متفاوت sitemap قابل شناسايي براي گوگل
گوگل امكان شناسايي Sitemap هاي مختلفي را دارد ولي از بين انواع معرفي شده آن بهترين گزينه استفاده از sitemapهايي است كه از پروتكل Sitemap استفاده مي كنند.
دليل اين پيشنهاد آن است كه اولا با استفاده از اين پروتكل علاوه بر آدرس صفحات سايت، اطلاعات مربوط به هر يك از اين صفحات نيز قابل ثبت مي باشند.
ثانيا در صورت استفاده از پروتكل Sitemap ، ديگر موتورهاي جستجو نيز امكان استفاده از Sitemap طراحي شده را خواهند داشت.
پروتكل Sitemap :
اين قالب يك پروژه متن باز (Open Source) است كه توسط شركت گوگل و با استفاده از زبان xml طراحي شده است و همانطور كه پيش از اين نيز اشاره شد فايلهاي Sitemapي كه از اين پروتكل استفاده نمايند
علاوه بر نگهداري آدرس صفحات سايت امكان ذخيره سازي اطلاعات مربوط به هر صفحه را نيز دارا خواهند بود.
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
اين قالب، تنها براي سايت هايي توصيه مي گردد كه هم اكنون از اين پروتكل استفاده مي كنند.
Syndication feed
گوگل قابليت استفاده از RSS 2.0 و Atom 0.3 feeds را نيز دارا مي باشد. تنها در صورتي كه هم اكنون از وجود چنين فيد هايي در سايت خود بهره مي بريد، از اين روش استفاده نماييد.
لازم به ذكر است كه فيدها ممكن است تنها اطلاعات آخرين صفحات اضافه شده به سايت را ذخيره نمايند.
فايل متني
در اين قالب از يك فايل متني (Text File) كه در هر سطر آن آدرس يك صفحه ذكر شده است استفاده مي شود. در اين روش تنها آدرس صفحات ذخيره مي شوند و بر خلاف پروتكل Sitemap امكان افزوردن اطلاعات اضافي را ندارد.
پس از ساخت فايل Sitemap سايت خود مي بايست آن را در بخش كاربري خود در سايت گوگل ثبت نماييد.
محل قرارگيري فايل Sitemap
پس از ساخت فايل sitemap مي بايست آن را در وب سايت خود قرار دهيد. نرم افزارهاي جستجوگر گوگل تنها قادر به مرور صفحاتي از صفحات معرفي شده در sitemap هستند كه در سطح زيرين پوشه قرارگيري فايل sitemap قرار گرفته اند.
بدين معني كه اگر فايل sitemap شما در پوشه فرضي www.sitename.com/foo/ (http://www.sitename.com/foo/) قرار داشته باشد، نرم افزارهاي مذكور تنها قادر به مرور صفحات موجود در پوشه foo و پوشه هاي زيرين آن هستند و در صورتي كه در فايل sitemap شما آدرس صفحاتي موجود در ديگر پوشه هاي ريشه ثبت شده باشد، نرم افزارهاي جستجوگر به سراغ آن صفحات نخواهند رفت. لذا بهترين مكان براي قرارگيري فايل sitemap ريشه سايت است (در اينجا www.sitename.com (http://www.sitename.com/)) بدين ترتيب تمامي صفحات معرفي شده در sitemap توسط نرم افزارهاي جستجوگر مرور خواهند شد.
محتويات فايل Sitemap
به هنگام ساخت فايل sitemap به نكات زير دقت كنيد:
فايل sitemap امكان ذخيره سازي آدرس صفحات مختلف و يا آدرس sitemapهاي ديگر را دارد.
در صورتي كه فايل sitemap شامل آدرس sitemapهاي ديگر است مي بايست از روش خاصي براي معرفي آنها استفاده نمود و تعداد اين sitemapها نبايد از 1000 آدرس تجاوز كند. (روش معرفي sitemapها در مقالات آتي شرح داده خواهد شد.)
فايل sitemap نبايد بيشتر از 50000 آدرس را در خود ذخيره كند. علاوه بر آن حجم اين فايل در حالت معمولي (فشرده نشده) نبايد از 10 مگابايت بيشتر شود.
در صورت نياز به فايل بزرگتر ، به جاي استفاده از يك فايل از وجود چند فايل sitemap بهره ببريد.
تمامي آدرس هاي معرفي شده در فايل sitemap مي بايست از قاعده يكساني براي آدرس دهي استفاده كنند.
به عنوان مثال اگر آدرس يك صفحه را با http://www.sitename.com (http://www.sitename.com/) آغاز نموده ايد نبايد آدرس صفحه ديگر را با http://sitename.com (http://sitename.com/) آغاز نماييد.
به همين ترتيب براي آدرس دهي تمامي صفحات معرفي شده در sitemap بايد از يكي از روش هاي فوق استفاده گردد.
به هنگام معرفي صفحات سايت، آدرس آن را به طور كامل، به همراه پروتكل (براي مثال //:http) و مميزهاي الزامي ديگر مشخص نماييد.
در آدرس دهي از شماره جلسه (Session ID) استفاده نكنيد.
در آدرس دهي صفحات تنها مجاز به استفاده از كاراكترهاي اسكي خاصي هستيد و استفاده از كد برخي از كنترلها و كاراكترهاي خاص غير مجاز مي باشد.
در صورت معتبر نبودن فايل sitemap ساخته شده، به هنگام معرفي آن به گوگل با پيغام خطاي مربوط به آن روبرو خواهيد شد.
تا اينجا تنها به معرفي ابزار Google Sitemaps پرداختيم. در مقالات بعدي بيشتر با نحوه استفاده از آن آشنا خواهيد شد.
موتورهاي جستجويي چون گوگل براي جمع آوري اطلاعات وب سايت هاي مختلف از نرم افزارهايي به نام عنكبوت (spider) استفاده مي كنند. وظيفه ي اين نرم افزارها اين است كه به هنگام ورود به يك وب سايت تمامي لينكهاي موجود در آن را شناسايي كرده و به سمت آنها هدايت شوند.
بدين ترتيب تمامي صفحات لينك داده شده، مرور شده و اطلاعات آنها در بانكهاي اطلاعاتي گوگل ذخيره مي گردد. اين نرم افزارها به صورت دوره اي اين وب سايت ها را مجددا بررسي مي كنند و از آخرين تغييرات اعمال شده در آنها مطلع مي گردند.
با استفاده از Google Sitemaps كه يكي از جديدترين امكانات موتور جستجوي گوگل است، ارتباط بين وب سايت و اين موتور جستجو بسيار دقيقتر بوده و به عمل به روز رساني اطلاعات در موتور جستجوي گوگل سرعت مي بخشد.
اين مقاله به معرفي اين ابزار مي پردازم و در مقالات آتي نحوه استفاده از آن را شرح خواهم داد.
عنكبوت هاي موتورهاي جستجو به راحتي رد لينكهاي صفحات پويا (dynamic) را نمي گيرند و اين بدان معني است كه در صورتي كه وب سايت شما شامل صفحاتي پوياست امكان ثبت نشدن بعضي از صفحات آن در موتورهاي جستجو وجود دارد.
در اين هنگام است كه Google Sitemaps به كمك شما مي آيد و كار معرفي چنين لينكهايي را انجام مي دهد.
وجود چنين تكنيكي به هيچ عنوان به اين معني نيست كه نحوه كار سنتي موتور جستجوگر گوگل از بين مي رود. اين تكنيك تنها روشي براي تسريع در عمل جمع آوري اطلاعات سايتها است و مجهز نبودن سايتها به اين ابزار به عنوان ضعف وب سايت مذكور تلقي نمي شود.
برنامه Google Sitemaps به صورت مجاني عرضه شده است و بايد به اين نكته توجه نمود كه استفاده از آن به هيچ عنوان در رتبه وب سايت شما در نتايج گوگل تاثيري نخواهد داشت.
اين برنامه در راستاي اهداف شركت گوگل طراحي شده است و اميد آن مي رود كه با استفاده از آن نتايج سودمندي به هنگام جستجوي وب مشاهده گردد.
لازم به ذكر است Google Sitemaps هنوز به عنوان ابزار رسمي معرفي نگرديده و تنها نسخه بتاي آن معرفي شده است.
نحوه استفاده از Google Sitemaps
براي استفاده از اين ابزار، طي مراحل زير الزاميست:
1. ساخت sitemap معتبر
2. اضافه كردن sitemap مذكور به حساب كاربري خود در Google Sitemaps
3. به روز نمودن فايل sitemap خود به هنگام تغيير در سايت خود
استفاده از Google Sitemaps براي همه وب سايتها امكان پذير است. لذا چه سايت شما در برگيرنده يك صفحه است و چه شامل ميليونها صفحه پوياست اين روش براي معرفي وب سايتتان به موتورهاي جستجو توصيه مي گردد.
ساخت sitemap
جهت ساخت sitemap سايت خود چندين راه وجود دارد. در زير به بعضي از اين راه ها اشاره شده است:
1. در صورتي كه ليست صفحات موجود در وب سايت خود را در فايل متني خاصي ذخيره كرده ايد، مي توانيد از نرم افزار Google Sitemap Generator براي sitemap سايت استفاده نماييد.
2. در صورتي كه امكان استفاده از نرم افزار Google Sitemap Generator را نداريد (براي مثال اگر زبان Python بر سرور شما نصب نمي باشد)، مي توانيد از نرم افزارهاي جانبي ديگر استفاده نماييد.
3. همچنين امكان آماده سازي sitemap به صورت دستي و بر اساس پروتكل sitemap نيز وجود دارد.
براي مشاهده sitemap نمونه شركت گوگل به اينجا مراجعه نماييد : http://www.google.com/sitemap.xml
http://www.irinfotech.com/articles/images/art-img/sample_xml.png
قالبهاي متفاوت sitemap قابل شناسايي براي گوگل
گوگل امكان شناسايي Sitemap هاي مختلفي را دارد ولي از بين انواع معرفي شده آن بهترين گزينه استفاده از sitemapهايي است كه از پروتكل Sitemap استفاده مي كنند.
دليل اين پيشنهاد آن است كه اولا با استفاده از اين پروتكل علاوه بر آدرس صفحات سايت، اطلاعات مربوط به هر يك از اين صفحات نيز قابل ثبت مي باشند.
ثانيا در صورت استفاده از پروتكل Sitemap ، ديگر موتورهاي جستجو نيز امكان استفاده از Sitemap طراحي شده را خواهند داشت.
پروتكل Sitemap :
اين قالب يك پروژه متن باز (Open Source) است كه توسط شركت گوگل و با استفاده از زبان xml طراحي شده است و همانطور كه پيش از اين نيز اشاره شد فايلهاي Sitemapي كه از اين پروتكل استفاده نمايند
علاوه بر نگهداري آدرس صفحات سايت امكان ذخيره سازي اطلاعات مربوط به هر صفحه را نيز دارا خواهند بود.
OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)
اين قالب، تنها براي سايت هايي توصيه مي گردد كه هم اكنون از اين پروتكل استفاده مي كنند.
Syndication feed
گوگل قابليت استفاده از RSS 2.0 و Atom 0.3 feeds را نيز دارا مي باشد. تنها در صورتي كه هم اكنون از وجود چنين فيد هايي در سايت خود بهره مي بريد، از اين روش استفاده نماييد.
لازم به ذكر است كه فيدها ممكن است تنها اطلاعات آخرين صفحات اضافه شده به سايت را ذخيره نمايند.
فايل متني
در اين قالب از يك فايل متني (Text File) كه در هر سطر آن آدرس يك صفحه ذكر شده است استفاده مي شود. در اين روش تنها آدرس صفحات ذخيره مي شوند و بر خلاف پروتكل Sitemap امكان افزوردن اطلاعات اضافي را ندارد.
پس از ساخت فايل Sitemap سايت خود مي بايست آن را در بخش كاربري خود در سايت گوگل ثبت نماييد.
محل قرارگيري فايل Sitemap
پس از ساخت فايل sitemap مي بايست آن را در وب سايت خود قرار دهيد. نرم افزارهاي جستجوگر گوگل تنها قادر به مرور صفحاتي از صفحات معرفي شده در sitemap هستند كه در سطح زيرين پوشه قرارگيري فايل sitemap قرار گرفته اند.
بدين معني كه اگر فايل sitemap شما در پوشه فرضي www.sitename.com/foo/ (http://www.sitename.com/foo/) قرار داشته باشد، نرم افزارهاي مذكور تنها قادر به مرور صفحات موجود در پوشه foo و پوشه هاي زيرين آن هستند و در صورتي كه در فايل sitemap شما آدرس صفحاتي موجود در ديگر پوشه هاي ريشه ثبت شده باشد، نرم افزارهاي جستجوگر به سراغ آن صفحات نخواهند رفت. لذا بهترين مكان براي قرارگيري فايل sitemap ريشه سايت است (در اينجا www.sitename.com (http://www.sitename.com/)) بدين ترتيب تمامي صفحات معرفي شده در sitemap توسط نرم افزارهاي جستجوگر مرور خواهند شد.
محتويات فايل Sitemap
به هنگام ساخت فايل sitemap به نكات زير دقت كنيد:
فايل sitemap امكان ذخيره سازي آدرس صفحات مختلف و يا آدرس sitemapهاي ديگر را دارد.
در صورتي كه فايل sitemap شامل آدرس sitemapهاي ديگر است مي بايست از روش خاصي براي معرفي آنها استفاده نمود و تعداد اين sitemapها نبايد از 1000 آدرس تجاوز كند. (روش معرفي sitemapها در مقالات آتي شرح داده خواهد شد.)
فايل sitemap نبايد بيشتر از 50000 آدرس را در خود ذخيره كند. علاوه بر آن حجم اين فايل در حالت معمولي (فشرده نشده) نبايد از 10 مگابايت بيشتر شود.
در صورت نياز به فايل بزرگتر ، به جاي استفاده از يك فايل از وجود چند فايل sitemap بهره ببريد.
تمامي آدرس هاي معرفي شده در فايل sitemap مي بايست از قاعده يكساني براي آدرس دهي استفاده كنند.
به عنوان مثال اگر آدرس يك صفحه را با http://www.sitename.com (http://www.sitename.com/) آغاز نموده ايد نبايد آدرس صفحه ديگر را با http://sitename.com (http://sitename.com/) آغاز نماييد.
به همين ترتيب براي آدرس دهي تمامي صفحات معرفي شده در sitemap بايد از يكي از روش هاي فوق استفاده گردد.
به هنگام معرفي صفحات سايت، آدرس آن را به طور كامل، به همراه پروتكل (براي مثال //:http) و مميزهاي الزامي ديگر مشخص نماييد.
در آدرس دهي از شماره جلسه (Session ID) استفاده نكنيد.
در آدرس دهي صفحات تنها مجاز به استفاده از كاراكترهاي اسكي خاصي هستيد و استفاده از كد برخي از كنترلها و كاراكترهاي خاص غير مجاز مي باشد.
در صورت معتبر نبودن فايل sitemap ساخته شده، به هنگام معرفي آن به گوگل با پيغام خطاي مربوط به آن روبرو خواهيد شد.
تا اينجا تنها به معرفي ابزار Google Sitemaps پرداختيم. در مقالات بعدي بيشتر با نحوه استفاده از آن آشنا خواهيد شد.