sitemap یا نقشه سایت چیست؟

نقشه سایت یک فایل متنی بوده که می‌توان لیست صفحات وب‌سایت را در آن قرار داد و از آن جهت معرفی و فهماندن ساختار محتوای سایت به گوگل و سایر موتورهای جستجو استفاده کرد. ربات گوگل و البته سایر ربات‌های موتورهای جستجو از این فایل کمک می‌گیرند تا بتوانند بررسی دقیق‌تر و هوشمندانه‌تری را از سایت مربوطه داشته باشند.

sitemap

وظیفه اصلی ربات‌های موتورهای جستجو این است تمامی صفحات یک وب‌سایت را بررسی و فهرست بندی کنند، اما در عمل این کار به‌صورت صد درصد اتفاق نمی‌افتد، چون برخی از صفحات سایت‌ها هیچ لینک دهی از سایر صفحات (و یا سایر سایت‌ها) به آن‌ها نشده است و درنتیجه ربات‌ها نیز هرگز آن‌ها را پیدا نخواهند کرد. برای رفع این مشکل، یکی از ابزارهایی که به کمک ربات‌های موتورهای جستجو می‌آید پروتکل نقشه سایت است. یک طراح وب از طریق نقشه سایت می‌تواند ساختار و محتوای وب‌سایت خود را به گوگل و سایر موتورهای جستجو معرفی کند و حتی اگر صفحاتی در سایت باشند که هیچ لینک دهی به آن‌ها نشده باشد، ربات‌های موتورهای جستجو از طریق نقشه سایت خواهند توانست آن‌ها را به‌درستی پیدا، بررسی و فهرست بندی کنند.

همچنین برای هر صفحه‌ای از سایت که در نقشه سایت معرفی می‌شود نیز می‌توان یک سری اطلاعات اضافی دیگر مانند تاریخ آخرین بروز رسانی آن صفحه، هرچند وقت یک‌بار بروز شدن آن صفحه، میزان اهمیت صفحه و نحوه ارتباط با سایر صفحات سایت را نیز تعریف و در اختیار موتورهای جستجو قرار داد.

علاوه بر این موارد، به کمک نقشه سایت می‌توان اطلاعاتی را در خصوص نوع محتواهایی که در صفحات سایت به‌کاررفته‌اند مانند ویدئوها و یا تصاویر نیز به گوگل و سایر موتورهای جستجو ارائه کرد. به‌عنوان‌مثال در خصوص محتواهایی ویدئویی و عکس‌ها می‌توان این اطلاعات را در اختیار گوگل قرار داد:

اطلاعاتی که در خصوص یک ویدئو می‌توان در نقشه سایت ارائه کرد شامل: مدت‌زمان ویدئو، دسته‌بندی ویدئو و مشخص کردن اینکه این ویدئو برای چه رده سنی مناسب است.

اطلاعاتی که در خصوص یک تصویر می‌توان در نقشه سایت ارائه کرد: موضوع تصویر، نوع و فرمت تصویر و مجوز مربوط به آن می‌باشد.

آیا داشتن sitemap برای هر وب‌سایتی لازم است؟

اگر صفحات وب‌سایت به شیوه صحیح لینک شده باشند ربات‌های موتورهای جستجو معمولاً می‌توانند کل سایت را پوشش دهند. با این وجود نقشه سایت می‌تواند در عملکرد ربات‌ها تأثیر زیادی داشته باشد و روند بررسی ربات‌ها از سایت را بسیار بهبود ببخشد، خصوصاً اگر آن وب‌سایت دارای شرایط زیر باشد:

  • وب‌سایت‌های واقعاً بزرگ

اگر سایتی بسیار بزرگ باشد درنتیجه احتمال آن خیلی بالا می‌رود که ربات‌های گوگل از بررسی صفحات جدید یا صفحاتی که بروز رسانی شده‌اند چشم‌پوشی کند و اصلاً متوجه آن‌ها نشود.

  • سایت‌هایی که آرشیو بزرگی از صفحات محتوا دارند و این صفحات از یکدیگر مجزا بوده یا به‌خوبی به یکدیگر لینک نشده‌اند

اگر صفحات سایت به‌درستی و به‌طور طبیعی به یکدیگر لینک نشده باشند می‌توان ‌همگی را در نقشه سایت لیست کرد و مطمئن شد که گوگل همه صفحات را بررسی می‌کند و هیچ صفحه‌ای از دید آن مخفی نخواهد ماند.

  • سایت‌های جدید که لینک‌های خارجی کمی دارند (یا اصلاً ندارند)

ربات‌های گوگل و سایر ربات‌های موجود در وب، صفحات وب را توسط لینک‌هایی که از یک صفحه به صفحات دیگر داده ‌شده است پیدا کرده و سپس بررسی می‌کنند، بنابراین ممکن است گوگل از بررسی صفحاتی که هیچ لینکی از سایر سایت‌ها به آن‌ها نشده است چشم‌پوشی کند یا به عبارت دیگر اصلاً متوجه وجود آن‌ها نشود که بخواهد آن‌ها را بررسی کند.

 

استفاده از نقشه سایت به‌هیچ‌عنوان تضمین نمی‌کند همه آنچه که در آن لیست و ارائه ‌شده است بررسی و فهرست بندی شود، چراکه پردازش‌های گوگل مبتنی بر الگوریتم‌ها بسیار پیچیده آن است و طبق آن‌ها بررسی سایت‌های مختلف را برنامه‌ریزی و اجرا می‌کند. بااین‌وجود برای هر وب‌سایت بسیار مفید خواهد بود که یک نقشه سایت داشته باشید و البته به خاطر داشتن و استفاده از یک نقشه سایت هرگز توسط گوگل جریمه نخواهید شد.

نحوه ساخت و معرفی sitemap به گوگل

در این بخش یاد خواهید گرفت که چگونه یک نقشه سایت بسازید و آن را در دسترس گوگل قرار دهید:

۱٫اول از همه باید مشخص کنید که چه صفحاتی از سایت باید توسط ربات‌های گوگل بررسی شود. همچنین برای صفحاتی از سایت که توسط چند لینک قابل‌دسترس هستند باید لینک‌های اصلی و ارجح‌تر را مشخص کنید.

۲٫تصمیم بگیرد از چه نوع ساختار و فرمتی برای ایجاد نقشه سایت می‌خواهید استفاده کنید. نقشه سایت را می‌توان ‌هم به‌صورت دستی ایجاد کرد و هم می‌توان از ابزارهایی که برای این کار وجود دارند استفاده کرد.

۳٫پس از ایجاد نقشه سایت، می‌توان توسط ابزار تست نقشه سایت که گوگل در کنسول جستجو خود در اختیار مدیران وب‌سایت‌ها می‌گذارد، نقشه سایت ایجادشده را تست کرد.

۴٫پس از ایجاد و تست نقشه سایت، باید آن را در دسترس گوگل قرار داد که برای این کار باید آن را به فایل robots.txt سایت اضافه کرد و سپس در کنسول جستجو گوگل نیز آن را ارائه و معرفی کرد.

در ادامه به توضیح و آموزش کامل هر یک از این اقدامات خواهیم پرداخت.

انواع ساختارها و فرمت‌های مختلف برای نقشه سایت

گوگل از چندین فرمت مختلف برای نقشه سایت پشتیبانی می‌کند. در همه فرمت‌های مختلف حداکثر حجم مربوط به فایل یک نقشه سایت تکی ۱۰ مگابایت (بدون فشرده‌سازی) و حداکثر تعداد لینکی که می‌توان در آن ارائه کرد ۰۰۰,۵۰ لینک می‌باشد. درصورتی‌که حجم فایل نقشه سایت یا تعداد لینک‌های آن بیش از این مقادیر مجاز باشد باید آن را به چند فایل نقشه سایت تقسیم کرد و سپس یک فایل فهرست نقشه سایت ایجاد کرد و سپس داخل آن لینک کلیه نقشه‌های سایت را قرار داد. می‌توان برای گوگل چندین نقشه سایت یا حتی چندین فهرست نقشه سایت ایجاد و تعریف کرد.

  • XML

گوگل از پروتکل‌های استاندارد نقشه سایت کامل پشتیبانی می‌کند. همچنین گوگل از فرمت‌های مختلف xml برای منابعی چون ویدئو، تصاویر و … نیز پشتیبانی می‌کند. با به‌کارگیری این فرمت‌ها می‌توان فایل‌های ویدئویی، تصاویر و سایر محتواهایی که پردازش و بررسی آن‌ها سخت می‌باشد را بهتر توصیف کرد و به گوگل کمک کرد که چگونه این نوع محتواها را فهرست بندی و ذخیره کند.

نمونه کد ارائه‌شده در زیر یک نمونه ساده از نقشه سایت به زبان xml می‌باشد که شامل آدرس‌دهی یک لینک تکی، تاریخ آخرین بروز رسانی، دوره زمانی که معمولاً اطلاعات این صفحه بروز رسانی می‌شود و میزان اهمیت آن لینک می‌باشد:

 

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

 <url>

 <loc>http://www.example.com/foo.html</loc>

 <lastmod>2015-22-03T08:51:36Z</lastmod>

 <changefreq>daily</changefreq>

 <priority>0.5</priority>

 </url>

</urlset>

 

برچسب‌های استفاده شده در نقشه سایت XML

برخی از برچسب‌های استفاده شده در نقشه سایت اختیاری و برخی الزامی می‌باشند، به‌عنوان‌مثال نقشه سایت با برچسب <?xml> شروع و پایان می‌یابد، سپس برچسب <urlset> می‌آید که توسط صفت xmlns ساختار و پروتکل مورداستفاده برای کدهای XML را مشخص می‌کند و سپس لینک‌های سایت معرفی می‌شوند که هر لینک بین دو برچسب <url> و <loc> قرار می‌گیرد، کلیه این برچسب‌ها در نقشه سایت الزامی و سایر برچسب‌ها اختیاری می‌باشند. برچسب‌های استفاده شده در نمونه کد xml فوق به شرح زیر می‌باشند:

<?xml>

برچسب آغازین که الزامی بوده و version=”1.0″ و encoding=”UTF-8 در آن قرار می‌گیرند.

<urlset>

برچسب الزامی که پس از برچسب <?xml> می‌آید و پروتکل استاندارد مورداستفاده در نقشه سایت را توسط صفت xmlns مشخص می‌کند. در نقشه سایت نمونه فوق که فقط یک لینک عمومی از سایت معرفی شده است پروتکل زیر مورداستفاده قرار گرفته است:

xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″

چنانچه در لینک و صفحه‌ای که در نقشه سایت معرفی می‌کنید محتواهای دیگری مثل تصاویر یا ویدئو نیز ارائه‌شده باشد و بخواهید اطلاعاتی در خصوص آن‌ها نیز ارائه کنید بایستی ساختارهای مورداستفاده برای معرفی آن نوع محتواها را نیز توسط مقداردهی به صفت‌های xmlns جداگانه نیز مشخص کنید به‌عنوان‌مثال برای تصاویر:

xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″

و برای فایل‌های ویدئویی:

xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″

<url>

یک برچسب الزامی در نقشه سایت که به‌عنوان یک برچسب مادر شناخته می‌شود و اطلاعات مربوط به هر لینک سایت داخل این برچسب قرار می‌گیرد.

<loc>

برچسب الزامی در نقشه سایت که آدرس هر لینک از سایت که می‌خواهید در نقشه سایت معرفی کنید داخل این برچسب قرار می‌گیرد، لینک موردنظر باید به‌صورت کامل و دقیق داخل این برچسب نوشته شود. حداکثر طول مجاز ۲۰۴۸ کاراکتر است.

<lastmod>

استفاده از این برچسب در نقشه سایت اختیاری است و توسط آن تاریخ آخرین بروز رسانی انجام‌شده در صفحه مشخص می‌شود.

فرمت ساده برای مشخص کردن تاریخ YYYY-MM-DD است و یا می‌تواند به فرمت YYYY-MM-DDThh:mmTZD باشد و زمان و اختلاف‌زمانی را نیز مشخص کرد.

<changefreq>

استفاده از این برچسب اختیاری است و توسط آن بازه‌های زمانی که طی آن صفحه مربوط بروز رسانی و تغییر داده می‌شود را مشخص می‌کنیم.

مقادیری که در این برچسب ارائه می‌گردد صرفاً یک اطلاع‌رسانی کلی به موتورهای جستجو است و به‌عنوان یک دستور برای موتورهای جستجو نمی‌باشند و ممکن است با دوره‌های زمانی که ربات‌های موتورهای جستجو سایت و آن صفحه را بررسی می‌کنند هیچ ارتباط و تطابق دقیق نداشته باشد. به‌عنوان‌مثال ممکن است شما بازه زمانی بروز رسانی یک صفحه را روزانه مقداردهی کرده باشید اما آن صفحه در فواصل زمانی کمتری بارها موردبررسی قرار بگیرد و یا بازه زمانی بروز رسانی یک صفحه را ماهانه در نظر بگیرد اما آن صفحه در فواصل زمانی خیلی بیشتر از ماهیانه موردبررسی ربات‌ها قرار بگیرد و یا حتی برای صفحه‌ای که مشخص کرده باشید که هرگز بروز رسانی نخواهد شد اما بازهم توسط ربات‌ها موردبررسی قرار بگیرد.

مقادیر معتبر مورداستفاده در این برچسب عبارت‌اند از:

  1. always: همیشگی (صفحاتی که هرلحظه در حال تغییر می‌باشند)
  2. Hourly: ساعتی
  3. Daily: روزانه
  4. Weekly: هفتگی
  5. Monthly: ماهانه
  6. Yearly: سالانه
  7. Never: هرگز (صفحاتی که هیچ‌گاه بروز رسانی نخواهند شد)

<priority>

این برچسب اختیاری درجه اهمیت یک صفحه را نسبت به سایر صفحات مشخص می‌کند.

مقداردهی به این برچسب کمک می‌کند تا بتوانید برای موتورهای جستجو مشخص کنید کدام‌یک از صفحات سایتتان برای بررسی توسط ربات‌ها از اهمیت بیشتری برخوردار هستند. توجه داشته باشید که مقداردهی این برچسب برای صفحات سایت هیچ تأثیری در رتبه صفحات مربوطه در نتایج جستجوها نخواهد داشت و همچنین دادن مقادیر بالا به همه صفحات سایت نیز هیچ کمکی به شما نخواهد کرد.

مقادیری که برای این برچسب می‌توان مشخص کرد بین ۰٫۱ تا ۱٫۰ است و مقدار پیش‌فرض برای صفحات سایت ۰٫۵ می‌باشد.

نمونه کد دیگری که در ادامه ارائه‌شده است کمی پیچیده‌تر بوده و شامل معرفی یک لینک تکی از سایت و همچنین اطلاعاتی در خصوص یک تصویر و یک ویدئو که در آن صفحه قرار دارند می‌باشد:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″

xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″

xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″>

<url>

<loc>http://www.example.com/foo.html</loc>

<image:image>

<image:loc>http://example.com/image.jpg</image:loc>

<image:caption>Dogs playing poker</image:caption>

</image:image>

<video:video>

<video:content_loc>

</video:content_loc>

<video:player_loc allow_embed=”yes” autoplay=”ap=1″>

http://www.example.com/videoplayer.swf?video=123

</video:player_loc>

<video:thumbnail_loc>

http://www.example.com/thumbs/123.jpg

</video:thumbnail_loc>

<video:title>Grilling steaks for summer</video:title>

<video:description>

Cook the perfect steak every time.

</video:description>

</video:video>

</url>

</urlset>

 

  • mRSS, RSS و Atom 1.0

اگر وبلاگی دارید با فید RSS یا Atom، می‌توانید لینک فید سایت را به‌عنوان نقشه سایت معرفی کنید. اکثر نرم‌افزارهای وبلاگ ساز قادر به ساخت فید می‌باشند، اما این را هم بدانید که این فید فقط اطلاعات مربوط به لینک‌های جدید را ارائه می‌کند. به‌عنوان‌مثال آدرس فید دو نمونه از سیستم‌های وبلاگ دهی ایرانی، بلاگ فا و پرشین بلاگ را در زیر می‌توانید ملاحظه کنید:

http://BlogName.blogfa.com/rss.aspx

http://BlogNAme.persianblog.ir/rss.xml

گوگل فقط فید های RSS 2.0 و Atom 1.0 را پشتیبانی می‌کند. در خصوص ویدئوهای سایت نیز می‌توان از فید mrss استفاده کرد و توسط آن جزئیات مربوط به فایل‌های ویدئویی که در سایت استفاده شده است را در اختیار گوگل قرار داد.

  • Text

درصورتی‌که نقشه سایت فقط شامل لینک‌های صفحات است، می‌توان توسط یک فایل متنی ساده که در هر خط آن فقط یک لینک باشد نقشه سایت را ایجاد و در اختیار گوگل قرار داد به‌عنوان‌مثال:

http://www.example.com/file1.html

http://www.example.com/file2.html

چند نکته جهت به‌کارگیری یک فایل متنی ساده برای نقشه سایت:

  1. این فایل باید توسط فرمت UTF-8 ذخیره شود.
  2. فایل متنی فقط شامل فهرستی از لینک‌های صفحات سایت است ولا غیر
  3. این فایل متنی می‌تواند هر اسم دلخواهی داشته باشد اما حتماً باید با پسوند.txt ذخیره شود. به‌عنوان‌مثال txt
  • Google Sites

درصورتی‌که سایتی توسط سایت ساز گوگلراه‌اندازی شده باشید، خود گوگل به‌صورت خودکار نقشه سایت را برای آن ایجاد می‌کند. این نقشه سایت قابل‌ویرایش کردن توسط شما نیست اما اگر می‌خواهید گزارش‌ها و اطلاعات مربوط به این نقشه سایت را داشته باشید می‌توانید آن را در حساب کنسول جستجو خود به گوگل معرفی کنید. البته توجه داشته باشید که اگر در هر زیرشاخه اصلی این سایت بیش از ۱۰۰۰ صفحه داشته باشید ممکن است گزارش‌های نقشه سایت به‌طور صحیح و کامل نمایش داده نشود.

اگر سایت خود را توسط سایت ساز گوگل ایجاد کرده باشید، آدرس نقشه سایت ایجادشده مانند نمونه زیر خواهد بود:

http://sites.google.com/site/yoursitename/system/feeds/sitemap

 

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.