گزارش های Crawl Stats

در گزارش های Crawl Stats در کنسول جستجو اطلاعاتی در خصوص فعالیت‌هایی که ربات گوگل در طی ۹۰ روز گذشته در سایت داشته است ارائه می‌گردد. این آمار و اطلاعات شامل همه انواع محتواهای موجود در سایت ازجمله عکس‌ها، فایل‌های PDF، فلش، جاوا اسکریپت و CSS ها می‌باشد که گوگل همگی را از سایت خوانده و دانلود کرده است. با یک مقاله آموزشی مفید دیگر از سلام وبمستر همراه باشید.

گزارش‌ها ارائه‌شده در بخش Crawl Stats

گزارش‌های ارائه‌شده در این بخش شامل سه قسمت است:

تعداد صفحاتی از سایت که ربات گوگل به‌صورت روزانه آن‌ها را بررسی کرده است.
حجم دانلود شده توسط ربات گوگل از صفحات سایت به‌صورت روزانه
مدت‌زمانی که گوگل صرف بررسی و دانلود صفحات سایت به‌صورت روزانه کرده است.

در این گزارش‌ها و اعداد و ارقام اعلام شده، نمی‌توان گفت چه عدد و رقمی برای تعداد و میزان بررسی انجام شده توسط ربات گوگل خوب یا بد است. چیزی که مهم است این است که هم‌زمان که سایتی رشد پیدا می‌کند بایستی به‌طور نسبی نمودار و آمار و ارقام ارائه‌شده در این بخش نیز افزایش یابد و اگر افزایش یا افت شدیدی در نمودار و اعداد مشاهده شد باید با دقت علت آن بررسی شود.

افت شدید نرخ بررسی سایت توسط ربات گوگل

به‌طورکلی در قسمت گزارش های Crawl Stats، نرخ بررسی سایت توسط ربات گوگل در طی یک یا دو هفته بایستی نسبتاً پایدار باشد و درصورتی‌که یک افت شدید ناگهانی مشاهده شد علت آن می‌تواند یکی از عوامل زیر باشد:

  ممکن است یک دستور جدید با دامنه محدودیتی وسیع در فایل txt اضافه شد باشد و درنتیجه دسترسی و مجوز ربات گوگل برای بررسی بخش اعظمی از سایت مسدود شده باشد. این عامل یکی از دلایل افت نرخ بررسی سایت در گزارش های Crawl Stats می باشد.

فایل txt را بررسی کنید و مطمئن شوید که دسترسی به منابع و فایل‌هایی که واقعاً نیاز است مسدود شده است. همچنین دقت کنید که ربات گوگل برای اینکه محتواهای موجود در سایت را کامل و بهرت متوجه شود نیاز دارد که به فایل‌های CSS و جاوا اسکریپت و برخی منابع دیگر که در سایت استفاده شده‌اند دسترسی داشته باشد، بنابراین بررسی کنید که دسترسی به این فایل‌ها نیز در فایل robots.txt مسدود نشده باشد.

یکی از دلایل دیگر مشاهده این اتفاق در گزارش های Crawl Stats این اتفاق می‌تواند وجود Html های ناقص در صفحات سایت باشد یا محتواهایی که اصلاً پشتیبانی نمی‌شوند. اگر ربات گوگل نتواند محتوای صفحه‌ای از سایت را تجزیه‌وتحلیل کند علت آن می‌تواند استفاده از انواع فایل‌های رسانه‌ای در آن صفحات باشد که قابل‌خواندن و پشتیبانی توسط ربات گوگل نمی‌باشند یا اینکه آن صفحه فقط شامل تصاویر است و درنتیجه ربات گوگل نتوانسته آن‌ها را بررسی کند. از ابزار Fetch as Google  استفاده کنید تا متوجه شوید که ربات گوگل چگونه صفحات سایت شمارا می‌بیند.

اگر سایتی به درخواست‌های مشاهده‌ای که توسط اشخاص مختلف به آن می‌رسد به‌کندی پاسخ دهد، ربات گوگل برای آنکه فشار و بارگذاری بیش از اندازه‌ای بر روی سرور آن سایت نگذارد درخواست‌های بررسی خود از آن سایت را کنسل می‌کند. گزارش‌های ارائه‌شده در نمودار سوم از Crawl Stats را بررسی کنید ببینید آیا سایت به‌کندی به درخواست‌ها پاسخ می‌دهد یا خیر.

درصورتی‌که نرخ خطاهایی اتصال به سرور سایت بالا برود، ربات گوگل درخواست‌های بررسی خود از سایت را کنسل می‌کند تا بار و فشار زیادی بر روی سرور وارد نکند. خطاهای مربوط به اتصال به سرور را از گزارش‌های ارائه‌شده در بخش crawl error بررسی کنید و ببینید آیا این خطاها افزایش یافته‌اند یا خیر.

بخش تنظیمات سایت در حساب کنسول جستجو را بررسی کنید و مطمئن شوید که حداکثر میزان درصد بررسی سایت توسط ربات گوگل را کاهش نداده باشید.

گزارش های Crawl Stats

اگر محتواهای سایت تغییرات بسیار کمی داشته باشند و یا کیفیت آن‌ها بسیار پایین باشد ممکن است آن سایت به‌صورت مکرر و منظم توسط گوگل بررسی نشود و اگر واقع‌بینانه و صادقانه به این سایت نگاه کنیم خواهیم پذیرفت که بازدیدکنندگان اصلاً با چنین سایتی ارتباط برقرار نخواهند کرد. در خصوص این نمونه سایت‌ها باید تجدیدنظر اساسی کنید و به این فکر کنید که چگونه می‌توانید سایت را به‌طورکلی بهبود ببخشید.

افزایش شدید و ناگهانی نرخ بررسی سایت توسط ربات گوگل

درصورتی‌که حجم بسیار بالایی از اطلاعات را یکجا وارد سایت کرده باشید و یا یک سری اطلاعات واقعاً مفید و کاربردی در سایت خود داشته باشید، ممکن است سایت شما بیشتر ازآنچه که توقع و انتظار آن را دارید توسط ربات گوگل بررسی شود.

چنانچه درخواست‌های بررسی که از سمت ربات گوگل به سرور سایت شما می‌آید به‌قدری زیاد باشد که باعث کندی سرور شود، با رعایت نکات زیر می‌توانید از نرخ بررسی ربات گوگل را کنترل کنید و از فشار و بار زیاد بر روی سرور سایت جلوگیری کنید:

قبل از هر چیز با بررسی گزارش‌های ارائه‌شده در بخش crawl state مطمئن شوید که تمام درخواست‌هایی که به سمت سرور سایت می‌آید از سمت ربات گوگل است و نه از سمت جایی دیگر. همچنین لاگ های مربوط به رفتار کاربران را توسط سیستم خود بررسی کنید و مطمئن شوید کلیه درخواست‌هایی که سمت سرور سایت می‌آید از سمت گوگل هستند یا درخواست‌های اسپمی می‌باشند که خود را جای درخواست‌های گوگل جا می‌زنند.

درصورتی‌که تصمیم دارید خیلی سریع و فوری درخواست‌های بررسی ربات گوگل از سایت را مسدود کنید کد وضعیت ۵۰۳ را در جواب درخواست‌ها برگردانید. که این کار براحتی در بخش گزارش های Crawl Stats قابل انجام است.

فایل txt سایت را دقیق تنظیم کنید تا دسترسی به صفحاتی که بررسی آن‌ها هیچ نیازی نمی‌باشد برای ربات گوگل مسدود شود.

به‌عنوان یک راهکار کوتاه‌مدت حداکثر میزان نرخ بررسی سایت توسط ربات گوگل را تنظیم کنید، گوگل ترجیح نمی‌دهید از این روش در طولانی‌مدت استفاده شود چراکه از این طریق نمی‌توان دقیقاً برای گوگل مشخص کرد که چه منابع و صفحاتی از سایت بررسی شوند و کدام‌یک نیازی به بررسی ندارند.

اگر در سایت خود صفحاتی دارید که شامل بی‌نهایت نتیجه و اطلاعات است، دسترسی به آن صفحات را برای ربات موتور جستجو توسط txt یا برچسب nofollow مسدود کنید. مثلاً نمایش یک تقویم در سایت که برای روزها و ماه‌ها و حتی سالیان بعد و قبل لینک و صفحه تولید می‌کند، یا صفحه‌ای که توسط یک جستجو در سایت حاصل می‌شود و بی‌نهایت مطلب و نتیجه را نمایش می‌دهد.

 

اگر در سایت صفحاتی وجود داشته که حذف و یا تغییر پیدا کرده‌اند، مطمئن شوید که برای درخواست‌هایی که برای بررسی آن‌ها ارسال می‌شود کدهای دستوری صحیح و مناسبی برگردانده می‌شود، مثلاً خطای ۴۰۴ یا ۴۱۰ برای لینک‌های که دیگر وجود ندارند یا غیر معتبر می‌باشند، ریدایرکت ۳۰۱ برای لینک‌هایی که تغییر نام داده‌شده‌اند و یا با سایر لینک‌ها جایگزین شده‌اند (یا ریدایرکت ۳۰۲ اگر این جایگزینی همیشگی نیست) یا ۵۰۳ برای قطع کردن و بروز رسانی‌های موقتی سایت و درنهایت در گزارش های Crawl Stats مطمئن شوید که سرور سایت برای مواردی که نمی‌تواند آن‌ها را مدیریت کند خطای ۵۰۰ را برگرداند.

کد ۵۰۳ به معنای غیرقابل ‌دسترس بودن سرور به دلیل ترافیک زیاد یا انجام به‌روزرسانی در سایت می‌باشد.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.