خطاهای بخش site error در گوگل وبمستر قسمت crawl errors
بدون دیدگاه
1,375

همانطور که در مقاله Crawl Errors (خطاهای مربوط به بررسی سایت توسط ربات گوگل) اشاره کردیم هنگامی که ربات گوگل سایتی را بررسی می‌کند ممکن است با خطاهایی مواجه شود و همین خطاها ممکن است مانع نمایش سایت در نتایج جستجو شوند. گزارش‌های بخش Crawl Errors لینک‌های از وب‌سایت را ارائه می‌دهد که ربات گوگل نتوانسته صفحات مربوطه را بررسی کندکه شامل Site errors و  URL errors می شوند. در این مقاله می پردازیم به بررسی انواع خطاهای  Site Errors  که در بخش crawl error در گوگل وبمستر ممکن است به وبمستران نمایش داده شود

خطاهای مربوط به DNS سایت

خطای DNS بدان معناست که ربات گوگل نمی‌تواند با سرور سایت ارتباط برقرار کند و علت آن می‌تواند هم قطع بودن سرور سایت باشد و هم در مسیریابی سرور سایت مشکلی به وجود آمده باشد. اکثر هشدار یا خطاهای مربوط به DNS بر روی عملکرد ربات گوگل جهت دسترسی به سایت تأثیری نمی‌گذارند، اما این هشدار و خطاها می‌توانند نشانه‌ای از تأخیر بسیار بالا در دسترسی به سایت باشند که بر روی کاربران سایت تأثیر بالایی خواهند داشت.

جهت رفع خطاهای DNS ابتدا مطمئن شوید که گوگل می‌تواند سایت شمارا بررسی کند، به کمک ابزار Fetch as Google درخواست بررسی یکی از صفحات اصلی سایت خود مانند صفحه اصلی سایت را به گوگل بدهید، اگر محتوای صفحه بدون هیچ مشکلی برگردانده و به شما نمایش داده شود می‌توانید اطمینان حاصل کنید که گوگل قادر به دسترسی و ارتباط با سایت مربوطه می‌باشد. همچنین درصورتی‌که خطاهای DNS را به‌طور مداوم می‌بینید، از پشتیبانی هاست و سرور خود این وضعیت را پیگیری کنید.

انواع خطاهای DNS

  • DNS Timeout

این خطا نشان از این دارد که گوگل نتوانسته به سایت دسترسی پیدا کند زیرا سرور DNS نتوانسته میزبان ‌هاست را تشخیص دهید.

بایستی به کمک ابزار Fetch as Google بررسی کنید که آیا ربات گوگل می‌تواند به سایت دسترسی داشته باشد یا خیر، اگر محتوای صفحه اصلی سایت بدون هیچ خطا و مشکلی برگردانده شود می‌توان فرض را بر آن گذاشت که در حالت کلی گوگل به‌درستی به سایت موردنظر دسترسی دارد.

همچنین از طریق ثبت‌کننده دامنه و سروری که خدمات میزبانی سایت شمارا ارائه می‌کند بررسی کنید که DNS های مربوط به سایت به‌درستی تنظیم شده‌اند و سرور و فضای میزبانی سایت نیز به اینترنت متصل باشد.

  • DNS Lookup

برای این خطا نیز گوگل نتوانسته به سایت دسترسی پیدا کند زیرا سرور DNS نتوانسته میزبان ‌هاست را تشخیص دهید و بایستی همان اقدامات و بررسی‌های مربوط به خطای DNS Timeout را انجام دهید.

خطاهای مربوط به سرور سایت Server connectivity

زمانی که این نمونه خطا را برای لینک‌های سایت خود می‌بینید بدین معناست که ربات گوگل نتوانسته به لینک‌های سایت دسترسی داشته باشد یا به علت اینکه مدت‌زمان درخواست به پایان رسیده و هیچ جوابی از سمت سرور ارسال نشده است یا ترافیک و بار زیادی بر روی سایت بوده است و درنتیجه گوگل مجبور به رها کردن درخواست خود شده است.

رفع خطاهای مربوط به اتصال به سرور

جهت رفع خطاهای ناشی از اتصال به سرور سایت موارد زیر را موردبررسی قرار دهید:

  1. زمان بارگذاری بیش‌ازحد مربوط به درخواست‌های صفحات داینامیک را کاهش دهید.

زمانی که سایتی برای چندین لینک مختلف محتوای یکسانی را برمی‌گرداند به‌عنوان اینکه محتوا را به‌صورت دینامیک برمی‌گرداند در نظر گرفته می‌شود، به‌عنوان‌مثال محتوایی که توسط دو لینک زیر برگردانده می‌شوند کاملاً یکسان خواهند بود

www.example.com/shoes.php?color=red&size=7 www.example.com/shoes.php?size=7&color=red

نتایج این صفحات که به‌صورت دینامیک در سایت ایجاد می‌شوند معمولاً بیش‌ازحد زمان برده که در پاسخ درخواست‌های داده‌شده برگردانده شوند و یا اینکه سرور به خاطر فشار و بار زیاد ممکن است به ربات گوگل درخواست بررسی بسیار کندتر سایت را بدهد. به‌طورکلی پیشنهاد می‌شود پارامترهای استفاده شده در لینک‌ها را تا حد ممکن کوتاه در نظر بگیرد و تا جایی ممکن از آن‌ها کمتر استفاده کنید.

  1. مطمئن شوید سرور سایت قطع نباشد، بار بیش از اندازه روی آن نباشد و همچنین تنظیمات آن به‌درستی انجام‌شده باشد.

اگر مشکلات اتصال به سرور، زمان‌بندی ارسال پاسخ از سمت سرور و… همچنان باقی است از سمت شرکت میزبانی وب خود موضوع را پیگیری کنید و برای مدیریت ترافیک سایت نیز منابع مربوط به هاست و سرور سایت خود افزایش دهید.

  1. بررسی کنید که سهواً دسترسی گوگل به سایت را مسدود نکرده باشید.

ممکن است که شما ناخواسته دسترسی گوگل به سایت را به‌صورت سیستمی محدود کرده باشید مانند مشکل در پیکربندی DNS، تنظیمات نادرست فایروال سرور، تنظیمات مربوط به حفاظت Dos و یا برخی تنظیماتی که در سیستم‌های مدیریت محتوا وجود دارد. یکی از مهم‌ترین بخش‌هایی که در هر سرور ارائه‌دهنده خدمات میزبانی وب ارائه می‌گردد سیستم‌های حفاظتی و امنیتی می‌باشد و یکی از مهم‌ترین تنظیمات این سیستم‌ها مسدودسازی خودکار درخواست‌های بسیار زیادی است که از سمت یک IP به سمت سرور و سایت می‌آیند و ازآنجایی‌که تعداد درخواست‌هایی که توسط ربات گوگل برای بررسی یک سایت ارسال می‌شود نسب به تعداد درخواست‌های یک کاربر عادی بسیار بیشتر است، همین موضوع باعث می‌شود که این سیستم‌های امنیتی دسترسی‌های مربوط به ربات گوگل را مسدود کنند و اجاره بررسی سایت را به آن ندهند. برای رفع مواردی از این قبیل ابتدا باید بررسی کنید که کدام بخش از سایت و یا تنظیمات باعث این مسدودسازی شده است و سپس آن را رفع کنید. البته فایروال‌های فعال بر روی سرور ممکن است تحت کنترل و مدیریت شما نباشند و باید درخواست خود را از طریق سروری که خدمات هاست و میزبانی سایت شمارا فراهم می‌کند پیگیری کنید.

  1. عملیات بررسی و فهرست بندی اطلاعات سایت (crawling and indexing) توسط موتورهای جستجو را به‌دقت کنترل کنید.

برخی از مدیران وب‌سایت‌ها ممکن است مستقیماً و به‌صورت آگاهانه دسترسی ربات گوگل به سایت خود را مسدود کرده باشند (مثلاً به کمک یک فایروال که در قسمت قبلی توضیح داده شد) در این موارد معمولاً هدف مسدود کردن دسترسی کامل ربات گوگل نیست و فقط به‌منظور اینکه نحوه بررسی و فهرست کردن اطلاعات سایت توسط ربات گوگل کنترل شود این کار انجام می‌شود. اگر شما نیز چنین خواسته‌ای دارید می‌توانید برای کنترل بررسی محتوای سایت توسط ربات گوگل از قوانین و پروتکل‌های که برای محدود کردن ربات گوگل وجود دارد مانند فایل robots.txt استفاده کنید یا اگر می‌خواهید دسترسی خیلی از ربات‌های ناشناخته را کنترل و مسدود کنید می‌توانید از دستور user-agent در فایل robots.txt استفاده کنید و فقط به ربات گوگل اجازه دسترسی و بررسی سایت را بدهید.

همچنین اگر می‌خواهید نرخ بررسی سایت توسط ربات گوگل را تغییر دهید از بخش تنظیمات حساب کنسول جستجو خود توسط گزینه Crawl Rate می‌توانید این کار را انجام دهید.

انواع خطاهای مربوط به اتصال به سرور

  • Timeout

زمانی که درخواستی به سرور سایت ارسال می‌شود اگر سرور در مدت‌زمان مشخصی که برای آن تعریف شده است جوابی را در پاسخ به درخواست ارسال‌شده نفرستد این پیغام خطا (اتمام مهلت زمان پاسخ‌دهی و عدم دریافت هیچ پاسخی) داده می‌شود.

با مشاهده این خطا ابتدا توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

اگر این خطا و مشکل همچنان ادامه‌دار بود این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد که بایستی از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

  • Truncated headers

یا اصطلاحاً خطای عناوین کوتاه، زمانی رخ می‌دهد که گوگل به سرور سایت متصل شده است اما قبل از اینکه کل عنوان‌های سایت را به‌صورت کامل دریافت کند ارتباط قطع‌شده است. این خطا ممکن است لحظه‌ای و صرفاً به خاطر قطعی موقت سرور بوده باشد و می‌توانید پس از مدتی مجدداً این خطا را در حساب کنسول جستجو خود بررسی کنید.

در مورد این خطا نیز می‌توانید توسط ابزار Fetch as Google درخواست بررسی صفحه اصلی سایت خود را بدهید و درصورتی‌که کل محتوا صفحه نخست سایت بدون هیچ مشکلی به‌درستی بازگردانده شد می‌توان فرض را بر این گذاشت که گوگل به‌درستی به سایت شما دسترسی دارد.

چنانچه این خطا همچنان ادامه‌دار بود بایستی از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

  • Connection reset

مفهوم این خطا این است که سرور سایت با موفقیت درخواست بررسی گوگل را پردازش کرده است اما چون اتصال به سرور در زمان بازگشت اطلاعات قطع و وصل شده، هیچ محتوای برگردانده نشده است. این خطا نیز ممکن است موقتی بوده باشد و پیشنهاد می‌شود پس از مدتی مجدداً آن را بررسی کنید.

برای این خطا نیز ابتدا توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

اگر این خطا و مشکل همچنان ادامه‌دار بود این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد که بایستی از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

  • Truncated response

قبل از این‌که گوگل برای درخواست بررسی که به سرور سایت فرستاده است جواب کاملی دریافت کند، سرور سایت اتصال را قطع کرده است و درنتیجه کل محتوای مربوطه به‌صورت ناقص دریافت شده است و شما این خطا را مشاهده خواهید کرد.

برای این خطا نیز ابتدا توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

اگر این خطا و مشکل همچنان ادامه‌دار بود این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد که بایستی از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

  • Connection refused

رد شدن ارتباط: گوگل نتوانسته به سایت دسترسی پیدا کند چون سرور سایت درخواست اتصال ربات گوگل را کلاً رد کرده است. علت می‌تواند مسدود بودن دسترسی ربات گوگل توسط خود تنظیمات سرور باشد یا در تنظیمات فایروال سرور اشکال به وجود آمده و دسترسی ربات گوگل مسدود شده است.

برای این خطا نیز ابتدا توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

اگر این خطا و مشکل همچنان ادامه‌دار بود این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد که بایستی از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

  • Connect failed

این خطا نشان از آن است که به خاطر قطعی و یا عدم دسترس بودن شبکه گوگل اصلاً نتوانسته به سرور سایت متصل شود.

این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد. اگر این خطا و مشکل همچنان ادامه‌دار بود از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

همچنین توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

  • Connect timeout

گوگل نتوانسته به سرور سایت متصل شود.

توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

بررسی کنید که سرور سایت به اینترنت متصل باشد، همچنین این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد. اگر این خطا و مشکل همچنان ادامه‌دار بود از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

  • No response

زمانی این خطا نمایش داده می‌شود که گوگل به سرور سایت متصل شده اما قبل از اینکه سرور هیچ داده‌ای ارسال کند، اتصال قطع‌شده است.

توسط ابزار Fetch as Google بررسی کنید که آیا ربات گوگل به سایت دسترسی دارد و می‌تواند آن را بررسی کند یا خیر، اگر Fetch as Google صفحه اصلی سایت را بدون هیچ مشکلی برگرداند، می‌توانید فرض را بر این بگذارید که گوگل به‌درستی به سایت شما دسترسی دارد.

این احتمال وجود دارد که بار و فشار زیادی به بروی سرور سایت است و یا تنظیمات مربوط به سرور سایت به‌درستی انجام‌نشده باشد. اگر این خطا و مشکل همچنان ادامه‌دار بود از طریق شخص یا شرکتی که سرور و فضای میزبانی سایت را در اختیار شما گذاشته است مشکل را پیگیری کنید.

خطاهای مربوط به فایل robots.txt

این بخش مربوط به خطای دسترسی به فایل robots.txt سایت توسط ربات گوگل می‌باشد. قبل از اینکه ربات گوگل بخواهد سایتی را بررسی کند ابتدا این فایل را می‌خواند تا بداند کدام‌یک از صفحات سایت را نباید بررسی کند.

اگر این فایل وجود داشته باشد اما غیرقابل‌دسترس باشد (یا به عبارتی زمانی که ربات گوگل درخواست فایل robotx.txt را به سرور می‌دهد، کد وضعیت ۲۰۰ که به معنای موفقیت بودن درخواست است را دریافت نکند یا حتی کد وضعیت ۴۰۴ که به مفهوم عدم وجود چنین فایلی است را نیز از سرور دریافت نکند) ربات گوگل بررسی سایت را تا زمانی که مجدد به سایت برگردد و بتواند این فایل را بخواند به عقب می‌اندازد چون تا زمانی که این فایل وجود داشته باشد و گوگل نتواند آن را بخواند، نمی‌داند کدام‌یک از صفحات و لینک‌ها را نباید بررسی کند و ممکن است لینک‌ها و صفحاتی در این فایل تعریف شده باشند که اجازه دسترسی و بررسی آن‌ها برای ربات گوگل مسدود شده باشد.

رفع خطاهای مربوط به فایل robots.txt

جهت بررسی و رفع خطاهای مربوط به فایل robots.txt موارد زیر را بررسی کنید:

  1. همیشه نیازی به استفاده از فایل txt نیست.

فایل robots.txt اگرچه فقط برای ربات گوگل نبوده و برای همه ربات‌های موتورهای جستجو قابل‌فهم است و به دستورات آن برای خواندن یا نخواندن صفحات سایت احترام می‌گذارند، اما هیچ الزامی برای استفاده از این فایل برای سایت‌ها نیز وجود ندارد.

اگر در سایت محتویاتی وجود داشته باشد که مدیریت سایت نخواهد موتورهای جستجو آن‌ها را بررسی و داده‌های مربوطه را فهرست بندی و ذخیره کنند، وجود فایل robots.txt برای سایت لازم می‌باشد و اگر می‌خواهید که ربات موتور جستجو کل سایت را بخواند اصلاً نیازی به این فایل نیست، حتی نیازی نیست که یک فایل خالی با این اسم برای سایت خود داشته باشید.

وقتی کلاً فایل robots.txt برای سایتی وجود نداشته باشد، سرور خطای ۴۰۴ را به درخواست ربات گوگل ارسال می‌کند و ربات گوگل متوجه می‌شود اصلاً چنین فایلی وجود ندارد و درنتیجه بدون هیچ محدودیتی کل سایت را فراخوانی و بررسی خواهد کرد.

  1. مطمئن شوید که فایل txt توسط گوگل قابل‌دسترس است.

ممکن است سروری که سایت بر روی آن قرار دارد زمانی که ربات گوگل درخواست دسترسی به فایل robots.txt را ارسال می‌کند خطایی با کد وضعیت ۵xx را در پاسخ بفرستد که به مفهوم این است که نتوانسته درخواست را پاسخ دهد یا فایل غیرقابل‌دسترس می‌باشد.

باید از سمت سروری که سایت بر روی آن قرار دارد بررسی شود که مستقیماً توسط خود سرور یا تنظیمات فایروال سرور، دسترسی‌های ربات گوگل بسته نشده باشد.

مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.