Site Metrics
ВозможностиЦеныИнструментыБлогАудит сайтаУслуги
ВойтиНачать бесплатно
Главная/Блог
toolstechnical-seoaudit
🗺️

XML Sitemap: проверка, поддержка и типичные грабли

Как правильно поддерживать XML Sitemap: как проверить валидность, что класть в lastmod, как разбивать большие сайты на индексы, hreflang для двуязычных сайтов.

7 июня 2026 г.·12 мин чтения·Site Metrics Tool

Sitemap.xml — это карта сайта, которую вы явно отдаёте поисковикам, говоря: «вот мои важные URL, индексируйте их в первую очередь». В отличие от robots.txt, который указывает что не нужно, Sitemap указывает что нужно. Поисковики не обязаны следовать ему буквально — это рекомендация, а не команда. Но хорошо настроенный sitemap ускоряет индексацию новых страниц на 30–60% и помогает поисковику правильно расставить приоритеты по большому сайту. В этой статье разберём, как проверить sitemap бесплатно через наш SEO-инструмент онлайн, и какие грабли подстерегают тех, кто настраивает его «на отвали».

Базовая проверка через валидатор

Откройте /tools/sitemap-validator и введите URL вашего sitemap (обычно domain.com/sitemap.xml). Инструмент сделает три проверки: первая — соответствие XML-схеме (нет ли битых тегов, правильно ли вложены элементы); вторая — доступность каждого URL внутри (отдают ли 200, или там есть 404 и редиректы); третья — корректность необязательных полей (lastmod должен быть в формате W3C datetime, priority в диапазоне 0.0–1.0). На выходе получите отчёт с подсветкой проблемных URL.

lastmod: главная боль большинства sitemap

Тег <lastmod> должен показывать реальную дату последнего изменения контента страницы. Большинство сайтов ставят сюда дату генерации sitemap — это категорически неправильно. Если все 10 000 URL у вас имеют lastmod = 2026-06-07, Google это видит и игнорирует: «они не знают, что меняется на самом деле». Правильно: для каждого URL ставить дату его последнего изменения. Для статей блога — дата последней правки. Для товаров — дата последнего изменения карточки. Для статичных страниц — дата создания. Если CMS не отдаёт эту инфу, лучше не ставить lastmod совсем, чем ставить фейковую.

Когда дробить sitemap на индекс и дочерние

Спецификация ограничивает один sitemap-файл 50 000 URL и 50 МБ размера (несжатый). Если у вас сайт меньше — один файл нормально. Если больше — нужен sitemap-index, а внутри несколько дочерних. Логика дробления должна соответствовать структуре сайта: sitemap-blog.xml для статей блога, sitemap-tools.xml для инструментов, sitemap-vs.xml для страниц сравнения. Это даёт два преимущества: первое — в Search Console вы видите статистику индексации отдельно по разделу («блог проиндексирован на 95%, товары на 60% — там проблема»); второе — поисковик быстрее обнаруживает обновления в одном разделе, не перечитывая весь sitemap.

hreflang в sitemap для двуязычных сайтов

Бесплатный инструмент
Запустите экспресс-аудит сайта за минуту
Пять бесплатных SEO-инструментов на одной странице: чекер позиций, валидатор robots.txt и Sitemap, проверка meta-тегов, тест Core Web Vitals. Без регистрации.
Открыть инструменты

Если у вас сайт на двух языках (например, /ru и /en версии), hreflang — обязательная разметка для Google. Один из способов — указывать её прямо в sitemap через xhtml:link rel="alternate". Это удобнее, чем прописывать в head каждой страницы, особенно для больших сайтов. Пример: для страницы /ru/blog/post-1 в sitemap указываете <xhtml:link rel="alternate" hreflang="en" href="https://domain.com/en/blog/post-1" />. Наш валидатор проверяет: указаны ли hreflang для всех языковых вариантов, корректные ли коды (ru, en, en-US, x-default), не битые ли URL альтернатив.

Что не должно попадать в sitemap

  • URL с параметрами (?utm_source=...) — это дубли с точки зрения поиска.
  • URL с noindex — если страница не должна индексироваться, она не должна попадать в карту.
  • URL с 404 и 410 — мёртвые страницы в sitemap раздражают поисковик.
  • URL с редиректом — указывайте сразу конечный URL, а не промежуточный.
  • Дубликаты — один и тот же URL в нескольких дочерних sitemap.
  • URL с canonical на другую страницу — нет смысла индексировать дубль.

submitted-to-indexed ratio

Один из самых полезных показателей для оценки качества sitemap — это отношение «отправлено к проиндексировано» в Google Search Console. Если в sitemap 10 000 URL, а Google в индексе только 4 000 — это плохо. Норма — 80%+. Низкий ratio означает одну из трёх вещей: вы пихаете в sitemap URL, которые Google не хочет индексировать (тонкий контент, дубли); у вас технические проблемы (медленный сервер, 5xx ошибки на обходе); страницы плохо связаны внутри сайта (orphan pages). Site Metrics Tool отслеживает этот ratio автоматически и алертит, если он упал больше чем на 10 процентных пунктов за неделю.

Связь sitemap с rank-трекингом

Когда вы используете Site Metrics Tool для мониторинга позиций, мы автоматически тянем ваш sitemap раз в сутки и сравниваем с фактическими URL, которые показываются в SERP для ваших ключевых слов. Это даёт критически важный сигнал «вы пытаетесь ранжировать /products/special, а Google показывает /blog/special» — то есть у вас каннибализация между двумя страницами под один интент. Без интеграции с sitemap эту проблему ловить нужно вручную, тратя часы на анализ Search Console.

Частые вопросы

Нужно ли отправлять sitemap в Search Console руками каждый раз?

Достаточно одного раза. После первой отправки Google будет проверять sitemap по своему расписанию (обычно ежедневно). Указание Sitemap: в robots.txt тоже автоматизирует обнаружение.

Можно ли использовать .xml.gz?

Да, поисковики поддерживают gzip-сжатые sitemap. Это уменьшает размер файла, что полезно для больших сайтов. Ограничение в 50 МБ относится к несжатому размеру, не к gzip.

Картинки и видео нужны в sitemap?

Опционально. Image sitemap помогает поисковику обнаружить картинки, особенно если они в lazy-load и не видны при первом рендере HTML. Video sitemap — для сайтов с большим количеством видеоконтента. Для среднего блога обычно не нужны.

Что делать, если sitemap больше 50 МБ?

Разделить на несколько дочерних и сделать sitemap-index. Один индекс может ссылаться на 50 000 дочерних sitemap — практически безлимит для любого реалистичного размера сайта.

Поделиться
Автоматизируйте всё это для своего сайта

Site Metrics Tool синхронизирует данные из GSC и Яндекс.Вебмастера каждые 6 часов, копит историю на 16 месяцев и стреляет алертами при просадках. Бесплатный план — навсегда.

Создать бесплатный аккаунт

Похожие статьи

🤖
5 июн. 2026 г. · 12 мин чтения

robots.txt: 8 частых ошибок и как их найти бесплатно

Разбор 8 типичных ошибок в robots.txt, которые роняют индексацию: путаница с Disallow, конфликт правил, забытый staging, неправильный User-agent. Как проверить за минуту бесплатно.

🧱
4 сент. 2026 г. · 14 мин чтения

Schema.org разметка: продвинутое руководство 2026

Полное руководство по структурированным данным: все типы для разных страниц, JSON-LD vs Microdata, связи через @id, тестирование и отладка.

🌐
19 авг. 2026 г. · 13 мин чтения

Hreflang для мультиязычных сайтов: полное руководство 2026

Что такое hreflang, как правильно настроить для двух и более языков, типовые ошибки и почему Google и Яндекс относятся к hreflang по-разному.

⚙️
3 авг. 2026 г. · 13 мин чтения

JavaScript SEO в 2026: SPA, гидратация и почему страница не индексируется

Почему JavaScript-сайты плохо индексируются, как Google и Яндекс рендерят JS, разница SSR/SSG/CSR, чеклист для исправления.

Содержание
  1. Базовая проверка через валидатор
  2. lastmod: главная боль большинства sitemap
  3. Когда дробить sitemap на индекс и дочерние
  4. hreflang в sitemap для двуязычных сайтов
  5. Что не должно попадать в sitemap
  6. submitted-to-indexed ratio
  7. Связь sitemap с rank-трекингом
Бесплатные инструменты
  • 🎯Чекер позиций
  • 🤖robots.txt
  • 🗺️Sitemap
  • 🏷️Meta-теги
  • ⚡Core Web Vitals
Бесплатно
Free план без карты

1 проект, 5 ключевых слов, OAuth-интеграции с GSC и Webmaster, история на 16 месяцев. Платить — только если станет тесно.

Создать аккаунт →
Читать также
  • 🤖robots.txt: 8 частых ошибок и как их найти бесплатно
    12 мин
  • 🧱Schema.org разметка: продвинутое руководство 2026
    14 мин
  • 🌐Hreflang для мультиязычных сайтов: полное руководство 2026
    13 мин
  • ⚙️JavaScript SEO в 2026: SPA, гидратация и почему страница не индексируется
    13 мин
Site Metrics Tool

Мониторинг позиций сайта в Google и Яндексе. Интеграции с GSC и Webmaster, история 16 месяцев, бесплатный план без карты.

Все системы в норме
Продукт
  • Возможности
  • Цены
  • Аудит сайта
  • Услуги
  • Начать бесплатно
  • Войти
Материалы
  • Блог
  • Инструменты
  • Глоссарий
  • Сравнения
  • RSS
Документы
  • Условия
  • Конфиденциальность
  • Возврат средств
Контакты
  • info@sitemetricstool.com
  • support@sitemetricstool.com
© 2026 Site Metrics Tool. Self-hosted SEO.
Индивидуальный предприниматель Спиридонов Дмитрий Вадимович · ОГРНИП: 324762700012347 · ИНН: 760806658219
Юридический адрес: 152020, Ярославская обл., г. Переславль-Залесский, ул. Красноэховская, 12-20 · info@sitemetricstool.com