Человеко-понятные URL (ЧПУ) являются важным элементом SEO и пользовательского опыта. Основное требование к ЧПУ — простота, понятность и универсальность.
По этой причине большинство сайтов по всему миру используют латиницу для формирования адресов.

Напротив, кириллица, диакритические знаки (их насчитывается около 1000) и символы других языков могут вызывать ошибки в кодировке, ухудшая обработку URL. Для сайтов с большим органическим трафиком (особенно международных) это критично: универсальный URL понятен всем и корректно работает в любой точке мира.
“Генератор ЧПУ” в надстройке !SEMTools для Excel автоматизирует процесс создания таких универсальных URL, решая основные проблемы, которые могут возникнуть при их генерации.
Основные проблемы и задачи при генерации ЧПУ
Создание человекопонятных УРЛ-ов требует решения ряда задач, таких как транслитерация кириллицы и символов с диакритикой, удаление пунктуации, спецсимволов. Высокоуровневая задача при этом – упрощение массовой обработки данных. Рассмотрим подробнее.
Транслитерация кириллицы в латиницу
Латиница воспринимается большинством поисковых систем и браузеров как стандарт, что обеспечивает лучшую совместимость.
Кириллица — не стандарт для веб-адресов, так как требует преобразования в кодировку Punycode, что делает URL неудобным и сложным для восприятия. “Генератор ЧПУ” автоматически преобразует кириллицу в латиницу (например, я → ya, ц → ts) с учётом SEO-правил, делая URL удобным для пользователей и поисковых систем.

Транслитерация символов других алфавитов
Многие языки используют символы с диакритикой (например, ñ, ç, å, ü), которые также не подходят для стандартных URL. Проблема усугубляется их многообразием — таких знаков насчитывается около 1000. Инструмент преобразует и эти символы в латиницу (ñ → n, ç → c, ü → u), обеспечивая универсальность и корректность URL-адресов на большинстве языков мира.

Удаление пунктуации и замена спецсимволов
Символы пунктуации, такие как запятые, скобки и кавычки, пробелы, восклицательные знаки, а также спецсимволы, как символы валют, эмотиконы и т.д.) могут вызывать ошибки при загрузке страниц. Они часто встречаются в заголовках страниц и, если их не удалить, автоматически попадут в URL. Это сделает адреса некорректными.
Проблема аналогична предыдущему пункту – таких символов много тысяч и все их нельзя удалить обычной заменой. Инструмент “Удалить пунктуацию” в разделе “Удалить символы” автоматически удаляет такие символы, которые обрабатываются браузерами и серверами корректно.

Генерация ЧПУ – о чем не стоит забывать
Поисковые системы за последние годы научились улучшать восприятие URL-адресов, делая их проще и понятнее для пользователей. Например, URL:
https://www.example.com/category/subcategory/nekotory-tovar-s-podrobnym-opisaniem-i-harakteristikami
может быть представлен в результатах поиска как:
example.com › category › nekotory-tovar
В этом случае поисковая система сократила URL, оставив только основные разделы и название продукта, что упрощает восприятие адреса пользователем. Такая оптимизация помогает сфокусировать внимание на ключевой информации, однако полагаться исключительно на автоматические алгоритмы не рекомендуется. Ручная оптимизация URL позволяет сохранить контроль над структурой адреса и обеспечить его максимальную релевантность как для поисковых систем, так и для пользователей.
Удаление шумовых слов (стоп-слов)
Шумовые слова, такие как “где”, “как”, “лучше”, “купить” и другие вводные или распространённые слова, часто попадают в URL из-за автоматического формирования адресов на основе заголовков. Например, заголовок “Как выбрать лучший холодильник” может преобразоваться в URL вида /kak-vybrat-luchshiy-holodilnik

Такие слова не несут ценности для поисковых систем, лишь удлиняя URL и снижая его читаемость. Удаление шумовых слов делает адрес короче и фокусирует его на ключевых элементах: /vybrat-holodilnik
Это улучшает восприятие URL как пользователями, так и поисковыми роботами, повышая релевантность страницы по целевым запросам.
Удаление городов (топонимов) с предлогами и без
Топонимы, такие как “Москва”, “Петербург”, “Россия”, часто добавляются в URL для локализации контента. Например, в заголовке “Ремонт квартир в Москве” топоним “Москва” важен, если контент ориентирован на региональную аудиторию. Однако, если сайт уже использует субдомен (moscow.example.com) или слаг папки (example.com/moscow), повторение топонима в URL становится избыточным.
Инструмент “Удалить топонимы” позволяет автоматически удалять топонимы и их сочетания с предлогами (например, “в Москве”, “по Петербургу”). Это сделает адрес универсальным:
/remont-kvartir
сохраняя смысл и избегая дублирования.

Рекомендуется сначала удалять топонимы с предлогами, а после этого удалять их без предлогов. Иначе могут остаться ненужные предлоги в середине и конце фраз.
Оставляйте топонимы там, где это действительно необходимо, например, если географическое указание добавляет ценность или помогает сегментировать контент.
Удаление повторов слов
Повторы слов в URL — частая проблема, особенно когда они формируются автоматически из текстов, насыщенных ключевыми словами. Например, заголовок “Ремонт квартир: качественный ремонт квартиры в Москве” может превратиться в URL вида:
/remont-kvartir-kachestvennyy-remont-kvartiry-v-moskve
Такой URL не только избыточен, но и плохо воспринимается как пользователями, так и поисковыми системами.
Здесь поможет процедура “удалить повторы слов“, включая удаление повторов с учетом словоформ. Например, слова “квартир”, “квартиры”, “квартирой” будут автоматически распознаны как однокоренные и удалены, и останется только первое.

В результате фраза
Ремонт квартир: качественный ремонт квартиры в Москве
после удаления пунктуации и удаления повторов слов станет
Ремонт квартир качественный в Москве
А URL после обработки будет выглядеть следующим образом:
/remont-kvartir-kachestvennyy-v-moskve
Такой адрес в сравнении с предыдущим является более лаконичным и релевантным.
Регистр символов
Исходные фразы могут содержать как буквы в нижнем, так и в верхнем регистре (быть как строчными, так и заглавными). Инструмент по умолчанию оставляет исходный регистр, но если нужно все привести к нижнему, можно воспользоваться соответствующей процедурой (изменить регистр символов) предварительно, либо выполнить уже на списке готовых URL.

Управление длиной URL
Слишком длинные адреса могут обрезаться в поисковых системах, теряя важные части. Если вышеперечисленные шаги недостаточно сократили исходные фразы, можно воспользоваться инструментом “Удалить слова до позиции” – он позволит сократить фразу, а вместе с ней и будущий ЧПУ до нужной длины.