При работе с текстовым контентом зачастую необходима нормализация текста. В ее рамках все буквы приводятся к нижнему или верхнему регистру для последующей статистической обработки.

Многие системы статистики (например, Wordstat Яндекса) выводят данные в нормализованном виде. Для исправления их написания необходимы особые функции управления регистром.

Функции изменения регистра Excel

В Excel из коробки доступны 3 функции для изменения регистра: СТРОЧН, ПРОПИСН, ПРОПНАЧ. Первая делает все буквы маленькими, вторая — большими.

С третьей (ПРОПНАЧ) все чуть более необычно. Она делает заглавным каждый первый символ, следующий за символом, не являющимся буквой. В связи с этим некоторые слова будут преобразовываться некорректно: кое-какой -> Кое-Какой, волей-неволей -> Волей-Неволей и т.п. Когда объём данных небольшой, такого рода погрешности легко проверить и исправить вручную. Если же данных много, заниматься редакторской деятельностью вряд ли есть время.

Любые другие насущные задачи, связанные с изменением регистра букв (например, начинать предложения с заглавной буквы) придется решать при помощи настройки пользовательских функций или макросов.

Меню надстройки !SEMTools «Изменить -> Изменить символы -> Регистр» содержит все самые востребованные функции, связанные с изменением регистра букв. Перечислим ниже все эти функции и проиллюстрируем их примерами.

Заменить заглавные на строчные

Позволяет перевести все заглавные буквы, содержащиеся в словах, в строчные. В отличие от базовой функции, содержащийся в самом Excel, позволяет произвести изменения непосредственно в столбце с данными, не создавая отдельный столбец.

Сделать все буквы заглавными

Переводит все буквы их строчных в заглавные. Создание отдельного столбца также не требуется.

Каждое слово с заглавной

В отличие от аналогичной базовой функции ПРОПНАЧ в самом Excel, этот макрос считает разделителем слов только пробел.

Начала предложений с заглавной

Одним кликом переводим первые буквы предложений из строчных в заглавные.

Латиница с заглавной

Надстройка !SEMTools умеет различать слова по содержащимся в них символам, в числе которых латиница. Данный макрос позволяет сделать такие слова с большой буквы в кейсах, когда это нужно (например, иностранные бренды).

Слова с латиницей заглавными

Этот макрос преобразовывает все буквы слов на латинице в заглавные. Например, как на картинке ниже, — когда нужно выявить названия моделей технических изделий и перевести их в верхний регистр.

Исправление регистра топонимов

Данная функция надстройки уникальна, так как решение задачи требует сложного многоступенчатого подхода. Функция меняет первые буквы слов и фраз-топонимов (географических наименований) со строчных на заглавные. Важно, что она не просто делает первую букву заглавной, но и понимает такие топонимы, как «СПб».

Распознать аббревиатуры

Еще одна уникальная функция надстройки. Макрос определяет аббревиатуры как на кириллице, так и на латинице, и преобразовывает их написание в верхний регистр.