Возможности !SEMTools

При работе с текстовым контентом зачастую необходима нормализация текста. В её рамках все буквы приводятся к нижнему или верхнему регистру для последующей статистической обработки.

Многие системы статистики (например, Wordstat Яндекса) выводят данные в нормализованном виде. Для исправления их написания необходимы особые функции управления регистром.

Функции изменения регистра Excel

В Excel из коробки доступны 3 функции для изменения регистра: СТРОЧН, ПРОПИСН, ПРОПНАЧ.

Первая делает все буквы маленькими, вторая — большими.

СТРОЧН

Чтобы заменить заглавные буквы на строчные, в Excel есть функция СТРОЧН (подробнее в статье по ссылке). Как и любые функции, она требует ручной ввод в отдельную ячейку.

Функция СТРОЧН в Excel
СТРОЧН — простейшие примеры формул

ПРОПИСН

Функция ПРОПИСН делает все строчные буквы заглавными, а остальные символы не меняет. Также требует создания доп. столбца.

Примеры на картинке ниже:

Функция ПРОПИСН - примеры
Функция ПРОПИСН — примеры формул

Далее, если исходные данные больше не понадобятся, нужно будет удалить все формулы из ячеек, в которых применена эта функция, и только после этого удалять столбец с заглавными буквами.

ПРОПНАЧ

С третьей функцией (ПРОПНАЧ) всё чуть более необычно. Она делает заглавным каждый первый символ, следующий за символом, не являющимся буквой. В связи с этим некоторые слова будут преобразовываться некорректно. Кое-какой -> Кое-Какой, волей-неволей -> Волей-Неволей, 1-го — > 1-Го, примеров достаточно. Когда объём данных небольшой, такого рода погрешности легко проверить и исправить вручную. Если же данных много, корректура может стать несносно рутинной и неприятной.

Также функция меняет регистр всех заглавных символов кроме первого, на строчные, что может «повредить» аббревиатуры.

ПРОПНАЧ — примеры применения функции

Обо всех этих издержках и как их избежать, я подробно рассказал в статье о том, как сделать первую букву ячейки заглавной, не меняя регистр остальных символов и делая заглавной именно первую букву, а не первый символ ячейки (который буквой может и не быть вовсе).

Преобразование регистра в Excel с помощью !SEMTools

Некоторые задачи, связанные с изменением регистра букв (например, начинать предложения с заглавной буквы) нельзя решить простым способом и даже самыми сложными формулами.

Надстройка !SEMTools содержит все самые востребованные инструменты, связанные с изменением регистра букв.

В отличие от штатных функций Excel, они позволяют производить изменения, не создавая дополнительных столбцов! Достаточно выделить необходимые данные и вызвать процедуры в меню «Изменить — Символы — регистр».

Все заглавные

Процедура по сути является аналогом применения функции ПРОПИСН, описанной выше. Её преимущество — изменение данных прямо на месте.

сделать все буквы заглавными
Перевод текста в верхний регистр (все буквы заглавные)

Все строчные

Делаем все буквы маленькими в пару кликов мыши. Процедурный аналог СТРОЧН.

сделать все буквы строчными
Перевод текста в нижний регистр (все буквы строчные)

Каждое слово с заглавной

Процедура — аналог ПРОПНАЧ, с обработкой на месте.

каждое слово с заглавной буквы
Делаем каждое слово с заглавной буквы

Предложения с заглавной

Все перечисленные в интернете решения на основе сложных формул не решают основную пользовательскую задачу — сделать заглавными первые буквы предложений.

Поэтому и была создана соответствующая процедура в надстройке. Она позволяет избежать громоздких формул массива и прочих сложнейших комбинаций функций, создания дополнительных столбцов и удаления их после получения нужного результата.

Иными словами, позволяет сэкономить кучу времени.

Одним кликом переводим первые буквы предложений из строчных в заглавные:

предложения с заглавной
Исправляем регистр предложений, начиная их с заглавной буквы.

Предложения с маленькой буквы

Иногда требуется, наоборот, сделать начала предложений с маленькой буквы, например, при такой задаче, как поиск именованных сущностей (имен, фамилий, отчеств, географических и иных названий).

Их удобно извлекать по признаку «первая буква заглавная», но при этом нужно пропускать первые слова предложений, которые начинаются с заглавных по базовым правилам языка. Такая процедура, как изменение первой буквы предложений на строчную, поможет в решении.

предложения с маленькой буквы
Делаем начала предложений с маленькой буквы

Слова с латиницей — с заглавной

Надстройка !SEMTools умеет различать слова по содержащимся в них символам, в числе которых латиница. Данный макрос позволяет сделать такие слова с большой буквы в кейсах, когда это нужно (например, иностранные бренды).

слова с латиницей с заглавной буквы
Меняем регистр слов с латиницей и делаем их с большой буквы

Слова с латиницей заглавными (капсом)

Хочется еще больше выделить слова с латиницей? Инструмент преобразовывает все буквы слов на латинице в заглавные.

английские слова капсом
Делаем английские слова целиком заглавными буквами

Исправление регистра топонимов

Данная функция надстройки уникальна, иными словами, никакого похожего решения вы больше не найдете.

Функция меняет первые буквы слов и фраз-топонимов (географических наименований) со строчных на заглавные. Важно, что она не просто делает первую букву заглавной, но и понимает такие топонимы, как «СПб».

исправить регистр написания городов
Делаем топонимы с заглавной буквы

Распознавание аббревиатур

Еще одна уникальная функция надстройки. Инструмент определяет аббревиатуры как на кириллице, так и на латинице, и преобразовывает их написание в верхний регистр.

распознавание аббревиатур в Excel
Разпознавание аббревиатур в !SEMTools

Часто сталкиваетесь с этой или похожими задачами при работе в Excel? !SEMTools поможет решить их за пару кликов — скачивайте надстройку и оптимизируйте рабочие процессы!