Возможности !SEMTools

При работе с текстовым контентом зачастую необходима нормализация текста. В её рамках все буквы приводятся к нижнему или верхнему регистру для последующей статистической обработки.

Многие системы статистики (например, Wordstat Яндекса) выводят данные в нормализованном виде. Для исправления их написания необходимы особые функции управления регистром.

Функции изменения регистра Excel

В Excel из коробки доступны 3 функции для изменения регистра: СТРОЧН, ПРОПИСН, ПРОПНАЧ.

Первая делает все буквы маленькими, вторая – большими.

Все строчные – формула

Сделать все буквы маленькими в Excel поможет функция СТРОЧН. Как и любые функции, она требует ручной ввод в отдельную ячейку.

=СТРОЧН(A1)
Функция СТРОЧН в Excel
СТРОЧН – простейшие примеры формул

Все заглавные (прописные) – формула

Функция ПРОПИСН делает все строчные буквы заглавными, а остальные символы не меняет. Также требует создания доп. столбца.

=ПРОПИСН(A1)

Примеры на картинке ниже:

Функция ПРОПИСН - примеры
Функция ПРОПИСН – примеры формул

Далее, если исходные данные больше не понадобятся, нужно будет удалить все формулы из ячеек, в которых применена эта функция, и только после этого удалять столбец с заглавными буквами.

Каждая первая буква после символов, не являющихся буквами – заглавная

Речь идет о функции ПРОПНАЧ. Она делает заглавным каждый первый символ, следующий за символом, не являющимся буквой. В связи с этим некоторые слова будут преобразовываться некорректно. Кое-какой -> Кое-Какой, волей-неволей -> Волей-Неволей, 1-го – > 1-Го, примеров достаточно. Когда объём данных небольшой, такого рода погрешности легко проверить и исправить вручную. Если же данных много, корректура может стать несносно рутинной и неприятной.

Также функция меняет регистр всех заглавных символов кроме первого, на строчные, что может “повредить” аббревиатуры.

=ПРОПНАЧ(A1)
ПРОПНАЧ — примеры применения функции

Обо всех этих издержках и как их избежать, я подробно рассказал в статье о том, как сделать первую букву ячейки заглавной, не меняя регистр остальных символов и делая заглавной именно первую букву, а не первый символ ячейки (который буквой может и не быть вовсе).

Преобразование регистра в Excel с помощью !SEMTools

Некоторые задачи, связанные с изменением регистра букв (например, начинать предложения с заглавной буквы) нельзя решить простым способом и даже самыми сложными формулами.

Надстройка !SEMTools содержит все самые востребованные инструменты, связанные с изменением регистра букв.

В отличие от штатных функций Excel, они позволяют производить изменения, не создавая дополнительных столбцов! Достаточно выделить необходимые данные и вызвать процедуры в меню «Изменить — Символы — регистр».

Изменить регистр слов

Процедуры раздела “изменить регистр слов” — самые простые и аналогичны штатным функциям Excel, разве что намного удобнее.

Заглавные буквы —> в строчные

Сделать заглавные буквы строчными в Excel — пожалуй, самая популярная задача. Использовать для неё формулы занимало бы много времени. Поэтому я сделал процедуру, которая позволит моментально заменить заглавные буквы строчными в пару кликов.

Как перевести все заглавные буквы в строчные в Excel
Заменяем все заглавные буквы на строчные в диапазоне Excel с помощью !SEMTools

Сделать все буквы заглавными (прописными)

Вот так просто можно сделать все буквы заглавными в Excel. Процедура заменяет строчные буквы на заглавные, а уже имеющиеся большие буквы оставляет как есть.

как сделать все буквы заглавными в Excel
Как сделать все буквы заглавными в Excel с помощью надстройки для Excel !SEMTools

Процедура по сути является аналогом применения функции ПРОПИСН, описанной выше. Её преимущество — замена данных прямо на месте.

Каждое слово с заглавной

Процедура – аналог ПРОПНАЧ, с обработкой на месте.

каждое слово с заглавной буквы
Делаем каждое слово с заглавной буквы

Изменение регистра предложений

Все перечисленные в интернете решения на основе сложных формул не решают основную пользовательскую задачу – определить и сделать заглавными/строчными первые буквы предложений.

Поэтому и были созданы соответствующие процедуры в надстройке. Она позволяет избежать громоздких формул массива и прочих сложнейших комбинаций функций, создания дополнительных столбцов и удаления их после получения нужного результата.

Предложения с заглавной

Одним кликом переводим первые буквы предложений из строчных в заглавные:

предложения с заглавной
Исправляем регистр предложений, начиная их с заглавной буквы.

Предложения с маленькой буквы

Иногда требуется, наоборот, сделать начала предложений с маленькой буквы, например, при такой задаче, как поиск именованных сущностей (имен, фамилий, отчеств, географических и иных названий).

Их удобно извлекать по признаку “первая буква заглавная”, но при этом нужно пропускать первые слова предложений, которые начинаются с заглавных по базовым правилам языка. Такая процедура, как изменение первой буквы предложений на строчную, поможет в решении.

предложения с маленькой буквы
Делаем начала предложений с маленькой буквы

Регистр слов с латиницей

Надстройка !SEMTools умеет различать слова по содержащимся в них символам, в числе которых латиница. Данные процедуры позволяют сделать такие слова с большой буквы или “капсом” в кейсах, когда это нужно (например, иностранные бренды).

Слова с латиницей – с заглавной

Процедура распознает английские слова и делает первую букву этих слов заглавной.

слова с латиницей с заглавной буквы
Меняем регистр слов с латиницей и делаем их с большой буквы

Слова с латиницей – все буквы заглавные (капсом)

Хочется еще больше выделить слова с латиницей? Инструмент преобразовывает все буквы слов на латинице в заглавные.

английские слова капсом
Делаем английские слова целиком заглавными буквами

Исправление регистра топонимов

Данная функция надстройки уникальна, иными словами, никакого похожего решения вы больше не найдете.

Функция меняет первые буквы слов и фраз-топонимов (географических наименований) со строчных на заглавные. Важно, что она не просто делает первую букву заглавной, но и понимает такие топонимы, как “СПб”.

исправить регистр написания городов
Делаем топонимы с заглавной буквы

Распознавание аббревиатур

Еще одна уникальная функция надстройки. Инструмент определяет аббревиатуры как на кириллице, так и на латинице, и преобразовывает их написание в верхний регистр.

распознавание аббревиатур в Excel
Разпознавание аббревиатур в !SEMTools

Часто сталкиваетесь с этой или похожими задачами при работе в Excel? !SEMTools поможет решить их за пару кликов – скачивайте надстройку и оптимизируйте рабочие процессы!