Возможности !SEMTools

Поиск именованных сущностей — задача, встречающаяся во множестве профессий. Возникает там, где в текстовом массиве встречаются те или иные имена собственные. Это могут быть названия брендов, ФИО людей, географические названия (топонимы), названия организаций и другие наименования живых и неживых существ.

Все их объединяет простое правило: они пишутся с заглавной буквы, что одновременно становится и своеобразным маркером, позволяющим выделить эти единицы среди остального текста.

При работе с большими массивами данных часто бывает предпочтительнее сначала обнаружить среди ячеек те, что содержат наименования, и далее уже производить более “тяжёлые” операции:

  • массовую замену символов/слов;
  • извлечение текста с заглавными буквами — будь то слова или все содержимое ячейки;
  • удаление символов, слов, словосочетаний или всего содержимого ячеек.

Найти заглавные (прописные) символы латиницы

В Excel есть функция НАЙТИ — она регистрозависимая, что позволяет найти буквы в том регистре, в котором они перечислены. В сочетании с формулой массива эта функция возвращает позицию любого найденного символа из массива.

Поскольку в ASCII-таблице символов прописные английские буквы идут друг за другом по порядку с 65 по 90, можно использовать менее громоздкую формулу массива для их поиска:

{=СЧЁТ(НАЙТИ(СИМВОЛ(СТРОКА(65:90));A1))>0}

Данная формула вернет ИСТИНА, если в ячейке A1 есть хотя бы одна заглавная английская буква.

Важно: фигурные скобки в данном случае появляются сами, вводить их не нужно — нужно вводить формулу без них и использовать сочетание Ctrl + Shift + Enter.

Найти заглавные (прописные) символы кириллицы

Формула аналогична предыдущей, разница лишь в диапазоне символов — от 192 до 223:

{=СЧЁТ(НАЙТИ(СИМВОЛ(СТРОКА(192:223));A1))>0}

Есть пара замечаний к этой формуле:

  • Данный диапазон не включает в себя букву Ё;
  • Язык системы (Windows) должен быть русский, т.к. ASCII-таблица привязана именно к нему.

Найти прописные символы кириллицы или латиницы

Функция не отличается изящностью, но это лучшее, что предоставляет нам Excel в его базовой конфигурации. В зависимости от наличия в строке прописных букв функция возвращает ИСТИНА или ЛОЖЬ.

=СЧЁТ(НАЙТИ({"A":"B":"C":"D":"E":"F":"G":"H":"I":"J":"K":"L":"M":"N":"O":"P":"Q":"R":"S":"T":"U":"V":"W":"X":"Y":"Z":"А":"Б":"В":"Г":"Д":"Е":"Ё":"Ж":"З":"И":"Й":"К":"Л":"М":"Н":"О":"П":"Р":"С":"Т":"У":"Ф":"Х":"Ц":"Ч":"Ш":"Щ":"Ы":"Э":"Ю":"Я"};A1))>0

Можно решить задачу чуть более компактной формулой массива, совмещающей формулы выше:

{=СЧЁТ(НАЙТИ(СИМВОЛ(СТРОКА($192:$223));A1))+СЧЁТ(НАЙТИ(СИМВОЛ(СТРОКА($65:$90));A1))>0}

Найти любые заглавные буквы

Помимо кириллицы и латиницы есть и другие алфавиты. Не перечислять же их нам все — формулы будут гигантскими и ресурсозатратными.

Для поиска заглавных букв нам поможет логика, а именно использование функций СТРОЧН и СОВПАД, последняя из которых позволяет сравнивать значения по регистру.

Логика такова:

  1. Переведём значение в нижний регистр,
  2. Сравним результат с исходным,
  3. Если не совпадут, значит, хотя бы один символ был в верхнем регистре.

А вот и формула:

=НЕ(СОВПАД(СТРОЧН(A1);A1))

Найти любые строчные буквы

Формула аналогична той, что ищет символы в верхнем регистре. Единственное отличие — в ней используется функция ПРОПИСН. Вот формула:

=НЕ(СОВПАД(ПРОПИСН(A1);A1))

Инструмент “Обнаружить заглавные буквы” в !SEMTools

Чтобы не приходилось запоминать сложный синтаксис составных функций, можно пользоваться готовыми решениями. !SEMTools располагает набором подобных возможностей, включая и процедуру обнаружения заглавных букв.

Макрос находится в группе “Обнаружить” в первом меню “Символы”. Инструкция безумно проста:

  1. Скопируйте исходный столбец с данными в соседний,
  2. Оставив выделенным скопированный диапазон (иначе говоря, ничего больше не делая), выберите процедуру в меню “Обнаружить символы” —> “Заглавные”.
Как найти заглавные буквы в Excel
Как найти ячейки с большими буквами в Excel с помощью !SEMTools

Ячейки, содержащие заглавные буквы, заменятся на значение “ИСТИНА”, не содержащие их — на “ЛОЖЬ”. Далее можно фильтровать, сортировать, копировать и производить любые дальнейшие действия с маркированными таким образом данными.

Более подробную инструкцию по использованию функционала надстройки можно посмотреть в видео, где рассмотрены в том числе некоторые подводные камни.

[embedyt] https://www.youtube.com/watch?v=s6z8avo7XKc[/embedyt]

Смотрите также похожие разделы:

Нужно найти заглавные или строчные буквы в Excel?
В !SEMTools есть это и сотни других готовых решений!

  • Тимур, контент-менеджер, интернет-магазины
    Тимур, контент-менеджер, интернет-магазины
    2024-05-25
    Self

    Надстройка, которая спасает мне просто сотни часов) пользуюсь практически всем, кроме штук для PPC. Возможность взаимодействовать с chatgpt большой плюс

  • Никита Бабёнов, специалист по контекстной рекламе
    Никита Бабёнов, специалист по контекстной рекламе
    2024-05-07
    Self

    Работаю в агентстве, банальная минусация занимала около половины дня, особенно на крупных проектах с большой семантикой. С надстройкой, получается сократить время на минусацию на 90%! Удобное массовое редактирование позволяет снизить или совсем избавится от ошибок. Проработка семантики, ее расширение, позволяет увеличить охват аудитории и ее релевантность. Для меня semtools незаменимый помощник в работе!

  • Владислав Ушаков, предприниматель
    Владислав Ушаков, предприниматель
    2024-05-06
    Self

    Удобная тулза, которая экономит время на обработке семантики. Я, к сожалению использую её поверхностно, но мощь в ней скрыта немыслимая.

  • Павел Васильев, руководитель отдела on-line маркетинга
    Павел Васильев, руководитель отдела on-line маркетинга
    2024-05-06
    Self

    Я – активный пользователь MacOS, но даже это не останавливает меня пользоваться надстройкой при любом удобном случае (потому что аналогов либо нет, либо во временном промежутке они сожрут много денег). Несколько лет я почему-то бегал от надстройки, она казалась мне максимально сложной и бессмысленной – я так никогда еще не ошибался. Сейчас же любая задача со ссылками / семантикой в 99% случаев решается с помощью !SEMTools. Как теперь жить без него – не представляю. Очень жалею, что ни как не могу найти времени “добить” курс Дмитрия, и все продолжаю пользоваться старыми знаниями, но даже их хватает в большинстве случаев (знания взятые из YouTube канала Дмитрия). В общем – инструмент незаменим для PPC и SEO специалистов, огромное спасибо Дмитрию за такой продукт за столь скромную цену

  • Дмитрий Антонов, маркетолог, платный трафик Google Ads, Яндекс.Директ, VK Реклама
    Дмитрий Антонов, маркетолог, платный трафик Google Ads, Яндекс.Директ, VK Реклама
    2024-05-06
    Self

    Надстройка существенно ускоряет время на выполнение широкого пула рядовых задач. Нужно быстро удалить пунктуацию, лишние пробелы или пустые строки – пожалуйста. Быстро изменить регистр у фраз – легко. Вся работа с данными строится вокруг “нажми сюда”, а затем “сюда”, а вот и результат. Надстройка позволяет использовать регулярные выражения, есть инструменты для специалистов по платному трафику и SEO: удаление utm-меток и стоп-слов, составление N-грамм отчета, парсинг поисковых подсказок, извлечение контента сайта с помощью регулярных выражений и многое другое. Всем, кто работает с данными, советую использовать эту надстройку. ТОЛЬКО ОСТОРОЖНО: результат может шокировать! Привычную работу можно выполнить в 2-3 быстрее :) Дмитрий, огромное спасибо за инструмент!

Комментарий:

Спасибо добрый человек, дай Аллах тебе здоровья и счастья в обоих мирах!

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

*