
Иногда поиск слов в ячейке не отвечает на все вопросы, так как слово само по себе не всегда несет однозначный смысл.
Например, слова “минеральные” и “воды” по отдельности могут встречаться в контексте, не связанном с названием города: “минеральные источники”, “минеральные соли”, “минеральные плиты”, “купи воды”, “отключение воды”, “температура воды”, “счетчик воды” и т.д.
Однако, когда два этих слова идут строго друг за другом:
“минеральные воды”,
“минеральных водах”,
“минеральных вод”,
“минеральных водах”,
“минеральным водам”
— мы знаем, что речь о городе Минеральные Воды.
То же касается и множества других видов омонимии.
Например, “то” может быть местоимением, союзом, частицей и существительным-аббревиатурой “техническое обслуживание”.
В таких случаях только соседние слова могут дать понимание, какой смысл несет слово в контексте:
нулевое ТО
то как зверь она завоет, то заплачет…
я за то люблю Ивана…
Ровно для таких характерных случаев и были предусмотрены макросы !SEMTools по поиску, извлечению и удалению фраз в ячейках. Ниже примеры использования поиска по встроенному списку топонимов и произвольно задаваемому списку фраз.
Как найти в тексте топонимы
На первом этапе обработки семантического ядра может быть полезно обнаружить города в ячейках — в каких ячейках есть их названия, а в каких их нет. Уже после этого можно будет принимать дальнейшие шаги — извлечь города или удалить города из ячеек.

Как найти в тексте свой список фраз
При выполнении данный макрос может искать как фразы, так и слова, поэтому нет проблемы использовать смешанные списки из слов и фраз. Однако если вы уверены, что можно обойтись поиском отдельных слов, предпочтительнее использовать его: на объемах в десятки и сотни тысяч строк разница в скорости обработки будет заметна.
