Как и извлечение слов, извлечение словосочетаний — недоступная функция в стандартном наборе инструментов Excel. Прежде чем удалить фразы из текста, нужно убедиться, что не будут удалены лишние данные. Для этого их рекомендуется извлечь для удобного просмотра и фильтрации.
Найти одно словосочетание в Excel легко — достаточно воспользоваться автофильтром, — а вот когда фраз много, задача резко осложняется. Надстройка !SEMTools позволяет невероятно быстро извлекать даже из десятков и сотен тысяч ячеек заданные фразы из списка.
Извлечь города и страны из текста (топонимы)
Извлечение топонимов — один из самых частых кейсов работы с фразами. Все потому, что географические названия могут состоять из нескольких слов. !SEMTools «знает» около 40 000 географических названий со всего света — пропустит разве что редкие населенные пункты. Если задача просто определить наличие города во фразе, можно воспользоваться меню «Найти фразы в списке ячеек».
С предлогами
Бывает важно понять, с какими предлогами используются города в массиве фраз. Извлечение фраз, состоящих из города и предлога перед ним, решает эту задачу. При этом не очень важно, сколько ячеек в вашем массиве фраз, — несколько сотен или несколько сотен тысяч. Благодаря оптимизированным алгоритмам нужны мгновения для обработки.

Извлечь города без предлогов
Базовый кейс, когда нужно просто извлечь из семантического ядра города. Может быть полезно для анализа поискового спроса по регионам.
