Кейде ұяшықтағы сөздерді іздеу барлық сұрақтарға жауап бермейді, өйткені сөздің өзі әрқашан бір мәнді мағынаға ие бола бермейді.
Мысалы, «минералды» және «сулар» сөздері жеке қаланың атауына қатысы жоқ контексте болуы мүмкін: «минералды бұлақтар», «минералды тұздар», «минералды тақталар», «су сатып алу», «суды тоқтату », «судың температурасы», «су есептегіші» т.б.
Алайда, бұл екі сөз бірінен соң бірін қатаң түрде өткенде:
«минералды су»,
«минералды сулар»
– Әңгіме Минеральные воды қаласы туралы екенін білеміз.
Бұл омонимияның көптеген басқа түрлеріне де қатысты.
Мысалы, “сол” есімдік, жалғаулық, бөлшек және “машинерлік” аббревиатура есімдігі болуы мүмкін.
Мұндай жағдайларда контексте сөздің мағынасын түсінуді тек көрші сөздер ғана бере алады:
нөлдік техникалық қызмет көрсету
сосын хайуан сияқты айқайлайды, содан кейін ол жылайды…
Мен Иванды осы үшін жақсы көремін…
Дәл осындай сипаттамалық жағдайлар үшін ұяшықтардағы фразаларды іздеу, шығару және жою үшін !SEMTools макростары берілген. Төменде топонимдердің кірістірілген тізімінде және сөз тіркестерінің қосымша тізімінде іздеуді пайдаланудың мысалдары берілген.
Мәтіннен топонимдерді қалай табуға болады
Семантикалық ядроны өңдеудің бірінші кезеңінде ұяшықтардағы қалаларды анықтау пайдалы болуы мүмкін — қай ұяшықтардың атаулары бар, қайсысы жоқ. Осыдан кейін қосымша қадамдар жасауға болады — қалаларды шығарып алу немесе қалаларды ұяшықтардан алып тастау.
Мәніндегі сөз тіркестерінің тілімін калай табаға болады
Орындалған кезде бұл макрос сөз тіркестерін де, сөздерді де іздей алады, сондықтан сөздер мен сөз тіркестерінің аралас тізімдерін пайдалануда ешқандай проблема болмайды. Дегенмен, егер сіз жеке сөздерді іздеу арқылы қол жеткізе алатыныңызға сенімді болсаңыз, оны қолданған жөн: ондаған және жүздеген мың жолдардың көлемдерінде өңдеу жылдамдығының айырмашылығы байқалады.