Features of !SEMTools

Excel бағдарламасындағы сөздерді, тіпті ең қысқаларын да ұяшықтардан қалай жоюға болатыны қазірдің өзінде қарастырылған. Бірақ көбінесе сөздерді емес, сөз тіркестерін жою керек. Ал кәдімгі ауыстыру, сөздердегі сияқты, ауыстырудан кейін кейбір жағдайларда сөздердің аяқталуы немесе басы қалатын жағдайларға әкелуі мүмкін.

!SEMTools бұл мәселені өте жақсы шешеді, өйткені ол әрқашан жолды тұтастай емес, оның жеке сөздеріне қарайды және іздеу кезінде оларды салыстырады. Сөз тіркестеріне келсек, қосымша ізденетін сөз тіркестерінде қалай орналасса, қатар тұрған сөздерді де солай іздейді. Егер ол тапса, ол бүкіл тізбекті жояды, егер ол сөз тіркесінің сөздерінің бір бөлігін ғана тапса, ол ештеңені жоймайды.

Қалаларды жою (жер атаулары)

Топонимдер – жойылуды қажет ететін сөздер мен сөз тіркестерінің ең көп таралған түрлерінің бірі. Оларды предлогтармен бірге («Мәскеуде», «Нижний Новгород облысында», «минералды суларда») бірге де, оларсыз да жоюға болады. Бірінші жағдай топонимдердің өзін алып тастағаннан кейін көсемшелерді қалдырмау үшін қажет.

Үлкен деректер массивтерімен жұмыс істегенде, алдымен тізімде қала атауларының бар-жоғын анықтау ұсынылады, содан кейін қосымшалардың жойылмағанына көз жеткізу үшін осы сөз тіркестерін шығарып алған жөн.

Бұл қысқа бейнеде топонимді жою процедурасының мысалы:

100 000 сөз тіркесінен барлық жер атауларын алып тастау

Сөз тіркестерінің (сөз тіркестерінің) тізімін жою

Сөз тіркестерінің жеке тізімін жою үшін бөлек мәзір элементі беріледі. Негізгі талап – тізім бір бағанда болуы керек. Төмендегі мысал семантикалық өзектен барлық қажет емес сөздерді алып тастап, семантикада тек ит тұқымдарын қалай сақтауға болатынын көрсетеді.

Тізімде тек сөз тіркестерінің болуы міндетті емес – сізде жеке сөздер де болуы мүмкін, олар да жойылады. Бірақ сөздер тізімінде кем дегенде бір сөз тіркесі болса, макрос қолданылуы керек.

rem-phrases
Сол 100 000 сөз тіркесінің ішінен бірнеше ондаған сөз тіркесін өшіреміз