Возможности !SEMTools

Функционал Pro версии !SEMTools. Смотреть сравнение версий.

Склонение по падежам в Excel как штатная возможность отсутствует. Как на русском, так и на других языках. Все дело в том, что это — одна из самых сложных задач для разработки, поскольку в русском языке масса правил склонения, окончаний, чередующихся гласных и прочих исключений из общих правил.

Обычная формула, которая сможет автоматически поменять падеж любого слова, попросту невозможна, поскольку ограничения формул по длине просто не позволят учесть в ней все нюансы. Даже если вы гений Excel, у вас не получится сделать формулу даже для одного падежа. А если получится, она будет давать много ошибок на исключениях.

Но в таких сложных случаях на помощь могут прийти авторские программные решения, в числе которых и моё.

Я разрабатывал алгоритм в своей надстройке с нуля и самостоятельно, опираясь на разные открытые источники данных по морфологии русского языка, и разработка заняла несколько месяцев, после чего я всё еще периодически произвожу улучшения своего алгоритма и исправление ошибок.

Надстройка !SEMTools может похвастать несколькими особенностями, выделяющими её на фоне других решений по морфологии в Excel. Например, она позволяет переводить слова в именительный падеж (см. лемматизация), а также изменять число и падеж составных фраз, не ломая их смысл.

Что ж, расскажу подробнее.

Перевод в именительный падеж в Excel

Перевод слов в Excel в именительный падеж — часть процесса лемматизации. Лемматизация в Excel также поддерживается моей надстройкой, но здесь речь не о ней, а об обратном процессе — склонении начальной формы в остальные.

Перевод из начальной формы в другие падежи

Периодически специалистам, чья деятельность связана с написанием большого количества текстов — SEO/PPC специалистам, контент-менеджерам, администраторам баз данных и каталогов, копирайтерам и т.д. — бывает нужна возможность просклонять слова по падежам.

Мечта таких специалистов (знаю, т.к. выполнял похожие задачи) — поменять падеж ФИО, ключевых слов или товарных позиций прямо в Excel с помощью простых функций или процедур.

И !SEMTools дает такую возможность!

Процедуры можно потестировать в бесплатной версии, но присутствует ограничение — обрабатываются только часть исходных данных, примерно треть данных не обрабатывается.

Макросы склонения по падежам в Excel

Полная версия надстройки обрабатывает 100% данных. Процедуры можно вызывать с помощью меню «Изменить слова» в группе «ИЗМЕНИТЬ».

процедуры склонения по падежам в надстройке для Excel !SEMTools

Для корректной работы слова должны быть в начальной форме — именительном падеже.

Посмотрите видео демонстрацию работы процедур ниже:

ВАЖНО: процедуры склонения не знают, какие части речи им дали на вход, и смотрят только на окончания, склоняя все слова в ячейке как существительные или прилагательные в именительном падеже. Исключение – процедуры склонения фраз.

Склонение существительных

Число Доступные словоформы для склонения
ЕдинственноеЕдинственное число: родительный, дательный, винительный, творительный, предложный
Множественное число: именительный, родительный, дательный, винительный, творительный, предложный
МножественноеРодительный, дательный, винительный, творительный, предложный — любой вариант

Объяснение к таблице ниже: если исходная словоформа в именительном падеже множественного числа, из нее можно произвести только падежи множественного. Чтобы получить словоформы единственного числа, потребуется сначала преобразовать слова в их леммы (именительный падеж единственного числа) с помощью процедуры лемматизации. И уже после этого склонять в любые другие.

Очень хочется довести функционал до совершенства, но склонение существительных практически не поддается простой алгоритмизации – есть десятки правил и сотни исключений из них.

Склонение прилагательных

Аналогично склонению существительных, надстройка может генерировать любые словоформы для леммы

ФормаОтвечает на вопросДоступные словоформы для склонения
Лемма (единственное число, именительный падеж, мужской род)Какой?Все остальные из 36 словоформ, кроме исходной:
3 рода (мужской, женский, средний) *
2 числа (единственное, множественное) *
6 падежей (именительный, родительный, дательный, винительный, творительный, предложный)
Женский родКакая?6 падежей женского рода ед. числа: именительный (какая?), родительный (какую?), дательный (какой?), винительный (какую?), творительный (какой?), предложный (какой?)
Средний родКакое?

6 падежей среднего рода ед.числа: именительный (какое?), родительный (какое?), дательный (какому?), винительный (какое?), творительный (каким?), предложный (каком?)

Множественное числоКакие?

6 падежей множественного числа (совпадают для мужского, женского и среднего рода):
именительный (какие?), родительный (каких?), дательный (каким?), винительный (каких?), творительный (какими?), предложный (каких?)

Склонение чисел (имен числительных)

Числительные при склонении меняют не только окончания, но и меняются в середине. Алгоритм разработки решения, которое учитывало бы все вариации, довольно сложен и пестрит множеством условий. Надстройка решает и эту задачу. Особенно здорово функции выглядят в сочетании с функционалом число прописью, смотрите пример:

На примере ниже показано склонение обычных числительных. Используется макрос склонения существительных в единственном числе. При этом, если числительные созвучны с прилагательными (например, «тридцать четвёртая»), нужно использовать макросы склонения прилагательных.

число прописью и склонение чисел
Склонение числительных в Excel

Склонение ФИО в Excel

Склонение ФИО отличается от обычного склонения слов по падежам и имеет ряд особенностей:

  • Склонение фамилий зависит от рода имени-отчества — армянские фамилии и фамилии, созвучные с нарицательными существительными, не склоняются для женщин (Абрамян Аревик Альбертовны);
  • При этом они склоняются для мужчин (Хачатуряна Артура Сергеевича);
  • Фамилии склоняются как прилагательные, но в некоторых падежах — иначе
  • Есть ряд исключений в склонении женских имен, например, Любовь — Любови (а не Любви);
  • Есть огромное количество несклоняемых мужских и женских имен, заканчивающихся на те же сочетания букв, что и склоняемые (Эрик склоняется, Аревик — нет);
  • И даже есть имена (например, Адель), являющиеся одновременно и мужскими и женскими, и склоняющиеся по-разному в зависимости от этого.

Реализовать функцию или макрос, которые бы идеально обрабатывали эти кейсы, невероятно сложно. Но все эти проблемы были решены при разработке специальных макросов склонения фамилий-имен-отчеств в !SEMTools.

Корректность работы была проверена на базе в 350.000 ФИО. Для корректной работы список ФИО должен содержать как фамилии, так имена и отчества в их полных формах в именительном падеже. Ниже примеры использования:

Склонение ФИО в родительный падеж

Когда нужно написать в шапке документа, от кого он, когда известна только начальная форма. Пример ниже:

Склонение ФИО в родительном падеже
Склонение ФИО в родительном падеже

Склонение ФИО в дательный падеж

Частая история, когда нужно кому-нибудь что-нибудь выплатить. Полезная сопутствующая функция — сумма прописью с копейками в Excel.

Склонение ФИО в дательном падеже
Склонение ФИО в дательном падеже

Склонение ФИО в винительный падеж

Данная функция понадобится, когда нужно кого-нибудь наградить, перевести в другой отдел или назначить на новую должность.

Склонение ФИО в винительном падеже
Склонение ФИО в винительном падеже

Остальные падежи

Перевод ФИО из именительного в творительный и предложный падежи происходят абсолютно по тому же сценарию:

  • выделяем список,
  • выбираем нужный падеж,
  • получаем результат. Просто и быстро.

Просклонять фразы целиком

Эта новая опция появилась совсем недавно, и по праву делает !SEMTools лучшим решением для склонения слов по падежам, доступным на текущий момент. Ниже основные особенности инструмента, которые позволяют так сказать:

  • Склоняются по падежам и числам все слова фразы — прилагательные, существительные, местоимения и т.д.;
  • Род существительных и прилагательных сохраняется;
  • Слова склоняются в любом регистре и регистр слов сохраняется (3 варианта – нижний, первая буква заглавная, верхний);
  • Надстройка понимает контекст, в котором находится слово, и выбирает, склонять ли его в зависимости от этого (просклоняет «дверной проём», но не будет склонять «с дверной ручкой»);
  • Аббревиатуры не склоняются, за некоторыми общеизвестными исключениями.

Есть еще ряд технических тонкостей, но в итоге все вышеперечисленное позволяет идеально склонять тысячи уникальных фраз без необходимости серьезных правок после.

Кому в первую очередь подойдет инструмент? Конечно же, вебмастерам и копирайтерам.

Склонение списка услуг (пример)

Списки товаров или услуг зачастую состоят далеко не из одного слова, и быстро склонять их для использования в текстах — сэкономить десятки часов времени на наполнение сайта полезным и при этом читабельным контентом. Смотрите пример со склонением услуг автосервиса:

Склонение списка услуг по падежам
Склонение списка услуг по падежам в Excel в пару кликов

Склонение должностей в Excel (пример)

Будет полезно офисным сотрудникам (делопроизводителям, бухгалтерам и др.). Здесь инструмент пригодится для склонения должностей, званий, специальностей и т.д. Смотрите пример со склонением всех ВУС (военно-учетных специальностей):

Хотите попробовать, как будет обработан ваш список фраз?
Установите !SEMTools и попробуйте воспользоваться функционалом!

4 комментария:

ДОбрый день. Что-то не работает функционал по склонению фразы целиком. Лицензия купленая

База для склонения хранится в файле lemms.xlsb? Подскажите по какому принципу, там структурированы данные, чтобы можно было его дополнять самостоятельно.

В целом все просто – в файле просто пары слово и его лемма. Для самостоятельного дополнения нужно либо добавлять данные в середину и потом сортировать, либо переназначать в файле именованный диапазон lemmdict, чтобы он закрывал все пары.
Есть некоторые нюансы связанные с омонимией, но это рассказывать долго, предлагаю этим не заморачиваться.

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

*