понедельник, 23 апреля 2007 г.

Фразеологический анализ

Ну, все что было раньше - это так, вступление. А теперь, наверное, самое интересное - алгоритм находится в разработке в данный момент, соответственно, есть возможность приложить свою руку к его созданию... Цель: получив на входе предложение выделить в нем все фразы и подготовить предложение к дальнейшей обработке. Примечание: здесь и далее, если это не оговорено особо, под предложением понимается его реализация в системе TMStr или TRStr (по умолчанию - TMStr), под словом - TMWord. Начнем, пожалуй с выработки теории. Я предполагаю, что фраза (как группа слов) характеризуется двумя независимыми параметрами: 1.
  • единой, как, например, going to
  • разрывной, как, например, so ... as

2.

  • постоянной, т.е. группа слов будет переводиться строго определенным образом вне зависимости от переводов отдельных слов группы. Пример - shut up.
  • непостоянной, т.е. группа слов может восприниматься и как единое целое и как каждое слово, образующее группу, поотдельности.

Кроме того, следует пожалуй учесть, что для некоторых постоянных/непостоянных фраз существуют слова-модификаторы, которые меняют вторую характеристику фразы на противоположное значение. Пример:

  1. i was going to do smth
  2. i was going to smth

В первом случае наличие глагола после to полностью меняет значение фразы going to.

P.S.: безусловно, все вышеизложенное - спорно и не факт что близко к реальности... Но в любом случае - пока что чего-то более умного мне в голову не пришло

Комментариев нет:

Отправить комментарий