Два дня экспериментирую с грамматикой связей (взял здесь
http://www.codeplex.com/sharpnlp). В принципе, встроить ее в мою программу можно легко. Однако есть некоторые проблемы.
В комплекте с библиотекой идут .nbin файлы в которых и содержится описание грамматики. Если использовать их - то при парсинге эти файлы полностью грузятся в память - это порядка 250 Мб. Есть альтернативный вариант - использовать sqlite. В этом случае - используется порядка 30 Мб памяти, но! скорость резко падает - я так и не дождался когда будет обработан текстовый пример. Кроме того, примерно в 3 раза больше места требуется для файлов моделей.
Попробую ее полностью прикрутить к переводчику (пока что парсер я еще не подключал) - посмотрю что получится на выходе...
Комментариев нет:
Отправить комментарий