Вот здесь можно скачать базы данных, которые потенциально можно использовать в алгоритмах семантического анализа. Базы созданы на основе википедии и содержат 2.18 миллионов понятий, включая информацию о 80,000 людях, 293,000 местах, 62,000 музыкальных альбомах и 36,000 фильмах. Кроме того, в DBpedia содержится порядка 218 миллионов триплетов (см. RDF).
К сожалению - всё это дело на английском языке. Но, например, для моего переводчика использовать всё-таки можно (теоретически). А уж если где-то еще найти и на русском - то будет вообще замечательно...
Вообщем, пока поставлю в планы как "посмотреть" :) Хочется сначала доделать основноую часть переводчика. Конец уже близок...
Санкции не работают
месяц назад
Комментариев нет:
Отправить комментарий