среда, 30 июля 2008 г.

Базы данных для семантического анализа

Вот здесь можно скачать базы данных, которые потенциально можно использовать в алгоритмах семантического анализа. Базы созданы на основе википедии и содержат 2.18 миллионов понятий, включая информацию о 80,000 людях, 293,000 местах, 62,000 музыкальных альбомах и 36,000 фильмах. Кроме того, в DBpedia содержится порядка 218 миллионов триплетов (см. RDF).

К сожалению - всё это дело на английском языке. Но, например, для моего переводчика использовать всё-таки можно (теоретически). А уж если где-то еще найти и на русском - то будет вообще замечательно...

Вообщем, пока поставлю в планы как "посмотреть" :) Хочется сначала доделать основноую часть переводчика. Конец уже близок...

Комментариев нет:

Отправить комментарий