суббота, 14 февраля 2009 г.

после страшной пятницы 13 холодного февраля


Удалось подключить модуль optimize, который рассматривали на лекциях по питону, к проблеме выбора оптимального набора признаков.  Теперь с помощью серии алгоритмов можно выбирать эти самые признаки...Ура!... Думаю стоит отметить критерии отбора этих признаков. Их два : 1) каждый с каждый должны пересекаться по минимальному набору объектов 2) объединение объектов, имеющих эти признаки должно быть наибольшим. Если будут мысли по поводу какие критерии нужно учитывать, то пишите. Сразу проверил эти алгоритмы на данных по американским блогам(весь период). Я отбирал 20 признаков разными алгоритмами, затем строил контекст только для этих 20 признаков и через FasterStabilityTest находил устойчивые формальные понятия. Сразу стоит отметить, что таких понятий получалось очень много.  Затем файлы ...i-stability.cxt строил в conexp, примерно для 30-50 понятий.