вторник, 10 марта 2009 г.

группы бывают разные, политики, религия и ост


В один из сессионых дней было принято решение разделить все наши слова-признаки по блогам на 4 части: политики(pol), их 6 ('john_edwards', 'huckabee', 'mitt_romney', 'giuliani' ,'barack_obama', 'john_mccain', 'hillary_clinton'), topical descriptors(TD) : global warming, climate change, immigrati,nuclear, environment, war, gun, tax cuts, foreign policy, abortion,
recession, national security, supreme court, human right, terrorist,terror, gay; regional descriptors(RD): iran, china, gaza, palestin, british, israel,iraq, afghan, pakistan, mexico, vietnam, africa, middle east, europe; religious descriptors(REL_D): muslim, islam, christian, jewish. Надо сразу отметить, что такие группы были выделены не без помощи наших французких коллег и вся работа проводилась за 100 день. Так вот, вся информация за 100 день была поделен на 4 части и затем обработана FasterStabilitytest-ом с той целью чтобы в дальнейшем посмотреть насколько связаными будут группы интенсионально. Попытался сравнить группы признаков интенсионально функцией select_intensionally_related, но в результате получил, что друг с другом группы плохо связаны(каждая группа признаков с решеткой лежит в отд файле, т.е. я сравнивал их друг с другом). Вспомнил про "ужасную функцию " nest, решил попробывать, и записал результаты сравнения в файл. Затем его опять обработал FasterStabilitytest-ом и построил решетку для первых 20-25 контекстов, которую и вставил сюда.