Здравствуйте, гость ( Вход | Регистрация )
28.01.2018 - 23:15
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 28.01.2018 Пользователь №: 30897 |
Добрый день, искал форум где помогают по статистическим методам, нашел ваш. У меня есть большая просьба к опытным математикам и статистикам, чтобы подтолкнуть меня к идее, какие я могу проверить гипотезы, используя данные, собранные из социальной сети.
У меня есть следующие данные с 40 переменными (26 переменных с пабликами и 14 с демографическими переменными). Например. У меня есть 26 разных групп (1 человек подписался на этот паблик, 0 человек не подписался на этот паблик. Эти паблики имеют разную направленность.) Например бизнес (1 подписка, 0 не подписан) У меня есть несколько десятков тысяч наблюдений. Скажите, пожалуйста, на основе таких данных, что мы можем сделать, какие гипотезы можно поставить и проверить. Все, что я решил, это просто проверить гипотезу о том, что группы похожи друг на друга в одном и том же пространстве. Т.е. выполнить анализ соответствий по группам, но все же что-то можно извлечь из данных для извлечения? Поскольку исходная цель не была установлена, есть данные, из которых что-то нужно извлечь, поэтому я прошу профессиональных математиков и статистиков помочь мне подумать о том, что можно извлечь из этих данных. Спасибо. Сообщение отредактировал scholar - 24.02.2018 - 18:56 |
|
|
![]() |
![]() |
![]() |
29.01.2018 - 14:48
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 28.01.2018 Пользователь №: 30897 |
Спасибо за ответы. Вопрос к leo_biostat.
Вы пишите. Цитата Тогда как профессионал в статистике для этой задачи может ещё и определить интенсивности этой связи, СТРУКТУРУ ЭТОЙ СВЯЗИ, возможности изменения количества группировок в анализируемых признаках, и т.д. Как мне изучить структуру связи двух качественных признаков, после таблицы сопряженности Цитата При этом в логистической регрессии использовать разные варианты наборов потенциальных предикторов. И с помощью анализа таблицы сопряжённости провести оценку фактических и прогнозных распределений сравниваемых групп. Повторю, что в этом случае можно оценить не только уровень связи этой пары признаков (факт и прогноз), но и СТРУКТУРУ СВЯЗИ. Здесь тоже непонятно, логистическая регрессия предсказывает вероятность наступления события, но зависима переменная там обычно уже задана. А как мне её из этих данных получить? |
|
|
![]() |
![]() |
scholar Методология анализа данных 28.01.2018 - 23:15
passant На самом деле вопрос перевернут с ног на голову. ... 29.01.2018 - 01:58
leo_biostat Цитата(scholar @ 28.01.2018 - 23:15)... 29.01.2018 - 10:41
100$ Школяр,
я полностью согласен с предыдущими оратора... 29.01.2018 - 14:27
leo_biostat Цитата(scholar @ 29.01.2018 - 14:48)... 29.01.2018 - 15:43![]() ![]() |