Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Методология анализа данных
scholar
сообщение 28.01.2018 - 23:15
Сообщение #1





Группа: Пользователи
Сообщений: 14
Регистрация: 28.01.2018
Пользователь №: 30897



Добрый день, искал форум где помогают по статистическим методам, нашел ваш. У меня есть большая просьба к опытным математикам и статистикам, чтобы подтолкнуть меня к идее, какие я могу проверить гипотезы, используя данные, собранные из социальной сети.
У меня есть следующие данные с 40 переменными (26 переменных с пабликами и 14 с демографическими переменными). Например.

У меня есть 26 разных групп (1 человек подписался на этот паблик, 0 человек не подписался на этот паблик. Эти паблики имеют разную направленность.)
Например

бизнес (1 подписка, 0 не подписан)



У меня есть несколько десятков тысяч наблюдений.
Скажите, пожалуйста, на основе таких данных, что мы можем сделать, какие гипотезы можно поставить и проверить.
Все, что я решил, это просто проверить гипотезу о том, что группы похожи друг на друга в одном и том же пространстве. Т.е. выполнить анализ соответствий по группам, но все же что-то можно извлечь из данных для извлечения?
Поскольку исходная цель не была установлена, есть данные, из которых что-то нужно извлечь, поэтому я прошу профессиональных математиков и статистиков помочь мне подумать о том, что можно извлечь из этих данных.
Спасибо.

Сообщение отредактировал scholar - 24.02.2018 - 18:56
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
scholar
сообщение 29.01.2018 - 14:48
Сообщение #2





Группа: Пользователи
Сообщений: 14
Регистрация: 28.01.2018
Пользователь №: 30897



Спасибо за ответы. Вопрос к leo_biostat.
Вы пишите.
Цитата
Тогда как профессионал в статистике для этой задачи может ещё и определить интенсивности
этой связи, СТРУКТУРУ ЭТОЙ СВЯЗИ, возможности изменения количества группировок в анализируемых признаках, и т.д.

Как мне изучить структуру связи двух качественных признаков, после таблицы сопряженности
Цитата
При этом в логистической регрессии использовать разные варианты наборов потенциальных предикторов. И с помощью анализа таблицы сопряжённости провести оценку фактических и прогнозных
распределений сравниваемых групп. Повторю, что в этом случае можно оценить не только уровень связи этой пары признаков (факт и прогноз), но и СТРУКТУРУ СВЯЗИ.

Здесь тоже непонятно, логистическая регрессия предсказывает вероятность наступления события, но зависима переменная там обычно уже задана.
А как мне её из этих данных получить?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему