Методология анализа данных |
Здравствуйте, гость ( Вход | Регистрация )
Методология анализа данных |
28.01.2018 - 23:15
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 28.01.2018 Пользователь №: 30897 |
Добрый день, искал форум где помогают по статистическим методам, нашел ваш. У меня есть большая просьба к опытным математикам и статистикам, чтобы подтолкнуть меня к идее, какие я могу проверить гипотезы, используя данные, собранные из социальной сети.
У меня есть следующие данные с 40 переменными (26 переменных с пабликами и 14 с демографическими переменными). Например. У меня есть 26 разных групп (1 человек подписался на этот паблик, 0 человек не подписался на этот паблик. Эти паблики имеют разную направленность.) Например бизнес (1 подписка, 0 не подписан) У меня есть несколько десятков тысяч наблюдений. Скажите, пожалуйста, на основе таких данных, что мы можем сделать, какие гипотезы можно поставить и проверить. Все, что я решил, это просто проверить гипотезу о том, что группы похожи друг на друга в одном и том же пространстве. Т.е. выполнить анализ соответствий по группам, но все же что-то можно извлечь из данных для извлечения? Поскольку исходная цель не была установлена, есть данные, из которых что-то нужно извлечь, поэтому я прошу профессиональных математиков и статистиков помочь мне подумать о том, что можно извлечь из этих данных. Спасибо. Сообщение отредактировал scholar - 24.02.2018 - 18:56 |
|
29.01.2018 - 14:48
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 28.01.2018 Пользователь №: 30897 |
Спасибо за ответы. Вопрос к leo_biostat.
Вы пишите. Цитата Тогда как профессионал в статистике для этой задачи может ещё и определить интенсивности этой связи, СТРУКТУРУ ЭТОЙ СВЯЗИ, возможности изменения количества группировок в анализируемых признаках, и т.д. Как мне изучить структуру связи двух качественных признаков, после таблицы сопряженности Цитата При этом в логистической регрессии использовать разные варианты наборов потенциальных предикторов. И с помощью анализа таблицы сопряжённости провести оценку фактических и прогнозных распределений сравниваемых групп. Повторю, что в этом случае можно оценить не только уровень связи этой пары признаков (факт и прогноз), но и СТРУКТУРУ СВЯЗИ. Здесь тоже непонятно, логистическая регрессия предсказывает вероятность наступления события, но зависима переменная там обычно уже задана. А как мне её из этих данных получить? |
|
29.01.2018 - 15:43
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Спасибо за ответы. Вопрос к leo_biostat. Вы пишите. Как мне изучить структуру связи двух качественных признаков, после таблицы сопряженности Здесь тоже непонятно, логистическая регрессия предсказывает вероятность наступления события, но зависима переменная там обычно уже задана. А как мне её из этих данных получить? Увы, эти аспекты доступны лишь профессиональным статистикам. Т.к. для их реализации нужно очень хорошо знать теории всех эти методов. Если желаете подробнее обсудить эти вопросы, то можете вызвать меня по Скайпу. Мой ник leo_1911 Сообщение отредактировал leo_biostat - 29.01.2018 - 17:14 |
|