Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Построение таблиц сопряженности с пакете Статистика 6.0
Pyrosmani
сообщение 7.02.2010 - 14:50
Сообщение #1





Группа: Пользователи
Сообщений: 94
Регистрация: 6.02.2010
Из: Клайпеда
Пользователь №: 10967



Уважаемые коллеги! Подскажите пожалуйста, как построить таблицы кросстабуляции в пакете Статистика 6.0. В Excel приходится вводить формулы, что несколько затрудняет работу. В большинстве литературных источников построения в Статистике 6.0 ограничиваются примером четырехпольной таблицы. Подскажите можно ли строить таблицы, в которых учитывается более 2 значений для каждого признака ( прим.1) в модуле Таблицы сопряженности и как это сделать. В книге Ребровой О.Ю. не рассматриваются примеры построения таблиц с числом строк и столбцов более 2 (без итоговых) при наличии известных значений наблюдаемых частот, и предлагается воспользоваться модулем Логлинейный анализ.
Как рассчитать хи-квадрат для случаев, когда частоты меньше 5 или равны 0(прим.2). И подскажите, как перенести наблюдаемые и ожидаемые частоты из Эксель(указываются на одном листе) в Статистику (файл2).

Я еще прикрепил пару задач (в файле1), взятых из методичек для ВУЗов и прошу, если есть возможность и время, описать алгоритм их решения и построения таблиц кросстабуляции в Статистика 6.0, чтобы понять как решать подобные задачи применительно к результатам моего исследования.
Прикрепленные файлы
Прикрепленный файл  Результаты_лечения.doc ( 163 килобайт ) Кол-во скачиваний: 1261
Прикрепленный файл  как_перенести_данные_из_Эксель_в_Статистику6.0_.doc ( 32 килобайт ) Кол-во скачиваний: 1137
 


Signature
Cogito ergo sum
Nemo omnia potest scire
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Green
сообщение 16.02.2010 - 11:32
Сообщение #2





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Напишу сейчас, потом времени не будет.

Из этого рисунка неумолимо следует следующее:
1. Вы напрасно делали 4 уровня состояния, достаточно двух ( хорошо/плохо).
2. Никаких линейных трендов тут не будет.

==
Основные Ваши ошибки:
1. Шкала времени - количественная, Вы ее разбили на участки причем непропорциональные.( Т.е. уже исказили линейность)
2. Изучением событий и их появлением во времени занимается эпид. статистика, специальные методы, где считается, что события происходят по закону Пуассона во времени. Никакой линейности у Пуассона нет и не было никогда.
Таблицы частот обычно строятся для когорты, в которой все наблюдения закончены (Ваш случай). Изучается частоты, связанные с воздействием разных факторов, но не времени!. ( Ваша вторая таблица)
Когда всупает такой показатель, как время - используются таблицы дожития, Каплан-Майер и проч.
3. Попытка использовать стат.методы, не валидные для этих данных, к успеху не приведут.

Хорошие новости: Никто не мешает получить результаты типа
1. Объединив отл. и хор. в хороших, уд. и неуд. в плохих
Вероятность получить хор. результат при лечении до года... составляет 0.6645, ДИ(0.5835, 0.7389).
2. Лечение эффективно первые четыре месяца, отношение шансов 2.1892 ДИ (1.4605, 3.2911)
Все эти показатели не привязаны ко времени, частоты имеют биноминальное распределение.
3. Если хотите изучать наблюдения во времени, вам придется знакомится с survival analysis.

Рекомендация - не бойтесь статистики, это не использование сложных мат. методов, а в первую очередь, собственной головы и понимания своих данных. 60-70% -осознание данных и выбор адекватных методов, 5-10 % подготовка данных, 5-10% освоение стат. пакетов, 10% - оформление результата.

Впрочем, Вам решать smile.gif
Ваша вторая таблица может быть проанализирована, как предлагал nokh.

nokh, мои извинения.

Сообщение отредактировал Green - 16.02.2010 - 11:36


Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pyrosmani
сообщение 18.02.2010 - 12:26
Сообщение #3





Группа: Пользователи
Сообщений: 94
Регистрация: 6.02.2010
Из: Клайпеда
Пользователь №: 10967



Цитата(Green @ 16.02.2010 - 11:32) *
Из этого рисунка неумолимо следует следующее:
1. Вы напрасно делали 4 уровня состояния, достаточно двух ( хорошо/плохо).
2. Никаких линейных трендов тут не будет.


Возможно, что достаточно и 2-х уровней (с позиций статистики), но есть нюанс- каждой из позиций (отличн., хорошо, удовлетворительно, неудовлетворительно) соответствуют определенные эндоскопически выверенные показатели просвета пищевода (чего уж там скрывать) и соотвественно им - клинические проявления. Поэтому если, к примеру, неудовл. результаты- соответствуют практически полной дисфагии, когда даже вода проходит через рубцово-измененный пищевод с трудом, больные говорят что буквально по глотку пьют воду (как птицы); то при удовлетворительных- пациенты могут питаться измельченной или полужидкой пищей. Таким образом, невозможно объединить столь разные результаты под одной категорией "плохо".
Все-таки как и указывал Nokh выявлена отрицательная статистически значимая связь между анализируемыми признаками (по табл.1), т.е. тенденция есть.


Цитата
Основные Ваши ошибки:
1. Шкала времени - количественная, Вы ее разбили на участки причем непропорциональные.( Т.е. уже исказили линейность)
2. Изучением событий и их появлением во времени занимается эпид. статистика, специальные методы, где считается, что события происходят по закону Пуассона во времени. Никакой линейности у Пуассона нет и не было никогда.
Таблицы частот обычно строятся для когорты, в которой все наблюдения закончены (Ваш случай). Изучается частоты, связанные с воздействием разных факторов, но не времени!. ( Ваша вторая таблица)
Когда всупает такой показатель, как время - используются таблицы дожития, Каплан-Майер и проч.
3. Попытка использовать стат.методы, не валидные для этих данных, к успеху не приведут.


Я честно говоря не понимаю как представить время в виде качественной шкалы. Что касается непропорциональности временных интервалов- это конечно моя недоработка и скорее всего я ее исправлю ( будут группы 1-2 мес, 3-4 мес, 5-6 мес, 7 и более мес).

Основная закавыка в том, что я не занимаюсь изучением проявления событий во времени. Давайте расставим точки над i. Моя ошибка- я сознательно изменил заголовок таблицы 1, чтобы завуалировать полученные мною в ходе исследования данные, причем сделал это не самым удачным образом. В то же время в топиках я указывал, что в 1 табл. анализируется зависимость результатов бужирования от времени, прошедшего с момента ожога до начала бужирования, таким образом получается, что на момент начала бужирования, самого события (т.е. результатов этого самого бужирования) не было. И время здесь
эквивалентно качественным изменениям- а именно выраженности рубцового процесса
в пищеводе на момент начала бужирования. Длительность последующего бужирования не является основным лимитирующим фактором для наступления исхода. Она зависит от таких факторов как степень сужения пищевода, протяженность стриктуры, наличие сопутствующей патологии (рефлюкс-эзофагит) и т.д. Я уже писал, что с течением времени в пораженном органе процессы рубцевания прогрессируют, поэтому чем раньше начинается бужирование, тем больше шансов разбужировать пищевод и избежать операции.

1; 1,5; 2 мес и т.д. - это не длительность бужирования, это время с момента ожога до начала бужирования

Цитата
Хорошие новости: Никто не мешает получить результаты типа
1. Объединив отл. и хор. в хороших, уд. и неуд. в плохих
Вероятность получить хор. результат при лечении до года... составляет 0.6645, ДИ(0.5835, 0.7389).
2. Лечение эффективно первые четыре месяца, отношение шансов 2.1892 ДИ (1.4605, 3.2911)
Все эти показатели не привязаны ко времени, частоты имеют биноминальное распределение.
3. Если хотите изучать наблюдения во времени, вам придется знакомится с survival analysis.

Рекомендация - не бойтесь статистики, это не использование сложных мат. методов, а в первую очередь, собственной головы и понимания своих данных. 60-70% -осознание данных и выбор адекватных методов, 5-10 % подготовка данных, 5-10% освоение стат. пакетов, 10% - оформление результата.

Впрочем, Вам решать smile.gif


Что касается объединения результатов я уже написал. Понимание данных исследования пока не склоняет чашу весов в сторону анализа выживаемости. С освоением статистических пакетов пока слабовато - ни один из тех, которые у меня есть, не освоен на все 100%- не хватает времени, чтобы разбирать клинические задачи применительно конкретным пакетам. Кроме того, насколько я понимаю, на сегодняшний день нет ни одного пакета, в котором было бы реализовано все многообразие статистик, большинство пакетов ориентировано на работу с исходными данными и лишь единицы позволяют работать с уже построенными таблицами частот. Лишь единичные пакеты имеют русификацию и подробное, а главное доступное и наглядное описание имеющихся в них функций применительно к конкретным задачам. Ну и главное отсутствие должной подготовки- все-таки мне кажется статистику надо читать именно аспирантам и разбирать каждый метод применительно к задачам, которые могут быть поставлены исследователем. У нас же медстатистика изучается как раз с позиций эпидемиологии и в основном такие аспекты как рождаемость, смертность, заболеваемость, средний койко-день и т.д.

Сообщение отредактировал Pyrosmani - 18.02.2010 - 12:32


Signature
Cogito ergo sum
Nemo omnia potest scire
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Pyrosmani   Построение таблиц сопряженности с пакете Статистика 6.0   7.02.2010 - 14:50
- - DoctorStat   Цитата(Pyrosmani @ 7.02.2010 - 14:50...   7.02.2010 - 17:35
|- - Игорь   Цитата(DoctorStat @ 7.02.2010 - 17:3...   8.02.2010 - 09:07
- - nokh   >Pyrosmani Уточните пожалуйста что Вам нужно: (...   8.02.2010 - 00:43
- - Pyrosmani   Большое спасибо всем кто откликнулся! 2 nokh:...   8.02.2010 - 21:07
- - Green   >Я еще прикрепил пару задач (в файле1), взятых ...   8.02.2010 - 22:09
- - nokh   Как уже заметила Green, входы вашей таблицы сопряж...   8.02.2010 - 23:56
- - Green   StatXact 8.0 -trial на 30 дней. У них там есть Sta...   9.02.2010 - 16:44
- - Pyrosmani   Спасибо Green и nokh! Извините за долгое мо...   11.02.2010 - 23:30
- - nokh   Все категории делятся на номинальные (нельзя упоря...   12.02.2010 - 22:45
|- - Pyrosmani   Цитата(nokh @ 12.02.2010 - 22:45) 1)...   14.02.2010 - 20:26
|- - nokh   1. По расчёту ожидаемых. Действительно, оба критер...   14.02.2010 - 23:11
|- - Pyrosmani   Цитата(nokh @ 14.02.2010 - 23:11) 1....   15.02.2010 - 01:54
- - Green   Pyrosmani, 1. StatXact - создает файл с расширени...   14.02.2010 - 21:42
|- - Pyrosmani   Цитата(Green @ 14.02.2010 - 21:42) P...   15.02.2010 - 00:37
- - Green   Т.е. у вас была когорта пациентов с разными времен...   15.02.2010 - 11:52
- - Green   И еще, навскидку Рисунок понятен?   15.02.2010 - 16:47
- - Green   Напишу сейчас, потом времени не будет. Из этого р...   16.02.2010 - 11:32
|- - nokh   Цитата(Green @ 16.02.2010 - 13:32) Н...   17.02.2010 - 07:25
||- - Pyrosmani   Nokh благодарю за помощь, которую Вы мне оказывает...   18.02.2010 - 10:26
||- - nokh   ЦитатаЕще, если Вас не затруднит, укажите пожалуйс...   18.02.2010 - 22:53
||- - Pyrosmani   Цитата(nokh @ 18.02.2010 - 22:53) So...   19.02.2010 - 00:06
||- - nokh   1 ч 37 мин - ставил точку в "Exact" + ве...   19.02.2010 - 00:54
||- - Pyrosmani   Цитата(nokh @ 19.02.2010 - 00:54) 1 ...   19.02.2010 - 02:35
||- - Игорь   Цитата(Pyrosmani @ 19.02.2010 - 03:3...   19.02.2010 - 06:52
|- - Pyrosmani   Цитата(Green @ 16.02.2010 - 11:32) И...   18.02.2010 - 12:26
- - Green   Да, в данном случае я ошиблась, если это "Вре...   22.02.2010 - 21:47
|- - Pyrosmani   Цитата(Green @ 22.02.2010 - 21:47) Д...   22.02.2010 - 23:32
|- - nokh   Цитата(Green @ 22.02.2010 - 23:47) N...   23.02.2010 - 10:54
|- - Pyrosmani   Цитата(nokh @ 23.02.2010 - 10:54) ...   24.02.2010 - 04:20
- - Green   Pyrosmani, спасибо! У меня еще один небольшой...   23.02.2010 - 09:24
|- - Pyrosmani   Цитата(Green @ 23.02.2010 - 09:24) P...   24.02.2010 - 06:11
- - Pyrosmani   При обследовании 113 пациентов, которым ранее пров...   28.02.2010 - 06:47


Добавить ответ в эту темуОткрыть тему