Ттест в excell - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Ттест в excell

stasterekhin Просмотр профиля	20.12.2012 - 19:26 Сообщение #1
Группа: Пользователи Сообщений: 6 Регистрация: 11.12.2012 Пользователь №: 24451	Необходимо сравнить 2 группы испытуемых.Сравнивать буду в excell при помощи Ттест. Какие значения необходимо указывать в хвостах и в типе. Кол-во человек в группах разное. И еще вопрос, объясните пожалуйста более популярно, что значит каждое значение в хвостах и в типе, описания на сайте майкрософт типа "1Парный 2Двухвыборочный с равными дисперсиями (гомоскедастический)" я не совсем понимаю.

100$ Просмотр профиля	20.12.2012 - 20:45 Сообщение #2
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(stasterekhin @ 20.12.2012 - 19:26) Необходимо сравнить 2 группы испытуемых.Сравнивать буду в excell при помощи Ттест. Какие значения необходимо указывать в хвостах и в типе. Кол-во человек в группах разное. И еще вопрос, объясните пожалуйста более популярно, что значит каждое значение в хвостах и в типе, описания на сайте майкрософт типа "1Парный 2Двухвыборочный с равными дисперсиями (гомоскедастический)" я не совсем понимаю. Справку Excel'евскую читать не пробовали? Помогает.

Larina Tatjana Просмотр профиля	2.01.2013 - 09:52 Сообщение #3
Группа: Пользователи Сообщений: 49 Регистрация: 3.03.2012 Из: USA Пользователь №: 23536	Цитата(stasterekhin @ 21.12.2012 - 02:56) Необходимо сравнить 2 группы испытуемых.Сравнивать буду в excell при помощи Ттест. Какие значения необходимо указывать в хвостах и в типе. Кол-во человек в группах разное. И еще вопрос, объясните пожалуйста более популярно, что значит каждое значение в хвостах и в типе, описания на сайте майкрософт типа "1Парный 2Двухвыборочный с равными дисперсиями (гомоскедастический)" я не совсем понимаю. Привет, коллега! Вначале о названии пакета. Правильное название этого пакета содержит 1 букву L: Excel . Если неверно напишите в диссертации, это уже будет повод обвинить Вас в незнании. Об этом подробно написано на известном сайте по адресу http://www.biometrica.tomsk.ru/kuzbass7.htm Теперь относительно процедуры t-test в Excel. Не рекомендую её выполнять по одной простой причине: там нет возможности проверить нормальность распределения в группах сравнения. А нормальности, как известно, встречается крайне редко. Об этом подробно пишет в своих книгах уважаемый А.И. Орлов. В итоге Вы вероятнее всего получите ложное заключение, которое потом кто-то опровергнет. Но пока это произойдёт, ложный вывод будет применяться к пациентам. А как Вы помните, Noli nocere!

100$ Просмотр профиля	2.01.2013 - 14:13 Сообщение #4
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(Larina Tatjana @ 2.01.2013 - 09:52) Привет, коллега! Вначале о названии пакета. Правильное название этого пакета содержит 1 букву L: Excel . Если неверно напишите в диссертации, это уже будет повод обвинить Вас в незнании. Об этом подробно написано на известном сайте по адресу http://www.biometrica.tomsk.ru/kuzbass7.htm Теперь относительно процедуры t-test в Excel. Не рекомендую её выполнять по одной простой причине: там нет возможности проверить нормальность распределения в группах сравнения. А нормальности, как известно, встречается крайне редко. Об этом подробно пишет в своих книгах уважаемый А.И. Орлов. В итоге Вы вероятнее всего получите ложное заключение, которое потом кто-то опровергнет. Но пока это произойдёт, ложный вывод будет применяться к пациентам. А как Вы помните, Noli nocere! Ну, что ж, дадим слово проф. Орлову: "Давно известно, что нарушение предпосылок применимости традиционного метода Стьюдента отнюдь не всегда приводит к ошибочным выводам. Например, если объемы выборок велики и примерно равны, то традиционный метод дает правильные выводы, независимо от того, имеют ли элементы выборок нормальные распределения и совпадают ли дисперсии. Подробно об этом написано, например, в упомянутой выше статье: 213. Орлов А.И. О применении статистических методов в медико-биологических исследованиях. - Журнал ?Вестник Академии медицинских наук СССР?. 1987. No.2. С.88-94"

Larina Tatjana Просмотр профиля	4.01.2013 - 10:23 Сообщение #5
Группа: Пользователи Сообщений: 49 Регистрация: 3.03.2012 Из: USA Пользователь №: 23536	Цитата(100$ @ 2.01.2013 - 21:43) Ну, что ж, дадим слово проф. Орлову: "Давно известно, что нарушение предпосылок применимости традиционного метода Стьюдента отнюдь не всегда приводит к ошибочным выводам. Например, если объемы выборок велики и примерно равны, то традиционный метод дает правильные выводы, независимо от того, имеют ли элементы выборок нормальные распределения и совпадают ли дисперсии. Подробно об этом написано, например, в упомянутой выше статье: 213. Орлов А.И. О применении статистических методов в медико-биологических исследованиях. - Журнал ?Вестник Академии медицинских наук СССР?. 1987. No.2. С.88-94" Ну, что ж, ещё раз дадим слово проф. Орлову: Читаем в этой же статье: "Из сказанного выше следует, что распределение результатов медико-биологических наблюдений всегда более или менее отличается от нормального". И далее: "Итак, в большинстве медико-биологических задач условие б) нельзя считать выполненным". И ещё, читаем в его более поздней книге "ЭКОНОМЕТРИКА" (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведенные описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при ?незаконном? применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности". Об этом же он пишет и в своей статье "О проверке однородности двух независимых выборок - Журнал ?Заводская лаборатория?. 2003. Т.69. No.1. С.55-60". Если Вы почитаете книгу Шеффе "Дисперсионный анализа", то найдёте там подробное описание того, как исследовалась проблема устойчивости выводов в случае нарушения 2-х ограничений. Надеюсь Вы знаете, что для случая двух групп t-критерий и F-критерий (в дисперсионном анализе) связаны функционально. Эти связи между 4 основными распределениями подробно описаны в книге Гласса и Стэнли. Кстати, там же подробно описаны и последствия этих нарушений. Не нужно при этом забывать и о том, что результаты перепроверки выводов t-критерия Стьюдента его непараметрическим аналогом - критерием Ван дер Вардена, зависят не только от соблюдения этих 2-х ограничений, но и от таких факторов, как формы кривых распределений и соотношение объёмов выборок. Подробные примеры таких проверок приведены по адресу http://www.biometrica.tomsk.ru/student.htm Там на реальных примерах анализа онкологических данных как раз показано, как влияют эти параметры на результат. И последнее. Сам факт использования пакета EXCEL для проведения статистического анализа уже будет восприниматься отрицательно, поскольку сейчас есть масса стат. пакетов, в т.ч. свободно распространяемых. Поэтому если целью исследования является получение надёжной информации из собранных наблюдений, то рациональнее использовать специализированные стат. пакеты. Тем более, что их использование не столь уж затруднительно. По многим из них есть отличные книги, как в магазинах, так и в сети. Есть курсы по этим пакетам, и т.д. Увы, но в российских мед. организациях нет статистических служб, которые бы выполняли этот анализ. Это на Западе в большинстве медвузов и исследовательских центров есть специализированные службы, которые выполняют анализ силами профессиональных биостатистиков. Об этом и идёт речь в Ереванской Декларации, которую я рекомендовала почитать. Желаю успеха в проведении анализа!

Диагностик Просмотр профиля	3.02.2013 - 05:50 Сообщение #6
Группа: Пользователи Сообщений: 143 Регистрация: 4.09.2012 Пользователь №: 24146	Цитата(Larina Tatjana @ 4.01.2013 - 13:23) Сам факт использования пакета EXCEL для проведения статистического анализа уже будет восприниматься отрицательно, поскольку сейчас есть масса стат. пакетов, в т.ч. свободно распространяемых. Поэтому если целью исследования является получение надёжной информации из собранных наблюдений, то рациональнее использовать специализированные стат. пакеты. Результаты t-теста зависят от применяемого пакета? Странно.

nokh Просмотр профиля	3.02.2013 - 08:32 Сообщение #7
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Диагностик @ 3.02.2013 - 08:50) Результаты t-теста зависят от применяемого пакета? Странно. Результаты не должны зависеть от пакета, и речь шла не об этом. Во-первых, действительно, существует несколько вариантов t-критерия Стьюдента: 1. Одновыборочный - для сравнения выборочного среднего с теоретическим, 2. Для независимых выборок с неизвестной и равной дисперсией, 3. Для независимых выборок с неизвестной и неравной дисперсией (подход Уэлча - Welsh's test), 4. Для сравнения единственного значения с выборкой, 5. Для анализа зависимых выборок (или парный t-критерий). Про какой из этих t-тестов вы говорите? Хороший пакет должен либо предоставлять удобную возможность задать всё это, либо выбрать нужный вариант из списка. Excel не настолько богат своей статистической надстройкой, а задание этих методов вручную через формулы трудоёмко (неудобно) и сопряжено с ошибками. Во-вторых, так сложилось исторически, что за фразой "статистическую обработку проводили стандартными методами вариационной статистики в пакете Excel" традиционно стояла полная некомпетентность исследователя в вопросах статистического анализа данных, призванная онную скрыть. Это как написать, что "диагностику проводили на диагностическом оборудовании" и даже хуже (см. ниже). И все более-менее серьёзные исследователи это знают. В-третьих, как написала Larina Tatjana, существует масса профессиональных пакетов для статобработки данных. Более того, хорошие пакеты ещё и "заточены" по своему функционалу для работы в тех или иных областях науки, т.е. содержат те или иные уникальные методы и критерии из области биометрии, эконометрии, психометрии, технометрии и т.п. Однако пакет Excel - вообще не статпакет, это - замечательный процессор электронных таблиц. Да, он предоставляет возможность посчитать кое-какую статистику. Как и термокомпенсатор рН-метра предоставляет возможность измерить температуру. Но если вы напишете, что "температуру в помещении измеряли датчиком от рН-метра", в ваши выводы, возможно, и поверят, но вопрос об адекватности исследователя встанет очень жёстко и в журнал такую статью не примут. Поэтому когда я читаю про стат. обработку в экселе у меня возникают вопросы: об уровне подготовленности и адекватности исследователя, об уровне подготовленности и адекватности научного руководители, об уровне подготовленности и адекватности соавторов, об об уровне опубликовавшего статью журнала. В четвёртых, статистические алгоритмы, заложенные в микрософтовские программные библиотеки несовершенны. Excel не проходит тестов на точность, которую должны демонстрировать хорошие статпакеты - это уже обсуждалось на форуме. И хотя на практике вы вряд ли станете жертвой этой неточности, но профессионалы знают об этом и не воспримут в качестве профессионала вас. Вопросы профессионализма и репутации выходят далеко за рамки обсуждаемого вопроса. Для многих сейчас они, похоже, вообще не стоят: постоянно сталкиваюсь с ситуациями, когда казалось-бы респектабельные учёные ставят свою фамилию впереди по-детски безграмотных тезисов своих аспирантов (мой научный руководитель не хотела даже быть в списке авторов аспирантских по своему уровню работ). Но тут уж кто за чем в науку пришёл... Сообщение отредактировал nokh - 3.02.2013 - 08:41

Диагностик Просмотр профиля	3.02.2013 - 13:04 Сообщение #8
Группа: Пользователи Сообщений: 143 Регистрация: 4.09.2012 Пользователь №: 24146	Цитата(nokh @ 3.02.2013 - 11:32) В-третьих, как написала Larina Tatjana, существует масса профессиональных пакетов для статобработки данных. Более того, хорошие пакеты ещё и "заточены" по своему функционалу для работы в тех или иных областях науки, т.е. содержат те или иные уникальные методы и критерии из области биометрии, эконометрии, психометрии, технометрии и т.п. Однако пакет Excel - вообще не статпакет, это - замечательный процессор электронных таблиц. Да, он предоставляет возможность посчитать кое-какую статистику. Поэтому когда я читаю про стат. обработку в экселе у меня возникают вопросы: об уровне подготовленности и адекватности исследователя, об уровне подготовленности и адекватности научного руководители, об уровне подготовленности и адекватности соавторов, об об уровне опубликовавшего статью журнала. Когда я читаю об обработке данных в любом статпакете я сильно сомневаюсь в результатах такой обработки. Человек механически вбил данные, за него что-то посчитали по непонятным алгоритмам и выдали результат. Всё надо считать вручную. Сообщение отредактировал Диагностик - 3.02.2013 - 15:21

100$ Просмотр профиля	3.02.2013 - 14:29 Сообщение #9
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Резюме: считать надо на клочке бумаги вручную, а в статье (диссертации и т.д.) писать: Statistica, Stata, SPSS, SAS и т.д. Для солидности. Сообщение отредактировал 100$ - 3.02.2013 - 14:30

nokh Просмотр профиля	4.02.2013 - 18:41 Сообщение #10
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Диагностик @ 3.02.2013 - 16:04) Когда я читаю об обработке данных в любом статпакете я сильно сомневаюсь в результатах такой обработки. Человек механически вбил данные, за него что-то посчитали по непонятным алгоритмам и выдали результат. Всё надо считать вручную. А я не верю ручным расчётам. И никто не поверит. Потому что ВСЕ ошибаются, потому что даже в крутых статпакетах время от времени обнаруживаются ошибки, а в справочной литературе - ошибки в формулах. Но я с вами согласен в том, что вручную считать полезно - на начальных этапах или когда важно разобраться с алгоритмом работы метода. Когда метод освоен нет необходимости тратить драгоценное время на расчёты снова и снова; нужно найти пакет, который выдаёт такие же результаты и пользоваться для данного анализа им. Я считал вручную и многофакторные дисперсионные комплексы, и главные компоненты (правда только для трёх показателей - не хотелось возиться с итерационным поиском корней уравнений больших степеней). Считаю, что это было полезным. Когда вы в своём развитии (в хорошем смысле) дойдёте до итерационных процедур и ресэмплинга, то однозначно перейдёте на программный расчёт.

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2024 IPS, Inc.