Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Ттест в excell
stasterekhin
сообщение 20.12.2012 - 19:26
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 11.12.2012
Пользователь №: 24451



Необходимо сравнить 2 группы испытуемых.Сравнивать буду в excell при помощи Ттест.
Какие значения необходимо указывать в хвостах и в типе. Кол-во человек в группах разное. И еще вопрос, объясните пожалуйста более популярно, что значит каждое значение в хвостах и в типе, описания на сайте майкрософт типа "1Парный 2Двухвыборочный с равными дисперсиями (гомоскедастический)" я не совсем понимаю.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 20.12.2012 - 20:45
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(stasterekhin @ 20.12.2012 - 19:26) *
Необходимо сравнить 2 группы испытуемых.Сравнивать буду в excell при помощи Ттест.
Какие значения необходимо указывать в хвостах и в типе. Кол-во человек в группах разное. И еще вопрос, объясните пожалуйста более популярно, что значит каждое значение в хвостах и в типе, описания на сайте майкрософт типа "1Парный 2Двухвыборочный с равными дисперсиями (гомоскедастический)" я не совсем понимаю.


Справку Excel'евскую читать не пробовали? Помогает.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Larina Tatjana
сообщение 2.01.2013 - 09:52
Сообщение #3





Группа: Пользователи
Сообщений: 49
Регистрация: 3.03.2012
Из: USA
Пользователь №: 23536



Цитата(stasterekhin @ 21.12.2012 - 02:56) *
Необходимо сравнить 2 группы испытуемых.Сравнивать буду в excell при помощи Ттест.
Какие значения необходимо указывать в хвостах и в типе. Кол-во человек в группах разное. И еще вопрос, объясните пожалуйста более популярно, что значит каждое значение в хвостах и в типе, описания на сайте майкрософт типа "1Парный 2Двухвыборочный с равными дисперсиями (гомоскедастический)" я не совсем понимаю.

Привет, коллега!
Вначале о названии пакета. Правильное название этого пакета содержит 1 букву L: Excel . Если неверно напишите в диссертации, это уже будет повод обвинить Вас в незнании. Об этом подробно написано на известном сайте по адресу http://www.biometrica.tomsk.ru/kuzbass7.htm
Теперь относительно процедуры t-test в Excel. Не рекомендую её выполнять по одной простой причине: там нет возможности проверить нормальность распределения в группах сравнения. А нормальности, как известно, встречается крайне редко. Об этом подробно пишет в своих книгах уважаемый А.И. Орлов. В итоге Вы вероятнее всего получите ложное заключение, которое потом кто-то опровергнет. Но пока это произойдёт, ложный вывод будет применяться к пациентам. А как Вы помните, Noli nocere!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 2.01.2013 - 14:13
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Larina Tatjana @ 2.01.2013 - 09:52) *
Привет, коллега!
Вначале о названии пакета. Правильное название этого пакета содержит 1 букву L: Excel . Если неверно напишите в диссертации, это уже будет повод обвинить Вас в незнании. Об этом подробно написано на известном сайте по адресу http://www.biometrica.tomsk.ru/kuzbass7.htm
Теперь относительно процедуры t-test в Excel. Не рекомендую её выполнять по одной простой причине: там нет возможности проверить нормальность распределения в группах сравнения. А нормальности, как известно, встречается крайне редко. Об этом подробно пишет в своих книгах уважаемый А.И. Орлов. В итоге Вы вероятнее всего получите ложное заключение, которое потом кто-то опровергнет. Но пока это произойдёт, ложный вывод будет применяться к пациентам. А как Вы помните, Noli nocere!



Ну, что ж, дадим слово проф. Орлову:

"Давно известно, что нарушение предпосылок применимости традиционного метода Стьюдента отнюдь не всегда приводит к ошибочным выводам. Например, если объемы выборок велики и примерно равны, то традиционный метод дает правильные выводы, независимо от того, имеют ли элементы выборок нормальные распределения и совпадают ли дисперсии. Подробно об этом написано, например, в упомянутой выше статье:

213. Орлов А.И. О применении статистических методов в медико-биологических исследованиях. - Журнал ?Вестник Академии медицинских наук СССР?. 1987. No.2. С.88-94"
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Larina Tatjana
сообщение 4.01.2013 - 10:23
Сообщение #5





Группа: Пользователи
Сообщений: 49
Регистрация: 3.03.2012
Из: USA
Пользователь №: 23536



Цитата(100$ @ 2.01.2013 - 21:43) *
Ну, что ж, дадим слово проф. Орлову:

"Давно известно, что нарушение предпосылок применимости традиционного метода Стьюдента отнюдь не всегда приводит к ошибочным выводам. Например, если объемы выборок велики и примерно равны, то традиционный метод дает правильные выводы, независимо от того, имеют ли элементы выборок нормальные распределения и совпадают ли дисперсии. Подробно об этом написано, например, в упомянутой выше статье:

213. Орлов А.И. О применении статистических методов в медико-биологических исследованиях. - Журнал ?Вестник Академии медицинских наук СССР?. 1987. No.2. С.88-94"


Ну, что ж, ещё раз дадим слово проф. Орлову:
Читаем в этой же статье: "Из сказанного выше следует, что распределение результатов медико-биологических наблюдений всегда более или менее отличается от нормального". И далее: "Итак, в большинстве медико-биологических задач условие б) нельзя считать выполненным". И ещё, читаем в его более поздней книге "ЭКОНОМЕТРИКА" (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведенные описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при ?незаконном? применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности".
Об этом же он пишет и в своей статье "О проверке однородности двух независимых выборок - Журнал ?Заводская лаборатория?. 2003. Т.69. No.1. С.55-60".

Если Вы почитаете книгу Шеффе "Дисперсионный анализа", то найдёте там подробное описание того, как исследовалась проблема устойчивости выводов в случае нарушения 2-х ограничений. Надеюсь Вы знаете, что для случая двух групп t-критерий и F-критерий (в дисперсионном анализе) связаны функционально. Эти связи между 4 основными распределениями подробно описаны в книге Гласса и Стэнли. Кстати, там же подробно описаны и последствия этих нарушений. Не нужно при этом забывать и о том, что результаты перепроверки выводов t-критерия Стьюдента его непараметрическим аналогом - критерием Ван дер Вардена, зависят не только от соблюдения этих 2-х ограничений, но и от таких факторов, как формы кривых распределений и соотношение объёмов выборок. Подробные примеры таких проверок приведены по адресу http://www.biometrica.tomsk.ru/student.htm Там на реальных примерах анализа онкологических данных как раз показано, как влияют эти параметры на результат.

И последнее. Сам факт использования пакета EXCEL для проведения статистического анализа уже будет восприниматься отрицательно, поскольку сейчас есть масса стат. пакетов, в т.ч. свободно распространяемых. Поэтому если целью исследования является получение надёжной информации из собранных наблюдений, то рациональнее использовать специализированные стат. пакеты. Тем более, что их использование не столь уж затруднительно. По многим из них есть отличные книги, как в магазинах, так и в сети. Есть курсы по этим пакетам, и т.д. Увы, но в российских мед. организациях нет статистических служб, которые бы выполняли этот анализ. Это на Западе в большинстве медвузов и исследовательских центров есть специализированные службы, которые выполняют анализ силами профессиональных биостатистиков. Об этом и идёт речь в Ереванской Декларации, которую я рекомендовала почитать.

Желаю успеха в проведении анализа!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Диагностик
сообщение 3.02.2013 - 05:50
Сообщение #6





Группа: Пользователи
Сообщений: 143
Регистрация: 4.09.2012
Пользователь №: 24146



Цитата(Larina Tatjana @ 4.01.2013 - 13:23) *
Сам факт использования пакета EXCEL для проведения статистического анализа уже будет восприниматься отрицательно, поскольку сейчас есть масса стат. пакетов, в т.ч. свободно распространяемых. Поэтому если целью исследования является получение надёжной информации из собранных наблюдений, то рациональнее использовать специализированные стат. пакеты.

Результаты t-теста зависят от применяемого пакета? Странно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 3.02.2013 - 08:32
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Диагностик @ 3.02.2013 - 08:50) *
Результаты t-теста зависят от применяемого пакета? Странно.

Результаты не должны зависеть от пакета, и речь шла не об этом.

Во-первых, действительно, существует несколько вариантов t-критерия Стьюдента:
1. Одновыборочный - для сравнения выборочного среднего с теоретическим,
2. Для независимых выборок с неизвестной и равной дисперсией,
3. Для независимых выборок с неизвестной и неравной дисперсией (подход Уэлча - Welsh's test),
4. Для сравнения единственного значения с выборкой,
5. Для анализа зависимых выборок (или парный t-критерий).
Про какой из этих t-тестов вы говорите? Хороший пакет должен либо предоставлять удобную возможность задать всё это, либо выбрать нужный вариант из списка. Excel не настолько богат своей статистической надстройкой, а задание этих методов вручную через формулы трудоёмко (неудобно) и сопряжено с ошибками.

Во-вторых, так сложилось исторически, что за фразой "статистическую обработку проводили стандартными методами вариационной статистики в пакете Excel" традиционно стояла полная некомпетентность исследователя в вопросах статистического анализа данных, призванная онную скрыть. Это как написать, что "диагностику проводили на диагностическом оборудовании" и даже хуже (см. ниже). И все более-менее серьёзные исследователи это знают.

В-третьих, как написала Larina Tatjana, существует масса профессиональных пакетов для статобработки данных. Более того, хорошие пакеты ещё и "заточены" по своему функционалу для работы в тех или иных областях науки, т.е. содержат те или иные уникальные методы и критерии из области биометрии, эконометрии, психометрии, технометрии и т.п. Однако пакет Excel - вообще не статпакет, это - замечательный процессор электронных таблиц. Да, он предоставляет возможность посчитать кое-какую статистику. Как и термокомпенсатор рН-метра предоставляет возможность измерить температуру. Но если вы напишете, что "температуру в помещении измеряли датчиком от рН-метра", в ваши выводы, возможно, и поверят, но вопрос об адекватности исследователя встанет очень жёстко и в журнал такую статью не примут. Поэтому когда я читаю про стат. обработку в экселе у меня возникают вопросы: об уровне подготовленности и адекватности исследователя, об уровне подготовленности и адекватности научного руководители, об уровне подготовленности и адекватности соавторов, об об уровне опубликовавшего статью журнала.

В четвёртых, статистические алгоритмы, заложенные в микрософтовские программные библиотеки несовершенны. Excel не проходит тестов на точность, которую должны демонстрировать хорошие статпакеты - это уже обсуждалось на форуме. И хотя на практике вы вряд ли станете жертвой этой неточности, но профессионалы знают об этом и не воспримут в качестве профессионала вас. Вопросы профессионализма и репутации выходят далеко за рамки обсуждаемого вопроса. Для многих сейчас они, похоже, вообще не стоят: постоянно сталкиваюсь с ситуациями, когда казалось-бы респектабельные учёные ставят свою фамилию впереди по-детски безграмотных тезисов своих аспирантов (мой научный руководитель не хотела даже быть в списке авторов аспирантских по своему уровню работ). Но тут уж кто за чем в науку пришёл...

Сообщение отредактировал nokh - 3.02.2013 - 08:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Диагностик
сообщение 3.02.2013 - 13:04
Сообщение #8





Группа: Пользователи
Сообщений: 143
Регистрация: 4.09.2012
Пользователь №: 24146



Цитата(nokh @ 3.02.2013 - 11:32) *
В-третьих, как написала Larina Tatjana, существует масса профессиональных пакетов для статобработки данных. Более того, хорошие пакеты ещё и "заточены" по своему функционалу для работы в тех или иных областях науки, т.е. содержат те или иные уникальные методы и критерии из области биометрии, эконометрии, психометрии, технометрии и т.п. Однако пакет Excel - вообще не статпакет, это - замечательный процессор электронных таблиц. Да, он предоставляет возможность посчитать кое-какую статистику. Поэтому когда я читаю про стат. обработку в экселе у меня возникают вопросы: об уровне подготовленности и адекватности исследователя, об уровне подготовленности и адекватности научного руководители, об уровне подготовленности и адекватности соавторов, об об уровне опубликовавшего статью журнала.

Когда я читаю об обработке данных в любом статпакете я сильно сомневаюсь в результатах такой обработки. Человек механически вбил данные, за него что-то посчитали по непонятным алгоритмам и выдали результат. Всё надо считать вручную.

Сообщение отредактировал Диагностик - 3.02.2013 - 15:21
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 3.02.2013 - 14:29
Сообщение #9





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Резюме: считать надо на клочке бумаги вручную, а в статье (диссертации и т.д.) писать: Statistica, Stata, SPSS, SAS и т.д. Для солидности.

Сообщение отредактировал 100$ - 3.02.2013 - 14:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 4.02.2013 - 18:41
Сообщение #10





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Диагностик @ 3.02.2013 - 16:04) *
Когда я читаю об обработке данных в любом статпакете я сильно сомневаюсь в результатах такой обработки. Человек механически вбил данные, за него что-то посчитали по непонятным алгоритмам и выдали результат. Всё надо считать вручную.

А я не верю ручным расчётам. И никто не поверит. Потому что ВСЕ ошибаются, потому что даже в крутых статпакетах время от времени обнаруживаются ошибки, а в справочной литературе - ошибки в формулах. Но я с вами согласен в том, что вручную считать полезно - на начальных этапах или когда важно разобраться с алгоритмом работы метода. Когда метод освоен нет необходимости тратить драгоценное время на расчёты снова и снова; нужно найти пакет, который выдаёт такие же результаты и пользоваться для данного анализа им. Я считал вручную и многофакторные дисперсионные комплексы, и главные компоненты (правда только для трёх показателей - не хотелось возиться с итерационным поиском корней уравнений больших степеней). Считаю, что это было полезным. Когда вы в своём развитии (в хорошем смысле) дойдёте до итерационных процедур и ресэмплинга, то однозначно перейдёте на программный расчёт.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему