Вопрос Игорю по АттеСтат'у |
Здравствуйте, гость ( Вход | Регистрация )
Вопрос Игорю по АттеСтат'у |
24.08.2010 - 12:31
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Уважаемый Игорь!
Не могли бы Вы поделиться алгоритмом или ссылкой как рассчитать достигаемый уровень значимости для двухвыборочного критерия Смирнова? У меня Vista не поддерживает АттеСтатовскую справку. Очень надо. С уважением. |
|
24.08.2010 - 15:26
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Не могли бы Вы поделиться алгоритмом или ссылкой как рассчитать достигаемый уровень значимости для двухвыборочного критерия Смирнова? В Рекомендациях по стандартизации Р.50.1.037-2002 Росстандарта России установлено, что P-значения статистики Sm для проверки нормальности критерием типа Смирнова (модифицированным критерием Смирнова) в случае сложной гипотезы, когда оба параметра распределения оцениваются по эмпирической выборке, могут быть аппроксимированы функцией логнормального распределения с двумя параметрами (0,1164; 0,5436). Логнормальное распределение легко вычисляется через нормальное распределения (подробнее см. Справку "Как начать работу"). Ссылки в Справке. Как прочитать Справку - см. методы ниже. У меня Vista не поддерживает АттеСтатовскую справку. 1. Для Vista и 7-ки с сайта Microsoft грузится компонент для чтения Справки HLP. 2. Для AtteStat предлагаются для скачивания полные исходные тексты, содержащие в числе прочего файлы всех Справок в формате RTF. Все алгоритмы расчетов запрограммированы на языке Си и также доступны. Сами исходники - часть переведена с исправлениями и оптимизацией с языка Фортран других авторов (ссылки на оригиналы указаны в исходниках), часть - выполнена самостоятельно. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
25.08.2010 - 15:38
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Спасибо Вам и за ответ и за АттеСтат
|
|
29.08.2010 - 14:14
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Уважаемый Игорь!
У меня возник вопрос теперь уже по критерию Пейджа: для вот такого набора исходных данных (6 блоков) АттеСтат считает статистику критерия = 73, при ручном счете получается 74. Взгляните, пожалуйста. Исходные данные 3 5 1 2 1 3 1 6 5 4 3 2 5 4 6 6 2 4 Ранжировка: 2 3 1 2 1 3 1 3 2 3 2 1 2 1 3 3 1 2 Ранговые 13 11 12 суммы |
|
29.08.2010 - 15:42
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Уважаемый Игорь! У меня возник вопрос теперь уже по критерию Пейджа: для вот такого набора исходных данных (6 блоков) АттеСтат считает статистику критерия = 73, при ручном счете получается 74. Взгляните, пожалуйста. Исходные данные 3 5 1 2 1 3 1 6 5 4 3 2 5 4 6 6 2 4 Ранжировка: 2 3 1 2 1 3 1 3 2 3 2 1 2 1 3 3 1 2 Ранговые 13 11 12 суммы О Вашем расчете. Ранжировка - правильно. Ранговые суммы - правильно. Согласно формуле критерия результат будет = 13 * 1 + 11 * 2 + 12 * 3 = 71. Это, видимо, и есть правильный результат. Непонятно, откуда 74. Об AtteStat. Похоже, тоже ошибка. Причем сделана не опечатка в программе - так и задумано было. Сейчас вспомнить трудно, из какого источника формула, но именно в формуле. Исправил. Стало тоже 71. Сообщение отредактировал Игорь - 29.08.2010 - 15:46 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
29.08.2010 - 17:15
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
74 - это верно, нужно проранжировать ранговые суммы: 11*1+12*2+13*3
|
|
29.08.2010 - 17:23
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Спасибо за оперативный ответ.
По поводу расчета: критерий проверяет гипотезу упорядоченности m1<=m2<=m3<= b etc., где хотя бы одно из неравенств строгое. И вот тут начинаются непонятки: Кобзарь, Тюрин и Макаров пишут, что ранговые суммы предварительно упорядочиваются по возрастанию, т.е. расчет производится как: L = 1*11+2*12+3*13=11+24+39=74. Холлендер и Вульф считают так же, как и Вы. Вот я и хочу смекнуть, как правильно. |
|
29.08.2010 - 18:51
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Спасибо за оперативный ответ. По поводу расчета: критерий проверяет гипотезу упорядоченности m1<=m2<=m3<= b etc., где хотя бы одно из неравенств строгое. И вот тут начинаются непонятки: Кобзарь, Тюрин и Макаров пишут, что ранговые суммы предварительно упорядочиваются по возрастанию, т.е. расчет производится как: L = 1*11+2*12+3*13=11+24+39=74. Холлендер и Вульф считают так же, как и Вы. Вот я и хочу смекнуть, как правильно. Еще вариант реализации и ссылку на источник можно посмотреть здесь http://bm2.genes.nig.ac.jp/RGM2/R_current/...trend.test.html |
|
29.08.2010 - 20:12
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
74 - это верно, нужно проранжировать ранговые суммы: 11*1+12*2+13*3 Да, наверное, так и надо сделать. А авторам точнее описывать алгоритмы. Иначе, как минимум, ссылки на таких авторов будут убраны. Как уже не раз случалось. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
29.08.2010 - 20:20
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
To p2004г: Мерси, сходил по Вашей ссылке. Для приведенного там примера статистика критерия L=342 получается, если не производить ранжировок ранговых сумм по возрастанию, а тупо умножать их на номер столбца в порядке появления. Кстати, а R - это серьезный продукт или самоделка, в которой возможно все? To DrgLena: Интересно, это мы с Вами спотыкаемся об какой-то чисто российский косяк, или парень по фамилии Пейдж настолько невнятно изложил свою идею? |
|
29.08.2010 - 21:03
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Кстати, а R - это серьезный продукт или самоделка, в которой возможно все? Бесплатная программа статистических расчётов R появилась 1976 году. Несмотря на свой солидный возраст, эта система поддерживается и развивается. На официальном сайте http://www.r-project.org есть репозиторий http://cran.r-project.org/ , состоящий из 2500 пакетов для разных целей, который регулярно пополняется исследователями-энтузиастами. Вы можете стать одним из них, написать свой пакет статистических вычислений и выложить его для всеобщего пользования. Такие монстры статистики, как SPSS и StatSoft, включают в свой интерфейс вызов модулей R, откуда следует, что R достаточно авторитетная "самоделка".
Сообщение отредактировал DoctorStat - 29.08.2010 - 21:04 Просто включи мозги => http://doctorstat.narod.ru
|
|
29.08.2010 - 21:18
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Кстати, а R - это серьезный продукт или самоделка, в которой возможно все? В любой программе есть ошибки. Это единственное, что могут гарантировать их авторы/поставщики. ... настолько невнятно изложил свою идею? Авторы обычно излагают идею в виде неудобоваримом. Поэтому, даже при наличии оригинальных источников, программы пишутся по толковым более поздним источникам. См. списки литературы к любой программе - там практически нет оригинальных статей. А есть ссылки на монографии Conover, Zar, Sokal - ни одной из них нет ни русском переводе, ни в оригинале в электронном виде. Точная и полная информация очень дозируется. Сообщение отредактировал Игорь - 29.08.2010 - 21:18 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
29.08.2010 - 21:26
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
To p2004г: Кстати, а R - это серьезный продукт или самоделка, в которой возможно все? R это открытая реализация S от БелЛаборатори. S (а с ним и его отрытая реализация) признанное стандартное средство у статистиков профессионалов. Согласитесь смешно обсуждать новый предложенный стат метод не имея его доступной реализации (подтверждение это данный тред)? Или использовать коммерческий продукт по принципу черного ящика. http://cran.r-project.org/doc/FAQ/R-FAQ.html#What-is-R_003f |
|
29.08.2010 - 21:53
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
To p2004г: Мерси, сходил по Вашей ссылке. Для приведенного там примера статистика критерия L=342 получается, если не производить ранжировок ранговых сумм по возрастанию, а тупо умножать их на номер столбца в порядке появления. Вот еще реализация http://cran.r-project.org/web/packages/coi...nettes/coin.pdf If we assume that the products are ordered, the Page test is appropriate and can be computed as follows R> independence_test(scores ~ product | sitting, data = egg_data, + scores = list(product = 1:10), + ytrafo = yt) Asymptotic General Independence Test data: scores by product (1 < 2 < 3 < 4 < 5 < 6 < 7 < 8 < 9 < 10) stratified by sitting Z = -6.2166, p-value = 5.081e-10 alternative hypothesis: two.sided |
|
30.08.2010 - 00:36
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
To DrgLena: Интересно, это мы с Вами спотыкаемся об какой-то чисто российский косяк, или парень по фамилии Пейдж настолько невнятно изложил свою идею? К сожалению, у меня нет первоисточника (за 14$ желающие могут получить), но мы неоднократно убеждались на этом форуме, что переводы на русский не точны, что ранжируется, строки, колонки, ранговые суммы, может не внятно указано в некоторых источниках. Но есть источники, которые прошли проверку временем, Кобзаря вы упоминали. Мне также нравится проводить проверку ручным расчетом с тем, который выдают солидные пакеты, имеющие хорошую документацию, соответствующие ссылки, дают бесплатный месяц для изучения, при этом документация остается. Я доверяю StatXact. Я могу выложить их пример и результат для этого теста и свой ручной, который совпадает. Ранговые суммы ранжируются. |
|