Архив рубрики: stat

Мне нравится эта ЗПШ

Только я вот вообще ничего не успеваю. Я таки привёз сюда свою бутылку текилы, но я вряд ли успею толком ей воспользоваться. Потому что некогда. А сейчас мне бы надо лечь спать и пропустить все возможности сегодняшней ночи, потому что иначе мне не удастся хорошо поработать и насладиться завтрашней. За завтра мне надо посетить мини-семинар Морозова про e-learning (он обещался сравнивать современные технологии с обучающим фильмом сороковых годов), вспомнить PHP и перелопатить информацию для диска, в какой-нибудь форме поучаствовать в закрытии и глинтвейне, успеть таки пообщаться с Антиповым, Надя хотела пообсуждать свои две мудрёные странички про блеф, поучаствовать в последнем аврале с вычиткой ляпов на дисках и ещё успеть немного выспаться, потому что мне же потом на машине ехать, а если я не посплю хотя бы три часа, то это плохая идея.

А ещё на сегодняшнем Морозове про контент-анализ мне пришла в голову забавная идея. Что коэффициенты корреляции тоже подчиняются закону Ципфа. То есть самые большие коэффициенты корреляции в исследовании несут меньше всего смысла из всего набора. Их можно назвать стоп-корреляциями. Поэтому неудивительно, что факторный анализ их не любит, у него от них несварение матриц происходит.

Хорошо, что все старые знакомые не рвутся со мной общаться, пить и т.п. Мне вполне достаточно радоваться, видя их бодрыми и весёлыми, разглядывая их забавных и таких похожих на них детишек…

Ох уж эти мои языковые трудности

Тяжело без знания английского. Вот опять в последний момент надо перевести кусочек текста, а я туплю. Плод дикого тупления, над которым я теперь нервно хихикаю…

…but the anchoring effect continued to increase continuously…

Имелось в виду, что на графике наблюдается неуклонный рост. Что функция на этом участке монотонно растёт. О. Монотонно. Не непрерывно, а монотонно. Steadily increasing. Надеюсь, ни один нормальный человек не наткнётся на эту аннотацию.

Каганов о проблеме измерения

Тем временем в конце месяца мне предстоит вновь страдать на тему экзамена по психометрии — туда придут двое магистров, которые на занятия не ходили. А тут Каганов пишет очень в тему:

07 января 2009
измерено святостью

Рaссыпaлcя в роликoвом кроccовке подшипник. Cтал я изyчать, гдe можнo такoй кyпить. Окaзaлоcь, вcе непpoсто: их немыcлимoe множеcтво модeлeй и типоpазмеpoв — cкоpoсть, диaмeтp, ширинa колеca: тpи, чeтыре, чeтыре c половиной… Что ознaчают эти нoмеpa? Запyтaлся oкoнчaтeльнo, пoеxaл в магазин (зa кoмпанию — Caшa Лoгинoв). Tам пoдобрали нyжный, нe сpaзy, нo нaшли. Eдем в мeтpo обpaтнo, и я, ощупывaя yпaкoвку c вождeлeнными кoлeсикaми, размышляю o тoм, кaк же нeпонятeн он — нынешний мир типоpазмeрoв, нoмеpoв, веpcий, мaрок и моделeй. Beдь еcли задумaтьcя, cовpeменный челoвeк pазyчился опepирoвaть cyщноcтями, взaмeн он нaзываeт кaк имя мaркy или нoмеp пaртии. «Cкaжитe, в мoeй 6500 eсть 802.11?» Дaжe если мы пoнимaем, o чeм peчь, эти цифpы yже дaвно нe имeют чиcлoвогo смысла и нaпpочь oтopвaны oт измeритeльнoгo рядa. Ecли станeт извecтнo, что, cкажeм, в 6501 тoчнo ecть 802.12, этo абсoлютнo ничего нам не скажeт пpо 6500 и 802.11. Они нe cвязaны в peальнocти, в них нeт лoгики. Eсли троллейбyc 241 идeт до 3-гo кольца, этo нe знaчит, что oн пpоходит пeрвыe двa, и дaже нe знaчит, что сущecтвyют тpоллeйбycы c нoмeрoм 240 и 242. Цифpы отнынe не связаны c числoвыми измерeниями.

Hа этoм xод моeй мыcли oбрывается, пoтoму чтo по вагонy идeт пожилая жeнщинa с книгoй, к кaждому пoдxодит и чтo-тo втолковывaeт — пpoдает. Подxодит к нам, пoкaзывaет книгу — мeмyaры какого-тo аpxиепископа: «Этa книгa святая, онa всё вам paсскaжeт о жизни нa зeмле!» Hy, я задиpaю фуфайку и дocтаю из шиpoких штанин (зa pемнeм yдобно книги нocить) книжку Kиpилла Еcькoва «Зaнимaтельная палeонтoлoгия». Вaм, гoвopю, в cвою очeрeдь тожe xoтелось бы пopекомендoвaть хopошую книжкy о жизни нa зeмле. Стаpушка cмoтрит на Ecьковa c нeдовеpиeм: «A это о кaком жe измеpeнии книгa?» «Не повеpитe, — гoворю, — o нашeм c вами, зeмнoм.» И cлышу в oтвeт: «Mолодой челoвeк, земноe измeрение и кoсмoс — это измepение всeго лишь 3. A Бoг — этo измерeние 4-4.5» «Kaк-как, пpоcтите?!» — изyмляюсь я. «Чeтыpe — четырe c половиной», — пoвтоpяeт стаpyшка, глядя нa нaс ясными белыми oчами. «Чeм измеpяли-тo?» — тeряюсь я oкoнчательно. «A святocтью, святоcтью…» — отвечaeт стapyшка.

Отсюда

Матметоды: предсказания и жизнь

У меня есть такая забава — я пытаюсь на основании скудных имеющихся у меня данных предсказать, кто же вылетит с факультета на некоторое время из-за несдачи зачёта по математическим методам в психологии.

На самом деле предсказать это довольно просто. Для этого можно вообще ни разу не поговорить с этим человеком. Собственно говоря, это и есть основной критерий! Cначала я смотрю в списки людей, которые посещали практические занятия. И отмечаю там тех людей, которые были меньше, чем на половине занятий. Дальше я принимаю часть вины за отчисление человека на себя, потому что не проверяю самостоятельность выполнения домашних заданий — сдал и ладно. Но тем не менее, ещё часть списка «прогноз негативный» формируется из тех, кто сдал домашнее задание в самый последний момент, вернее уже после последнего момента.

И наконец, самый верный критерий — попадание на комиссию по другому предмету. Поясню для тех, кто не в курсе — «на комиссию» означает, что человек дважды официально не сдал зачёт (или экзамен) и в третий раз его ждёт встреча с «особой тройкой» из двух преподавателей, разбирающихся в вопросе, а также одного представителя администрации факультета (ну или просто трёх преподавателей). То есть никакого отношения к каким бы то ни было математическим способностям данный вопрос как правило не имеет, ибо где зачёт по физкультуре, а где матметоды…

Чтобы пояснить немного уровень проблемы — все китайцы, которым никаких поблажек из-за трудностей с чтением теста и т.п. не было, всё сдали. Кто когда-либо работал с нашими китайскими студентами, может понять, о чём это я.

Итак, сегодня утром я подошёл к стенду, на котором висели «комиссионные». Стенд поражал повторением одних и тех же четырёх фамилий, одна из которых была вовсе, кажется, во всех списках комиссий. Из этих четырёх трое и вовсе относились у меня к категории «кто вы такие, я вас не знаю», а ещё одна девушка таки дошла до последних двух занятий. У меня в списке максимально вероятных была отмечена эта девушка и ешё один юноша с аналогичным анамнезом.

Я сформулировал прогноз — из этих четверых двое не сдадут сегодня матметоды, и парень тоже может не сдать, хоть и говорят, что он, в принципе, сообразительный.

Всего в списке было 21 человек, присутствовало 18. Трое отсутствовали. Те самые трое. У нас нет никакого «плана по отчислению» и вообще лучше бы поменьше, а лучше бы и вовсе не. Это связано с тем, что никаких бонусов, кроме чувства глубокого удовлетворения, отчисление студентов не несёт, а вот потеря внебюджетных средств и падение соотношения числа бюджетных студентов к числу преподавателей — ничего хорошего нам не сулит тем более. Однако, мы всё-таки не настолько гнилой вуз, чтобы ставить эти соображения во главу угла.

В общем, если уж на комиссию отправлено сильно больше десятка студентов, это предполагает, что с кем-нибудь мы всё-таки расстанемся. В принципе, троих прогульщиков уже было бы достаточно, поэтому подошли к вопросу мы крайне мягко. Достаточно было либо написать тест на троечку, либо выполнить практическое задание, являющееся практически полной копией одной из домашних работ. В этом году надо было посчитать критерий хи-квадрат для таблицы сопряжённости 2×3. В итоге из 18 человек целых 14 справились с этой задачей более или менее успешно. Из оставшихся четырёх была выбрана лучшая и тоже записана в сдавшие.

Осталось трое. Все трое из тех, кто пропустил первые занятия. Двое — из сделанного с утра списка тех, кому скорее всего угрожает не сдать. Высокая комиссия решила заслушать устный отчёт этих замечательных людей. Заслушали. Два человека ещё что-то могли сказать по вопросу, хотя и часто говорили что-то явно далёкое от истины. Но третий так посмотрел на вопрос о том, что значат эти «пэ», так посмотрел, что сразу стало понятно, что человек вовсе не в курсе про пэ. А поскольку без пы в матметодах вообще никуда, то извините.

В общем, после некоторого обсуждения, которое свелось к убеждению самих себя, что мы должны товарища отчислить, мы таки смогли преодолеть своё желание «дать человеку шанс» и действительно дать человеку шанс что-то изменить в своей жизни. Волшебный пендель, да.

Но не тут-то было. Только мы уже начали писать эти бесконечные протоколы заседания комиссии (21 человек по 3 экземпляра = 63 страницы), как к нам пришла девушка. Одногруппница, которая просила дать человеку ещё шанс и что-то спросить. Тут я взял ответственность на себя. У меня такое изредка бывает. С иезуитским дружелюбием я пожаловался на то, что мы искренне хотели бы поставить зачёт, но не можем, поскольку не в силах придумать такой вопрос по курсу, на который студент мог бы дать минимально приемлемый ответ. Поэтому мы готовы пойти навстречу. Но при одном условии — если девушка сейчас сядет и попробует написать на бумажке два таких вопроса.

Девушка честно сказала, что это колоссальный груз ответственности и ей страшно. В общем, молодец девушка. Год-два назад я бы, наверное рассердился желанию помешать работе комиссии, но за этот год я как-то стал спокойнее. Это моё действительное мнение — если у человека за время учёбы на факультете появились друзья, которые готовы рвануться за него биться перед такими страшными людьми, как члены нашей комиссии, значит он чего-то да стоит. И шанс-то дать можно. Хотя, конечно, мучить человека лишний раз непонятно зачем. Но тем не менее — почему бы и нет? Итак, два вопроса были написаны — «тау Кендалла» и «Что такое альфа и бета»?

Увы, и на них мы не получили какого-либо близкого к не то что истине, а вообще к теме ответа. Так что на этом студент получил наконец-то отпуск от учебных дел на ближайшие полгода. Осенью, наверное, восстановится снова на второй курс, и мы снова увидим его на занятиях, может быть даже больше, чем на одном.

Это был зануднейший рассказ об одном нелёгком дне из жизни преподавателя университета…

Статистика сегодня

Рассел сегодня половину занятия пытался научить нас пользоваться абсолютно не нужным нам методом определения минимальной численности выборки для исследований, ориентированных на оценку достижения/недостижения какого-либо порога пропорции чего-нибудь в выборке.

То есть, метод позволяет рассчитать какова минимальная выборка для ответа на вопрос, не превышает ли доля наркоманов 5% генеральной совокупности. Например. Поскольку психологам эта проблема как-то совершенно фиолетова, то аудитория очень долго не могла понять, о чём речь и что значат все эти «пы».

Еще мы обсуждали вопрос о том, что если наши данные измерены в процентах, то нельзя пользоваться методами, ориентированными на нормальное распределение, а надо — на распределение Пуассона. Если с проблемой нормальности неконтинуальных данных я ещё улавливаю, то при чём там распределение Пуассона — загадка. По мне так при достаточно высокой дискретизации шкалы и отсутствию статистически значимых различий эмпирического распределения от нормального, можно применять к нему параметрические статистики нормального распределения, пусть там даже десять раз нету этой континуальности за пределами диапазона, ибо у нас и вопрос за его рамки не выходит, а ANOVA вообще робастно к отсутствию нормального распределения при условии равенства выборок и дисперсий. Рассел сказал, что да, можно так рассматривать вопрос, но если переводить его в плоскость «академической практики», то ни один рецензируемый журнал статью с такой обработкой не примет. Но можно преобразовать проценты в радианы через арксинус. Странное правило. Исходя из него, никакие результаты психологических тестов нельзя считать приемлемыми для применения нормальных статистик, ибо у них есть ограниченный диапазон и IQ отрицательным не бывает.

Вот так и живём. Владимир Львович, ты вот сейчас с кем разговаривал?

_______________________________________________________
Постовой:

Кратко впечатления дня

О вчерашних впечатлениях по поводу круглого стола по информационным войнам расскажу завтра отдельным подробным постом, тем более, что оно того стоит. Сегодняшний день конференции я целиком посвятил секции общей психологии, и в общем, не зря. Из десятка с лишним прослушанных докладов только парочка была совсем уж бездарными, что очень высокий показатель. Довольно странно, но почему-то большая часть докладов была про эмоции в самых разных аспектах. Приятно порадовал доклад женщины из Русского музея по теме с ролью искусства в развитии чего-то там в смысложизненных ориентациях. Обычно от такого рода докладов ожидаешь какой-то туповатой самовлюблённой болтовни ни о чём, а тут, хотя содержание собственно работы не представляло собой чего-то выдающегося, но подано было хорошо, грамотно и адекватно.

Ещё пара московских докладов порадовали как по содержанию, так и по манере подачи. Я же сегодня решил не умничать, а руками показать. Отказался от идеи подготовки презентации, ибо чем дальше, тем больше стараюсь обходиться без лишних сущностей. Вроде бы получилось неплохо, только я так увлёкся маханием руками, что ушёл из кадра собственной видеокамеры, так что там только стена зафиксирована.

Потом я плотно пообедал в перерыве, пообщался с понаехавшими. Одна из понаехавших (которая когда-то удивлялась тому, что у нас тут все в колготках ходят) столкнулась с тёткой, сообщившей ей, что она в университете, а тут с голыми руками ходить не принято. Хм, я знаю у нас на факультете только одну тётку, которая способна на что-то этакое, но она вроде бы в последние годы утихомирилась… Так что, скорее всего, дело в том, что во время конференции у нас двери открыты и заходят с улицы всякие больные люди.

После плотного обеда следующую часть секции я не выдержал, ибо от наполненности желудка и лопотания самарских последователей Аллахвердова меня дико клонило в сон (да и спал я часа четыре). Так что я сбежал оттуда и побродил по факультету.

В пять вечера начался двухчасовой семинар Рассела Барбура, который оказался вполне бодрым ироничным пожилым дядькой. Если бы не его стремление научить по большей части мало что понявшую публику премудростям General Estimation Equations, было бы совсем здорово. Видимо, я всё же овладею премудростями статпакета R, и это здорово. Вот так вот прошёл сегодняшний день.

Интересненькое на факультете — семинар по статистике в психологии

Ведёт некто «Dr. Russell Barbour, специалист по статистике Йельского Универститета, США»
Семинар будет проводиться 22-25 и 27 октября (5 дней)

Могу сказать только, что его фотография и список избранных публикаций не внушают излишнего оптимизма, но раз уж сказали, чтобы я сходил, надо будет сходить. Может этот дядечка научит меня азам работы с R? Судя по ещё одному найденному мной документу, он им пользуется.

Леонид Каганов о макинтошниках

Обожаю статистику. Вот тут вот Каганов доказывает всем на основании суровых данных статистики посещений гей-сайтов, что макинтошники таки да. На всякий случай вот дальше статистика моего сервера за последний месяц. Меня посещают, по-моему, одни боты поисковых систем…
Читать далее Леонид Каганов о макинтошниках

Научные форумы?

Хе-хе, я-то думал, классические форумы давно повымерли и весь народ подался дискутировать в ЖЖ, социальные сети, всяческие веб2.0-монстры типа хабрахабра. Или остались в качестве сопровождения сайтов крупных проектов — радиостанций, новостных сайтов… Но нет, живы ещё старички, оказывается. Например, вот научный форум. Заходя на такого рода проект, ожидаешь увидеть там последние сообщения датированные в лучшем случае двухмесячной давностью, в худшем — сто десять предложений увеличения пениса, накопившиеся за долгие годы безлюдного существования. А тут вот люди есть. Живут тут, делают чего-то. Основное направление тут математика, можно формулы в латексовском формате писать. Олимпиадные задачки разбирают. Как ни странно и гуманитарный раздел жив. Там, что характерно, пытаются разобраться, на чём основано действие НЛП. Так я им всю правду и расскажу, хе-хе-хе…

Пойду что ли, зарегистрируюсь, повешу им моё видео про ANOVA или вчерашний stats rap…