(занимаемся многомерным шкалированием)
— Так, а теперь попробуйте представить расстояние между этими объектами, но не как пешком идти, а как если бы птичка полетела, по прямой...
— Ну, птички тоже могут куда-нибудь свернуть...
— Так, давайте сразу введём понятие идеальной птички. Вот у Аллахвердова есть идеальный мозг, а у нас будет идеальная птичка. Она летает по прямой, потому что у неё идеальный мозг. И она при этом является материальной точкой. А перемещается путём выброса назад струи идеального газа.
— Ура, сферическая птичка в вакууме!
— Итак, наша идеальная птичка летит от нашего окна до шпиля Петропавловки...

(дома подумал о том, что там идеальная птичка совершит абсолютно упругий удар)

Комментариев нет

Сижу тут, пишу всякую ерунду, копаюсь... И тут вижу вот такую гениальную вещь:

27 августа 2009 года общественная коалиция «Правый центр» подвела итоги общегородского телефонного и sms-голосования по проекту «Охта центр». Благодаря широкому освещению в петербургской прессе и интернете об акции была проинформирована более чем миллионная аудитория.

Главной целью акции, длившейся с 11 по 27 августа было определение действительного числа противников строительства нового общественно-делового района с высотной доминантой в 396 метров на правом берегу Невы, около Большеохтинского моста.

Ранее оппоненты проекта неоднократно утверждали, что против этого проекта выступает огромное число петербуржцев. «Весь город против строительства», — утверждали оппозиционеры.

Акция «Правого центра» показала: в реальности проблематика «Охта центра» волнует в большей степени несколько десятков общественников, журналистов и пиарщиков, но не затрагивает интересы жителей города в целом.

Результаты телефонного и sms-голосования.

Всего в голосовании приняли участи: 6027 человек

ПРОТИВ строительства Охта центра проголосовали: 4 879 петербургских абонентов, из них:

3 212 – в форме sms (на короткий номер 3212)

1 667 – по телефону (715-20-97)

ЗА строительство Охта центра проголосовали 1 148 , из них:

683 – в форме sms (на короткий номер 3299)

465 – по телефону (715-20-98)

Таким образом, о негативном отношении к проекту заявили 0,5% от общего числа проинформированных об акции жителей Петербурга.

http://sites.google.com/site/pcentrspb/ohta-centr/sms

Учитесь, студенты, как надо выводы из исследований делать!!!

Комментариев нет

Могло быть и хуже. У нас сегодня была комиссия по итогам летней сессии. Комиссия — это такой последний шанс студента не вылететь. Двоим не удалось. Мне очень понравился текст решения практического задания одной девушки, которая в итоге получила положительную оценку. Практическое задание заключалось в интерпретации таблиц вывода SPSS (были даны таблицы U Манна-Уитни со сравнением мужчин с женщинами по десятку переменных).

Практическое задание.

При анализе (интерпретации) данных был использован: Критерий -Манна Уитни

sig<0,05 => Отклоняется гипотеза о равенстве средних значений.

Обнаружены статист. значимые различия по признаку ПОЛ.

По исследованию средних значений можно сказать, что женский пол выражен больше, чем мужской

Комментариев нет

К вопросу о том, что исследования кажутся более основательными, если там какая-нибудь статистика используется, циферки, томограммы, диаграммы и таблички...


Тут ещё много.

Комментариев нет

Коллега Четвериков пишет:

Наткнулся на забавную статью “Seduction without cause: uncovering explanatory neurophilia” (J.D. Trout):

Credibility is a cherished currency in science, but its cues can be counterfeit. A novel series of experiments by Weisberg and her colleagues show that non-expert consumers of behavioral explanations assign greater standing to explanations that contain neuroscientific details, even if these details provide no additional explanatory value. Here, we discuss the part that this ‘placebic’ information might play in producing a potentially misleading sense of intellectual fluency and, consequently, an unreliable sense of understanding. дальше тут

По сути это про то, что не-эксперты испытывают больше доверия к данным исследований поведения, если те содержат нейрофизиологические подробности, ничего по сути не объясняющие. Забавно было бы если бы кто-то взялся проанализировать процент подобных статей =) 90? 100?

Собственно говоря, ту же роль выполняют некоторые методы статистической обработки.

Комментариев нет

И дались же авторам пособий по теории вероятностей какие-то бесконечные чёрные/белые шарики, стрелковое оружие и бракованные детали. Надо всё-таки делать задачки какие-то более интригующие, что ли.

У неосторожной девушки Маши на этой неделе три свидания с разными молодыми людьми. Шанс, что первое из них закончится небезопасным сексом — 0.6, шанс, что второе закончится тем же — 0.5, а про третье нет почти никаких сомнений, шанс равен 0.9. В случае, если Маша сделает это однократно, вероятность забеременеть составляет 3/8, если же она сделает это дважды или трижды, то шанс забеременеть удваивается и составляет ¾. Рассчитайте вероятность Маши забеременеть на этой неделе. Рассчитайте также шанс на то, что Маша заразилась вирусом иммунодефицита человека при условии, что шанс заразиться от инфицированного мужчины при небезопасном сексе составляет 0.8, а мужчины были случайно выбраны из совокупности, в которой 5% являются носителями вируса.

Комментариев нет

Не знаю, что я там за данные обрабатываю, нет времени вникать, но в результате названий переменных, одна строчка синтаксиса выглядела так:

/TABLES=know BY общаяэ уровень ever who you wish

Комментариев нет

Сегодняшние результаты по матметодам меня не так чтобы ужаснули, просто сильно удивили. Потому как обычно организационные психологи сдают лучше других (лучше них обычно только специальные, уж не знаю почему), а тут какой-то непрерывный праздник. Причём даже не из-за нашего смертельного практического задания — весьма незначительное количество людей пострадало именно за него, у кого с ним были большие проблемы, у тех и по теории не было ничего особо хорошего. За редкими исключениями. Я так понял, что у нас выходит что-то типа трети потока на допсессии.

Что меня опять-таки удивило — не сдали люди, про которых я точно знаю, что они готовились. Потому что я даже помогал им готовиться в меру сил своими консультациями. Это очень странно.

По одному поводу кстати, у меня вышло некоторое несогласие с Наследовым. Потому как у него там есть вопрос — «по каким переменным следует интерпретировать фактор 1, а по каким — фактор 2?» И таблица нагрузок. Я студентам объяснял, что как правило берётся за основу максимальная нагрузка по строке, но проще взять какую-то цифру за линию отсева, и как правило минимально приемлемой цифрой считается 0.4. А у Андрея Дмитриевича строго по строке интерпретируется, то есть если есть в одном столбике нагрузка 0.7, в другом 0.5, то 0.5 уже не входит в «другой» фактор. У меня как-то отсутствуют теоретические соображения, которые позволяли бы мне считать, что интерпретируемость нагрузки по одному фактору зависит от нагрузок по другим факторам. Хотя, возможно, это и правильно. Постараюсь запомнить этот нюанс и объяснять это студентам. Запомните эт дэти, потому что понять эт нэвазможна. Впрочем, я всё равно собирался в июле разбираться наконец уже с факторным анализом всерьёз, чтобы не чувствовать себя в данном вопросе полным неучем.

3 комментария

Когда же всё это кончится уже? В субботу, что ли, последний экзамен и потом только допсессия и комиссия осенью?

Комиссия вечерников сегодня была. Мы опять совершили дисциплинарное нарушение — не отчислили часть тех, кого надо было бы. Потому что из сегодня пришедших только двое на самом деле выполнили норму — один юноша и ещё девушка Ангелина, по поводу которой меня слегка терроризировали её коллеги. Всем остальным можно было смело ставить «не зачтено» исходя из прописанных в программе курса требований. Но тем не менее, такую оценку получили только четыре человека, не смогшие ответить хотя бы на половину вопросов.

В общем, после субботы появится время на возню с дипломниками. Её у меня, по счастью, немного, все самостоятельные и толковые. Правда, некоторые — разгильдяи. Ну так это и не удивительно, подобное притягивается к подобному.

Комментариев нет

Вчера мы с adn1 позорно проиграли битву за качество образования. Сначала была пересдача бакалавров и опять кружащиеся вокруг нас отдельные коллеги с дивной аргументацией, что мы их четыре года учили, давайте уже наконец-то выпустим, не отчислять же на четвёртом курсе прямо перед защитой диплома. Ну ладно, отправили на комиссию поменьше. Вот интересно, будет ли у нас на факультете после введения ЕГЭ как единственной меры поступления получше с качеством приёма или же опять среди тех, кого мы всё никак не можем отчислить, будут попадаться бесконечные родственники, друзья и знакомые какого-нибудь важного Кролика?

Что интересно, что на втором курсе точно так же те же коллеги ходят вокруг нас кругами и говорят — а давайте мы не будем никого отчислять или хотя бы самую капельку, потому что это же второй курс, вы их ещё успеете на четвёртом отчислить!

Потом была пересдача вечерников — это был вообще атас. Если кто помнит, мы каждый год ходим мучить студентов одним и тем же тестом с вопросами, в сущности, несложными. Изложенными в учебнике, написанном предельно понятно. Нет, это, конечно, не предел, можно и ещё понятнее. И каждый год у нас одна и та же система оценивания по этому тесту — надо ответить на 6 вопросов правильно в первой половине и на 6 вопросов во второй.

Ну так вот, если оценивать пересдачу вечерников подобным образом, то на комиссию по отчислению отправились бы 50 человек. Из примерно 90-100 всего сдававших. Мы покумекали и решили, что нам не улыбается вручную заполнять 50 протоколов комиссии по три экземпляра. Мы снизили планку до 10 правильных ответов в сумме. Осталось 24 «комиссуемых». Мы позвонили коллеге. Коллега тоже очень не хотел ничего такого и просил ещё снизить. В итоге остановились на 8 правильных ответах в сумме и 14 комиссуемых.

Что такое 8 правильных ответов из 20? Напоминаю, что в тесте на каждый вопрос 4 варианта ответов, лишь один из них — правильный.

Проверим гипотезу, что студенты вечернего отделения вообще не открывали учебник, а внутри них сидит идеальный генератор случайных чисел. Тогда мы можем рассчитать теоретические вероятности соответствующих исходов (с учётом того, что вероятность угадывания равна ¼). Поскольку я напрочь забыл всю комбинаторику, я открыл учебник «Математика для психологов» (Кричевец, Шикин, Дьячков) — кстати, замечательная книжка, редкий случай, когда я с первого прохода понимаю о чём вообще речь. Правда, трудно найти нужное место. Но я его нашёл. Оно изложено в одном абзаце на стр. 238-239 и называется «Схема испытаний Бернулли с p не равным q».

Если я всё правильно понял, то шанс на соответствующее число правильных ответов составляет

(20!/(x!*(20-x)!))*(0,75^(20-x))*0,25^x

Если я нигде не ошибся в расчётах, вероятность случайно угадать 8 (и более) правильных ответов к тесту составляет приблизительно 10%. Вообще решил такую табличку составить для студентов. Пусть радуются.

Шанс на халяву




Количество ответов Шанс кумулятивный
0 0,32% 100,00%
1 2,11% 99,68%
2 6,69% 97,57%
3 13,39% 90,87%
4 18,97% 77,48%
5 20,23% 58,52%
6 16,86% 38,28%
7 11,24% 21,42%
8 6,09% 10,18%
9 2,71% 4,09%
10 0,99% 1,39%
11 0,30% 0,39%
12 0,08% 0,09%
13 0,02% 0,02%
14 2,57E-005 2,95E-005
15 3,43E-006 3,81E-006
16 3,57E-007 3,87E-007
17 2,80E-008 2,96E-008
18 1,56E-009 1,61E-009
19 5,46E-011 5,55E-011
20 9,09E-013 9,09E-013

Халява пришла

Здорово было бы со студентами разбираться во всей этой комбинаторике, но этим занимаются с ними математики на первом курсе. В любом случае, у нас есть ещё масса интереснейших тем — каков шанс получить зачёт, при условии, что я точно знаю ответы на четыре вопроса? каков шанс, что человек, получивший зачёт, знает ответы всего на четыре вопроса, а остальные угадал... Ну и так далее.

Комментариев нет

«Программист», ответственный за часть работы по обработке данных дипломника, не владеет SQL. Поэтому я сейчас преобразовываю данные в файловый формат под задачу. Интересно, что он будет делать с 700 тысячами файлов? Файлы я нагенерил. WinRar вроде бы говорит, что часиков за пять их заархивирует... Надеюсь, я нигде не лажанулся и не придётся всё переделывать. Впрочем, всё равно придётся ещё раза три-четыре.

Комментариев нет

ustrizza — настоящая террористка. Подкинула такую ссылку: en.akinator.com. Штуковина пытается угадать, кого вы загадали, задавая вопросы на «да-нет». Действительно, неплохо получается — с более-менее очевидными вещами. Начал я играть почему-то с А.П. Чехова, со второго захода (нажать More Questions) — угадал. Знает о Скиннере, про Фрейда совсем глупо спрашивать. Самообучается. Постоянно пытается подсунуть мне Хомского в ответ на мои загадки.

Комментариев нет

Каждый раз пугаюсь, когда ко мне подходят студенты с менеджмента или организационной с исследованиями, в которых есть данные начальников и их подчинённых. И предполагается установление чего-нибудь этакого с учётом данного факта. Пугаюсь я потому, что ни разу до сих пор не видел адекватной выборки под такие задачи. Гипотеза может звучать как-нибудь типа — «в группах, где начальники ведут себя так-то, происходит то-то». Для того, чтобы как-то более-менее нормально проверять такие гипотезы в числах на корреляционном материале (без эксперимента со сменой начальника и т.п.) нужно, чтобы было ну хоть двадцать рабочих групп. В каждой из которых человек по пять хотя бы подчинённых.

Дело в том, что «случай» в подобной ситуации — группа, а не работник. Т.е., все те правила по поводу численности испытуемых, которые действуют на некоторых кафедрах, надо переводить в численность групп. Если на кафедре считают, что корреляцию нельзя считать меньше, чем по 60 испытуемым, значит должно быть 60 рабочих групп, в каждой по пять человек. Впрочем, можно просто 60 пар «начальник-подчинённый», уже можно интересно играть.

В суровой реальности студенты приходят с данными по семи-десяти группам, в которых от двух до двадцати подчинённых. И хотят непонятного. В лучшем случае есть некий внешний критерий про эти группы. В худшем — полагается, что мнение начальника и есть внешний критерий. Хорошо, когда это какое-то одно мнение по одному вопросу.

В некоторых ситуациях можно попробовать продублировать данные начальника в качестве свойств его подчинённых, но это неправильно, ибо приводит к неоправданному увеличению объёма данных и т.п. Можно посчитать разными способами расстояние между начальником и подчинёнными. Можно подсчитать в группах согласованность мнений экспертов (членов группы) и т.д. В общем, можно подсчитать огромное количество самых разных показателей, только вот из-за того, что групп всего семь, что делать дальше с двумя (или двадцать раз двумя) рядами по семь чисел — загадка века. Вчера в качестве примера того, как можно это делать, увидел коллективный труд, в котором считалась корреляция (Спирмен) восьми цифирей, полученных в результате колоссального труда, с «жизненным критерием» в виде, кажется, оценки начальника. Ню-ню.

В общем, в это воскресное утро шлю луч любви научным руководителям подобных работ.

Комментариев нет

Расчёт линейной корреляции — видео.

Честно — не знаю, зачем я это занудство снимаю. По-моему, любой студент вуза с сохранным интеллектом способен выполнить эту процедуру по письменной инструкции из учебника.

Один комментарий

Сегодня, на занятиях по SPSS, утомившись объяснять что-то:

КОРРЕЛЯЦИЯ ЕСТЬ ВЗАИМОСВЯЗЬ, ДАННАЯ НАМ В ЗВЁЗДОЧКАХ!!!

Один комментарий

Три дня не мог выложить — всё время связь обрывалась. Видео про коэффициент корреляции Пирсона уже почти доснято...

Комментариев нет

Хорошо, когда пин-кодов у тебя два — на сим-карту мобильника и на банковскую карту. А когда сим-карт пяток-другой, да три банковские карточки? Не все банки разрешают самостоятельно назначать пин-коды. В итоге мне всё-таки придётся записывать часть из них на бумажки. Вернее, даже не на бумажки, а хранить их в почте. В принципе, при желании, можно было бы даже хранить такие пин-коды в открытом виде :-)

Вот так выглядит моя запись пин-кода новой банковской карточки (некоторые детали изменены)

1) первая цифра номера дома, в котором жил дед
2) какого разряда я был библиотекарь
3) которым по счёту ребёнком был мой прадед
4) М-в — отец какой по счёту жены третьего мужа одной приличной пожилой дамы?

В общем, я практически уверен, что грамотный следопыт, потратив некоторое количество сил и времени, выяснил бы ответы на эти вопросы. Думаю, что по сложности (от самого простого) они идут в последовательности 2, 1, 4, 3. Если я правильно понимаю, подробная биография моего прадеда не публиковалась, и более-менее помнят ответ на этот вопрос сейчас вряд ли больше пяти человек в мире. Остальное известно в пересказах многим, а второй вопрос вообще примитивен, ответ на него хранится во многих источниках, включая ксерокс трудовой книжки, который валялся где-то на кафедре.

В конце концов, всегда можно записывать пинкоды и ещё более простым способом, всё равно мало кто знает ответы:

1) сколько гипотез проверяет трёхфакторный ANOVA
2) чему равна сумма бесконечного массива корреляций случайных числовых рядов...

Комментариев нет

http://community.livejournal.com/spb_auto/5518489.html — надо будет студентам комменты к этому посту показывать в качестве пояснения того, как примерно выглядит пилотаж по анкете и какие примерно результаты из него можно извлечь.

Комментариев нет

Только я вот вообще ничего не успеваю. Я таки привёз сюда свою бутылку текилы, но я вряд ли успею толком ей воспользоваться. Потому что некогда. А сейчас мне бы надо лечь спать и пропустить все возможности сегодняшней ночи, потому что иначе мне не удастся хорошо поработать и насладиться завтрашней. За завтра мне надо посетить мини-семинар Морозова про e-learning (он обещался сравнивать современные технологии с обучающим фильмом сороковых годов), вспомнить PHP и перелопатить информацию для диска, в какой-нибудь форме поучаствовать в закрытии и глинтвейне, успеть таки пообщаться с Антиповым, Надя хотела пообсуждать свои две мудрёные странички про блеф, поучаствовать в последнем аврале с вычиткой ляпов на дисках и ещё успеть немного выспаться, потому что мне же потом на машине ехать, а если я не посплю хотя бы три часа, то это плохая идея.

А ещё на сегодняшнем Морозове про контент-анализ мне пришла в голову забавная идея. Что коэффициенты корреляции тоже подчиняются закону Ципфа. То есть самые большие коэффициенты корреляции в исследовании несут меньше всего смысла из всего набора. Их можно назвать стоп-корреляциями. Поэтому неудивительно, что факторный анализ их не любит, у него от них несварение матриц происходит.

Хорошо, что все старые знакомые не рвутся со мной общаться, пить и т.п. Мне вполне достаточно радоваться, видя их бодрыми и весёлыми, разглядывая их забавных и таких похожих на них детишек...

Комментариев нет

Тяжело без знания английского. Вот опять в последний момент надо перевести кусочек текста, а я туплю. Плод дикого тупления, над которым я теперь нервно хихикаю...

...but the anchoring effect continued to increase continuously...

Имелось в виду, что на графике наблюдается неуклонный рост. Что функция на этом участке монотонно растёт. О. Монотонно. Не непрерывно, а монотонно. Steadily increasing. Надеюсь, ни один нормальный человек не наткнётся на эту аннотацию.

Комментариев нет

Мои сайты

Рубрики

Реклама

Реклама

Архивы

Взлом вконтакте