[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .
Ctrl предыдущая следующая Ctrl Страницы
1 2 3

Форум «Академия» / Немного статистики и расчет вероятного рекорда

GoodLoki Сообщение #41 14 ноября 2013 в 11:31
Новичок
30
Phemmer
Вот это уже чуть больше похоже на математику.
Осталось только подкорректировать:
Вместо оценки нормальности распределения на глазок:
Пока не очень ясно, сильно ли отличается от нормального. Усредняем каждую скорость по шести соседним, получаем:
тут картинка
Вот это уже весьма похоже. Отклонения не большие. Красным цветом показан график распределения, установленный по рассчитанным параметрам из реального распределения: математическое ожидание=403,6, стандартное отклонение - 34,6.

Использовать какой-нибудь критерий согласия: Пирсона (хи-квадрат), или Колмогорова
А вместо умных слов:
Находим область, в которой по этому распределению должен содержаться всего один заезд, это очень просто сделать интегрированием ;) :
Получается область рекорда – 529+, то есть от [529 до бесконечности ;))
Но наиболее вероятно он выпадет в районе 535
10% шансов – 550+.

Просто сказать: применяя правило трёх сигм, определяем вероятный рекорд.
Последний раз отредактировано 14 ноября 2013 в 11:29 пользователем GoodLoki
turbulent Сообщение #42 18 ноября 2013 в 23:11
Кибергонщик
45
А здесь рекорд определяется со сколькими ошибками?
Phemmer Сообщение #43 18 ноября 2013 в 23:42
Супермен
71
turbulent,

Задай как-то иначе вопрос, что имеешь в виду.

Если имеется в виду ошибочность, при которой выпадет рекорд - она тут не рассматривается, может быть как 0 так и не 0 ошибок. Если имеется в виду точность вычисления, то тут не применима точность вида XXX±YY знаков. Тут говорится о наиболее вероятном значении. Хотя у многих было сходство в пределах 5-10 знаков или даже лучше.
gluckss2 Сообщение #44 19 ноября 2013 в 08:21
Маньяк
47
Круто, все совпало в точь-точь. Прикольно.
дядя_Паша Сообщение #45 11 декабря 2013 в 13:02
Супермен
2
Довольно изящный способ определения вероятного рекорда.

Общая рекомендация такая: взять область начиная с того момента, как средняя скорость выросла где-то на 30 знаков.

Имеется в виду: взять область, в которой средняя изменилась не более, чем на 30 знаков?

Вообще, если строго, то надо доказывать, что сумма нормальных распределений (а их будет несколько, для каждой средней - свое) представляет также нормальное распределение (видимо, так и должно быть, исходя из соображений симметрии).

Использовать какой-нибудь критерий согласия: Пирсона (хи-квадрат), или Колмогорова

Можно воспользоваться и самым простым способом, который всегда работает - по МНК (если рассматривать распределение как некоторую функцию). Мера сходства - коэффициент корреляции.

Недоездунам, которые фильтруют неудачные заезды, тоже можно определить вероятный рекорд таким способом, только выбрать параметры функции нормального распределения нужно будет вручную, так, чтобы добиться максимального сходства в этой предрекордной области

Предрекордная область, скорее всего, тоже будет искажена, что должно привести к искажению результата.

Интересует еще такой вопрос: исследовалось ли, как влияет увеличение пробега при том же распределении результатов? Имеется в виду - оставить те же результаты, как и в примере, но каждый из них взять, допустим, по 10 раз, в итоге получится 70000 точек, распределенных по тому же закону. Ясно, что область рекорда (в которую должна всегда попадать только одна точка) отодвинется дальше от средней. Вопрос: насколько далеко? И хорошее ли согласие наблюдается с п.6 1-го способа?

Просто сказать: применяя правило трёх сигм, определяем вероятный рекорд.

Здесь правило "трех сигм" не используется. В нем указана относительная величина, выходящая за +/-3 СКО - это 0,3% всей вероятности. В данном примере используется область, соответствующая вероятности одного заезда. А процент будет зависеть от общего числа заездов.
Phemmer Сообщение #46 11 декабря 2013 в 15:44
Супермен
71
дядя_Паша писал(а):
Имеется в виду: взять область, в которой средняя изменилась не более, чем на 30 знаков?

Можно и так сказать. Только изменилась=выросла из-за ее естественного роста. Если бы скорость уменьшилась, тогда наверняка тут влияют факторы, которые не подчиняются нормальному распределению.

дядя_Паша писал(а):
Вообще, если строго, то надо доказывать, что сумма нормальных распределений (а их будет несколько, для каждой средней - свое) представляет также нормальное распределение (видимо, так и должно быть, исходя из соображений симметрии).

Сумма нормальных распределений для логарифмического роста средней скорости (а прогресс навыка набора подчиняется закону логарифмического роста) не будет также нормальным распределением. Но для небольшого участка (как я рекомендую 30 знаков) расхождение роста от линейного небольшое, поэтому я рискнул применить.

дядя_Паша писал(а):
Предрекордная область, скорее всего, тоже будет искажена, что должно привести к искажению результата.

Если недоезжаются неудачные заезды и неудачные тексты то предрекордная область не должна сильно расходиться. Вот здесь совпала нормально. И опять же, смотря сколько будет недоездов. Сильные недоездуны пока не передали ни одной статистики на изучение :)

дядя_Паша писал(а):
Интересует еще такой вопрос: исследовалось ли, как влияет увеличение пробега при том же распределении результатов? Имеется в виду - оставить те же результаты, как и в примере, но каждый из них взять, допустим, по 10 раз, в итоге получится 70000 точек, распределенных по тому же закону. Ясно, что область рекорда (в которую должна всегда попадать только одна точка) отодвинется дальше от средней. Вопрос: насколько далеко? И хорошее ли согласие наблюдается с п.6 1-го способа?

Да, исследовалось. Можно взять реальные данные и поставить их несколько раз или взять закон распределения по реальным параметрам (средняя, ст. отклонение) и увеличивать цифру пробега. Совпадение с первым способом хорошее (не по реальным данным взятым пять раз, так как рекорд в них не возрастет от этого ;), а в созданном распределении) начиная от 1000 текстов пробега. Вот же писал:
Phemmer писал(а):
По влиянию пробега в обычном - совпадение способов хорошее. В первом способе была зависимость Р = (0,019*LN(B) + 1,114)*C. Коэффициенты 0,019 и натуральный логарифм пробега дают очень хорошую схожесть с подсчетом влияния пробега из нормального распределения. А коэффициент 1,114 будет коррелировать со стандартным отклонением. Если бы было прислано много статистик, можно было б отследить это влияние.
Как я проверял: устанавливаем жестко среднюю скорость, ст. отклонение. Ставим первоначальный пробег. Подбираем коэффицицент вместо 1,114 такой, чтобы вероятные рекорды совпали. Потом меняем пробег сколько угодно в разумных пределах - и вероятные рекорды будут очень хорошо совпадать.
Последний раз отредактировано 11 декабря 2013 в 15:46 пользователем Phemmer
GoodLoki Сообщение #47 11 декабря 2013 в 15:46
Новичок
30
дядя_Паша
Здесь правило "трех сигм" не используется. В нем указана относительная величина, выходящая за +/-3 СКО - это 0,3% всей вероятности. В данном примере используется область, соответствующая вероятности одного заезда. А процент будет зависеть от общего числа заездов.

Вот поэтому, я и считаю, что лучше было бы использовать правило трёх сигм. Результат не должен напрямую зависеть от величины выборки.
дядя_Паша Сообщение #48 11 декабря 2013 в 16:08
Супермен
2
Но для небольшого участка (как я рекомендую 30 знаков) расхождение роста от линейного небольшое, поэтому я рискнул применить.

Да, именно это я подразумевал.
(не по реальным данным взятым пять раз, так как рекорд в них не возрастет от этого ;)

Вот поэтому, я и считаю, что лучше было бы использовать правило трёх сигм. Результат не должен напрямую зависеть от величины выборки.

В первом приближении - да, не должен. С другой стороны, увеличение пробега способствует увеличению вероятного рекорда, как это следует из первого способа определения рекорда (да и по логике тоже). Во втором способе увеличение объема выборки при той же средней также приведет к увеличению рекорда. Вопрос в том, как оба изменения соотносятся. Вот Phemmer и пишет, что хорошо согласуются.
скрытый текст…

GoodLoki Сообщение #49 11 декабря 2013 в 16:38
Новичок
30
дядя_Паша
Возьмём, для примера гипотетического клавогонщика с пробегом в 10 тысяч текстов в обычном, без особого изменения средней.
И возьмём его гипотетического клона с пробегом в обычном в 1 тысячу текстов. (И в том и в другом случае гипотетический клавогонщик будет доезжать все заезды.)
Параметры распределения будут очень близки, так как это один и тот же человек.
А вот вероятный рекорд в первом случае будет существенно выше, чем во втором.
Получается, что вероятный рекорд зависит, не только от наборщика, но и от учётки, под которой он в данный момент набирает?

Я думал, что ты поймёшь это и без дополнительного примера.
дядя_Паша Сообщение #50 11 декабря 2013 в 16:59
Супермен
2
Получается, что вероятный рекорд зависит, не только от наборщика, но и от учётки, под которой он в данный момент набирает?

Немного поправлю: от пробега, а не от учетки ) и нужно тогда суммировать пробег по двум учеткам, т.к. это один и тот же человек. Хотя и без суммирования, там, где больше пробег - выше шанс поймать хорошее состояние и легкий текст.
Я думал, что ты поймёшь это и без дополнительного примера.

скрытый текст…
MMMAAANNN Сообщение #51 12 января 2014 в 18:56
Супермен
36
Вот вам такое наблюдение, может пригодится где:
http://klavogonki.ru/u/#/154152/journal/52...bf62dd3308b4567
AvtandiLine Сообщение #52 24 апреля 2014 в 06:28
Кибергонщик
61
Phemmer http://klavogonki.ru/forum/academy/795/page2/#post28 10 июля 2013 в 00:03 писал(а):
дядя_Паша писал(а):
3. ОК. Только картина безрадостная: чтобы снизить процент ошибок на 0,2%, нужно пробег увеличить в 2 раза.

Да уж. Если прикинуть какой пробег за плечами у Автандилины - на клавогонках она имеет наименьшее количество ошибок (0,15) - по тренду - около 12 млн текстов! (в расчет на средний текст, пусть приблизительно равен длине обычке).
...
Видимо понадобилось меньше чем 12 млн потому что многие в моей статистике пришли на клавогонки уже с каким-то пробегом. Или способ обучения другой, тоже вероятно.


...Способ обучения у меня другой. Посылка о снижении процента ошибок по мере увеличения пробега - к моей статистике абсолютно, абсолютно неприменима.
Очень хотелось бы, чтобы это было ясно всем и всегда, когда речь идёт о моей статистике, и особенно на Клавогонках. :)

Не говоря уже о том, что пришла я на Клавогонки с готовым, давно сформировавшимся навыком и с такими убеждениями насчёт слепой печати, которые в основном не совпадают со здешними (как правильно отметил дядя_Паша, у меня не спорт, а практическая машинопись),
- не говоря уже об этом, потому что в данном контексте важнее другое, а именно вот что:

Обучали меня хорошо, очень-очень хорошо, фактически идеально, а я, со своей стороны, училась по-настоящему, серьёзно. Поэтому освоение прошло успешно. Так какое же "снижение процента ошибок с ростом пробега" может быть у человека, у которого изначально при обучении было ошибок, я не знаю, одна штука в месяц...
Наоборот всё: с ростом пробега у меня произошло, и в том числе на Клавогонках, повышение процента ошибок.

Извините, повторю сказанное уже неоднократно в разных темах:
Чтобы снизить процент ошибок сколько-нибудь явно и твёрдо, - существует путь фактически куда короче, нежели нарабатывать увеличение пробега до астрономических цифр. Но, к сожалению, этот короткий путь, во-первых, очень скучный по определению, так как он принципиально основан на использовании монотонности. Во-вторых, этот путь предполагает полное вложение сил, уважительно-высокое понятие о предмете освоения, а также доверие к опыту предшественников, заложенному в упражнения классической школы. Не удивляюсь, что сейчас этот путь, скажем так, малопопулярен. :)

И вот в чём этот путь: глубоко, тщательно, терпеливо проштудировать начальный курс, выполняя с каждым ударом по клавишам всю огромную учебную работу, которая требуется для закладки автоматизма. (Продолжение под хайдом.)
скрытый текст…

Phemmer писал(а):
Правда если оценить реальный возможный пробег - по 300 эквиваленто-обычек в день в течении пяти дней в неделю в течение пусть сорока лет - выходит около 3 млн текстов. :)

Повеселило. По-доброму. :)
Такое представление просто от незнания моей биографии. На самом деле она далека от робота. )) У меня машинопись волнами, иногда я бывала в машинописи профессионалом, иногда - существенно переключалась на другие профессии, в моей жизни их несколько, и весьма разные этапы.
Последний раз отредактировано 24 апреля 2014 в 06:37 пользователем AvtandiLine
xcislav Сообщение #53 27 января 2020 в 17:16
Маньяк
33



vsegda tak bylo, est, i budet

i eto s godami narabatyvaetsia skill vziatiya vysshego rekorda s nizkogo starta
voliu v kulak - i k vershinam gor!

p.s. i rang do kontsa zhizni

скрытый текст…
Последний раз отредактировано 27 января 2020 в 17:28 пользователем xcislav

Чтобы писать в форуме, нужно зарегистрироваться.

Ctrl предыдущая следующая Ctrl Страницы
1 2 3

Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена