GoodLoki
|
Сообщение #41
14 ноября 2013 в 11:31
|
Новичок
30 |
PhemmerВот это уже чуть больше похоже на математику. Осталось только подкорректировать: Вместо оценки нормальности распределения на глазок: Пока не очень ясно, сильно ли отличается от нормального. Усредняем каждую скорость по шести соседним, получаем: тут картинка Вот это уже весьма похоже. Отклонения не большие. Красным цветом показан график распределения, установленный по рассчитанным параметрам из реального распределения: математическое ожидание=403,6, стандартное отклонение - 34,6. Использовать какой-нибудь критерий согласия: Пирсона (хи-квадрат), или КолмогороваА вместо умных слов: Находим область, в которой по этому распределению должен содержаться всего один заезд, это очень просто сделать интегрированием ;) : Получается область рекорда – 529+, то есть от [529 до бесконечности ;)) Но наиболее вероятно он выпадет в районе 535 10% шансов – 550+. Просто сказать: применяя правило трёх сигм, определяем вероятный рекорд. Последний раз отредактировано 14 ноября 2013 в 11:29 пользователем GoodLoki
|
turbulent
|
Сообщение #42
18 ноября 2013 в 23:11
|
Кибергонщик
45 |
А здесь рекорд определяется со сколькими ошибками?
|
Phemmer
|
Сообщение #43
18 ноября 2013 в 23:42
|
Супермен
71 |
turbulent, Задай как-то иначе вопрос, что имеешь в виду. Если имеется в виду ошибочность, при которой выпадет рекорд - она тут не рассматривается, может быть как 0 так и не 0 ошибок. Если имеется в виду точность вычисления, то тут не применима точность вида XXX±YY знаков. Тут говорится о наиболее вероятном значении. Хотя у многих было сходство в пределах 5-10 знаков или даже лучше.
|
gluckss2
|
Сообщение #44
19 ноября 2013 в 08:21
|
Маньяк
47 |
Круто, все совпало в точь-точь. Прикольно.
|
дядя_Паша
|
Сообщение #45
11 декабря 2013 в 13:02
|
Супермен
2 |
Довольно изящный способ определения вероятного рекорда. Общая рекомендация такая: взять область начиная с того момента, как средняя скорость выросла где-то на 30 знаков. Имеется в виду: взять область, в которой средняя изменилась не более, чем на 30 знаков? Вообще, если строго, то надо доказывать, что сумма нормальных распределений (а их будет несколько, для каждой средней - свое) представляет также нормальное распределение (видимо, так и должно быть, исходя из соображений симметрии). Использовать какой-нибудь критерий согласия: Пирсона (хи-квадрат), или Колмогорова Можно воспользоваться и самым простым способом, который всегда работает - по МНК (если рассматривать распределение как некоторую функцию). Мера сходства - коэффициент корреляции. Недоездунам, которые фильтруют неудачные заезды, тоже можно определить вероятный рекорд таким способом, только выбрать параметры функции нормального распределения нужно будет вручную, так, чтобы добиться максимального сходства в этой предрекордной области Предрекордная область, скорее всего, тоже будет искажена, что должно привести к искажению результата. Интересует еще такой вопрос: исследовалось ли, как влияет увеличение пробега при том же распределении результатов? Имеется в виду - оставить те же результаты, как и в примере, но каждый из них взять, допустим, по 10 раз, в итоге получится 70000 точек, распределенных по тому же закону. Ясно, что область рекорда (в которую должна всегда попадать только одна точка) отодвинется дальше от средней. Вопрос: насколько далеко? И хорошее ли согласие наблюдается с п.6 1-го способа? Просто сказать: применяя правило трёх сигм, определяем вероятный рекорд. Здесь правило "трех сигм" не используется. В нем указана относительная величина, выходящая за +/-3 СКО - это 0,3% всей вероятности. В данном примере используется область, соответствующая вероятности одного заезда. А процент будет зависеть от общего числа заездов.
|
Phemmer
|
Сообщение #46
11 декабря 2013 в 15:44
|
Супермен
71 |
дядя_Паша писал(а): Имеется в виду: взять область, в которой средняя изменилась не более, чем на 30 знаков? Можно и так сказать. Только изменилась=выросла из-за ее естественного роста. Если бы скорость уменьшилась, тогда наверняка тут влияют факторы, которые не подчиняются нормальному распределению. дядя_Паша писал(а): Вообще, если строго, то надо доказывать, что сумма нормальных распределений (а их будет несколько, для каждой средней - свое) представляет также нормальное распределение (видимо, так и должно быть, исходя из соображений симметрии). Сумма нормальных распределений для логарифмического роста средней скорости (а прогресс навыка набора подчиняется закону логарифмического роста) не будет также нормальным распределением. Но для небольшого участка (как я рекомендую 30 знаков) расхождение роста от линейного небольшое, поэтому я рискнул применить. дядя_Паша писал(а): Предрекордная область, скорее всего, тоже будет искажена, что должно привести к искажению результата. Если недоезжаются неудачные заезды и неудачные тексты то предрекордная область не должна сильно расходиться. Вот здесь совпала нормально. И опять же, смотря сколько будет недоездов. Сильные недоездуны пока не передали ни одной статистики на изучение :) дядя_Паша писал(а): Интересует еще такой вопрос: исследовалось ли, как влияет увеличение пробега при том же распределении результатов? Имеется в виду - оставить те же результаты, как и в примере, но каждый из них взять, допустим, по 10 раз, в итоге получится 70000 точек, распределенных по тому же закону. Ясно, что область рекорда (в которую должна всегда попадать только одна точка) отодвинется дальше от средней. Вопрос: насколько далеко? И хорошее ли согласие наблюдается с п.6 1-го способа? Да, исследовалось. Можно взять реальные данные и поставить их несколько раз или взять закон распределения по реальным параметрам (средняя, ст. отклонение) и увеличивать цифру пробега. Совпадение с первым способом хорошее (не по реальным данным взятым пять раз, так как рекорд в них не возрастет от этого ;), а в созданном распределении) начиная от 1000 текстов пробега. Вот же писал: Phemmer писал(а): По влиянию пробега в обычном - совпадение способов хорошее. В первом способе была зависимость Р = (0,019*LN(B) + 1,114)*C. Коэффициенты 0,019 и натуральный логарифм пробега дают очень хорошую схожесть с подсчетом влияния пробега из нормального распределения. А коэффициент 1,114 будет коррелировать со стандартным отклонением. Если бы было прислано много статистик, можно было б отследить это влияние. Как я проверял: устанавливаем жестко среднюю скорость, ст. отклонение. Ставим первоначальный пробег. Подбираем коэффицицент вместо 1,114 такой, чтобы вероятные рекорды совпали. Потом меняем пробег сколько угодно в разумных пределах - и вероятные рекорды будут очень хорошо совпадать. Последний раз отредактировано 11 декабря 2013 в 15:46 пользователем Phemmer
|
GoodLoki
|
Сообщение #47
11 декабря 2013 в 15:46
|
Новичок
30 |
дядя_ПашаЗдесь правило "трех сигм" не используется. В нем указана относительная величина, выходящая за +/-3 СКО - это 0,3% всей вероятности. В данном примере используется область, соответствующая вероятности одного заезда. А процент будет зависеть от общего числа заездов. Вот поэтому, я и считаю, что лучше было бы использовать правило трёх сигм. Результат не должен напрямую зависеть от величины выборки.
|
дядя_Паша
|
Сообщение #48
11 декабря 2013 в 16:08
|
Супермен
2 |
Но для небольшого участка (как я рекомендую 30 знаков) расхождение роста от линейного небольшое, поэтому я рискнул применить. Да, именно это я подразумевал. (не по реальным данным взятым пять раз, так как рекорд в них не возрастет от этого ;) Вот поэтому, я и считаю, что лучше было бы использовать правило трёх сигм. Результат не должен напрямую зависеть от величины выборки. В первом приближении - да, не должен. С другой стороны, увеличение пробега способствует увеличению вероятного рекорда, как это следует из первого способа определения рекорда (да и по логике тоже). Во втором способе увеличение объема выборки при той же средней также приведет к увеличению рекорда. Вопрос в том, как оба изменения соотносятся. Вот Phemmer и пишет, что хорошо согласуются. скрытый текст… Лично мне больше нравится первый способ )
|
GoodLoki
|
Сообщение #49
11 декабря 2013 в 16:38
|
Новичок
30 |
дядя_ПашаВозьмём, для примера гипотетического клавогонщика с пробегом в 10 тысяч текстов в обычном, без особого изменения средней. И возьмём его гипотетического клона с пробегом в обычном в 1 тысячу текстов. (И в том и в другом случае гипотетический клавогонщик будет доезжать все заезды.) Параметры распределения будут очень близки, так как это один и тот же человек. А вот вероятный рекорд в первом случае будет существенно выше, чем во втором. Получается, что вероятный рекорд зависит, не только от наборщика, но и от учётки, под которой он в данный момент набирает? Я думал, что ты поймёшь это и без дополнительного примера.
|
дядя_Паша
|
Сообщение #50
11 декабря 2013 в 16:59
|
Супермен
2 |
Получается, что вероятный рекорд зависит, не только от наборщика, но и от учётки, под которой он в данный момент набирает? Немного поправлю: от пробега, а не от учетки ) и нужно тогда суммировать пробег по двум учеткам, т.к. это один и тот же человек. Хотя и без суммирования, там, где больше пробег - выше шанс поймать хорошее состояние и легкий текст. Я думал, что ты поймёшь это и без дополнительного примера. скрытый текст… Я думал, что ты не будешь думать, что я постараюсь понять пример на некорректные следствия Типа: все семейные пары, которые развелись, в прошлом пили чай. Следовательно, чай - причина разводов
|
MMMAAANNN
|
Сообщение #51
12 января 2014 в 18:56
|
Супермен
36 |
|
AvtandiLine
|
Сообщение #52
24 апреля 2014 в 06:28
|
Кибергонщик
61 |
дядя_Паша писал(а): 3. ОК. Только картина безрадостная: чтобы снизить процент ошибок на 0,2%, нужно пробег увеличить в 2 раза. Да уж. Если прикинуть какой пробег за плечами у Автандилины - на клавогонках она имеет наименьшее количество ошибок (0,15) - по тренду - около 12 млн текстов! (в расчет на средний текст, пусть приблизительно равен длине обычке). ... Видимо понадобилось меньше чем 12 млн потому что многие в моей статистике пришли на клавогонки уже с каким-то пробегом. Или способ обучения другой, тоже вероятно. ...Способ обучения у меня другой. Посылка о снижении процента ошибок по мере увеличения пробега - к моей статистике абсолютно, абсолютно неприменима. Очень хотелось бы, чтобы это было ясно всем и всегда, когда речь идёт о моей статистике, и особенно на Клавогонках. :) Не говоря уже о том, что пришла я на Клавогонки с готовым, давно сформировавшимся навыком и с такими убеждениями насчёт слепой печати, которые в основном не совпадают со здешними (как правильно отметил дядя_Паша, у меня не спорт, а практическая машинопись), - не говоря уже об этом, потому что в данном контексте важнее другое, а именно вот что: Обучали меня хорошо, очень-очень хорошо, фактически идеально, а я, со своей стороны, училась по-настоящему, серьёзно. Поэтому освоение прошло успешно. Так какое же "снижение процента ошибок с ростом пробега" может быть у человека, у которого изначально при обучении было ошибок, я не знаю, одна штука в месяц... Наоборот всё: с ростом пробега у меня произошло, и в том числе на Клавогонках, повышение процента ошибок. Извините, повторю сказанное уже неоднократно в разных темах: Чтобы снизить процент ошибок сколько-нибудь явно и твёрдо, - существует путь фактически куда короче, нежели нарабатывать увеличение пробега до астрономических цифр. Но, к сожалению, этот короткий путь, во-первых, очень скучный по определению, так как он принципиально основан на использовании монотонности. Во-вторых, этот путь предполагает полное вложение сил, уважительно-высокое понятие о предмете освоения, а также доверие к опыту предшественников, заложенному в упражнения классической школы. Не удивляюсь, что сейчас этот путь, скажем так, малопопулярен. :) И вот в чём этот путь: глубоко, тщательно, терпеливо проштудировать начальный курс, выполняя с каждым ударом по клавишам всю огромную учебную работу, которая требуется для закладки автоматизма. (Продолжение под хайдом.) скрытый текст… Прошу заметить, что имею в виду не курс "Соло" конкретно !!! :) а вообще полный начальный курс. Лучше всего по достаточно толстому и достаточно давнему бумажному учебнику. В электронном виде, например, "Самоучитель машинописи" Бориса Ивановича Березина есть на сайте Юрикора.Вот с наполнением (которое попыталась описать у себя на ФАВТе faq_avtandiline/post94316621) нужно продолбить как можно больше систематизированных упражнений отдельно на каждую буковку, начиная с "о", "а" и так далее, от простых (находящихся прямо под пальцами) к сложным. Со скоростью, серьёзно, 5 ударов в минуту или меньше... у кого как... - Скорость не произвольно задаётся, не от желания напечатать побыстрее и не от предположений нашей головы о том, какая скорость будет обоснованной или достаточной. Скорость должна полностью подчиняться учебной задаче и реальным нашим возможностям её выполнить! Можем сделать это быстрее? тогда, конечно, делаем быстрее. Но.. действительно ли можем??? Тут нужно крайне трезво подойти, лучше недооценить, чем переоценить. :) В чём смысл медленности? Совсем не в том, чтобы растягивать время искусственно, выжиданиями; лакуны вредны. Нет, смысл медленности противоположный: уплотнить время. В каждую мельчайшую долю секунды понапихать своей работы - как сельдей в бочку. Учебная задача - сделать упражнения предельно точно и именно с вышесказанным наполнением. А не просто механически протюкать пальцами. (Что может быть легче, чем стукнуть по клавише, да? А вот как бы не так!..) Вот из-за наполнения и приходится держаться "медленной" скорости... чтобы всё успеть, да и не один ведь раз, а многократно подряд! Целую строку и даже две строки напечатать, успевая на каждом ударе делать ВСЁ. ...Например, 12 ударов в минуту - в общем случае чересчур быстрая скорость для начального прохождения букв. Переведите на секунды: всего 5 секунд на один удар! для такой громады работы, которую необходимо вложить в подготовку, выполнение и анализ правильности удара по своим ощущениям! Лучше задать себе 12 или больше секунд на один удар, т.е. не быстрее чем 5 ударов в минуту: так надёжнее успевать всё делать полноценно. Это громадный, напряжённый, трудный труд. :) Он должен быть дозированным, распределённым во времени. И всего лучше - если так прорабатывать начальный курс с самого первого его прохождения. То есть в идеале нужно сразу учиться печатать правильно, в этом соль. Именно такое счастье и выпало мне. Подарок Фортуны, просто бесценный. Phemmer писал(а): Правда если оценить реальный возможный пробег - по 300 эквиваленто-обычек в день в течении пяти дней в неделю в течение пусть сорока лет - выходит около 3 млн текстов. :) Повеселило. По-доброму. :) Такое представление просто от незнания моей биографии. На самом деле она далека от робота. )) У меня машинопись волнами, иногда я бывала в машинописи профессионалом, иногда - существенно переключалась на другие профессии, в моей жизни их несколько, и весьма разные этапы. Последний раз отредактировано 24 апреля 2014 в 06:37 пользователем AvtandiLine
|
xcislav
|
Сообщение #53
27 января 2020 в 17:16
|
Маньяк
33 |
vsegda tak bylo, est, i budet i eto s godami narabatyvaetsia skill vziatiya vysshego rekorda s nizkogo starta voliu v kulak - i k vershinam gor! p.s. i rang do kontsa zhizni скрытый текст… v kontse - v samom verkhu ne khvataet liudei vysokih rangov dlia realno velikogo razbrosa srednego s rekordom - tochki-edinicki, uzhatye k linii Последний раз отредактировано 27 января 2020 в 17:28 пользователем xcislav
|