Переборыч
|
Сообщение #23
9 апреля 2011 в 11:32
|
Клавомеханик-Организатор событий
55 |
Bombo писал(а): Тему глянул, но там только рассуждения. Никакой реализации. В первом сообщении Владимир предложил частотность, как критерий сложности: archi77 писал(а): Сложность текста можно замерять по таким параметрам: 2. количество 2-х буквенных сочетаний, и их частотность. Твоё первое сообщение вторит. Кроме среднего арифметического частот диграмм, дополнительные мат. операции с цифрами с потолка будут избыточны. Последний раз отредактировано 9 апреля 2011 в 11:33 модератором Переборыч
|
Arkaine
|
Сообщение #24
9 апреля 2011 в 11:41
|
Маньяк
1 |
А почему именно 2-х буквенные сочетания?
|
Bombo
|
Сообщение #25
9 апреля 2011 в 11:42
|
Маньяк
33 |
|
DIgorevich
|
Сообщение #26
9 апреля 2011 в 11:46
|
Новичок
62 |
Bombo писал(а): хм. не понял Серега, у нас, как всегда пытается всё проарксинусить ... А твой алгоритм очень даже наглядно работает и, что главное, подтвержден результатами рекордов.
|
Bombo
|
Сообщение #27
9 апреля 2011 в 11:48
|
Маньяк
33 |
Arkaine писал(а): А почему именно 2-х буквенные сочетания? Просто я представлял как это реализовать. Так же можно реализовать для другого критерия и (возможно) объединить результаты.
|
Переборыч
|
Сообщение #28
9 апреля 2011 в 11:58
|
Клавомеханик-Организатор событий
55 |
DIgorevich писал(а): Серега, у нас, как всегда пытается всё проарксинусить ... А твой алгоритм... В данном случае я пытаюсь разарксинусить ввиду очевидно излишнего нагромождения и назвать разрез сложности своим именем: "средняя частотность диграмм".
|
Bombo
|
Сообщение #29
9 апреля 2011 в 12:03
|
Маньяк
33 |
Слишком велика разница в значениях чтобы использовать среднее арифметическое Переборыч писал(а): "средняя частотность диграмм".
|
Переборыч
|
Сообщение #30
9 апреля 2011 в 12:10
|
Клавомеханик-Организатор событий
55 |
Действительно, я не учёл, что ты сделал обратнопропорциональную зависимость сложности от частотности.
|
Arkaine
|
Сообщение #31
9 апреля 2011 в 12:20
|
Маньяк
1 |
Ведь разные последовательности 2-х буквенных сочетаний тоже встречаются с разной частотностью.
Вот даже слова «азиатский» и «Азия» — «ази» здесь как бы два совершенно разных слова. Ведь в первом случае мы нажимаем клавишу с буквой «З» из основной позиции, а во втором мы прямо от shift'а «идём» на это клавишу. И само собой, во втором случае задействуется навык нажимания и отпускания shift'а.
Также, достаточно частотное (употребляемое и в бытовой и в литературной речи) слово «неуправляемый» при всей частотности последовательностей букв в нём, из-за этого «еуп» и следующим за ним «яемый» принуждает запястье двигаться в разных направлениях. Такое сочетание последовательностей букв, думается, не очень частое.
Зато вот набирая, например, «аэродинамический», ты набираешь как бы «аэро» и «динамический».
И как это всё учитывать?
|
Bombo
|
Сообщение #32
9 апреля 2011 в 12:28
|
Маньяк
33 |
вот список который я использую: ---------->И я вообще не учитываю движений пальцев, рук и так далее. Исходя из списка ты за жизнь набрал "ст" 6792140 раз за жизнь и где бы эти буквы не стояли, как бы сложно тебе небыло их нажимать.. Ты бы их нажал очень быстро, так как привык! А вот с "йв" дела бы обстояли гораздо сложнее) неуправляемый 15.783 загнанный 8.65785 уполномоченный 10.9889 завязанный 9.70679 замурованный 8.29558 изолированный 9.07489 приставленный 8.31114 подкопанный 9.28293 называемый 9.08346 изгоняемый 11.399 зарубаемый 9.42736 проветриваемый 9.44912 вот прогнал подобные слова вместе со словом "неуправляемый" Последний раз отредактировано 9 апреля 2011 в 12:36 пользователем Bombo
|
ACnuPAHT
|
Сообщение #33
9 апреля 2011 в 12:30
|
Маньяк
15 |
Сложность текста зависит от раскладки, постановки рук, от того, статический набор или динамический. А количественно сложность текста можно определить по любому из готовых алгоритмов оптимизации раскладки, немного переделав его (в первом случае варьируется раскладка, во втором - прогоняемый текст). Давайте тексты, погоняю в Маткаде по своей модели (была описана в профиле у JohnnyCar). Скидывайте на t-p-l@inbox.ru
|
mystes
|
Сообщение #34
9 апреля 2011 в 12:34
|
Новичок
1 |
Верно, переходы между пакетами надо как-то учитывать. ACnuPAHT писал(а): Сложность текста зависит от раскладки, постановки рук, от того, статический набор или динамический. И от конструкции клавиатуры. Последний раз отредактировано 9 апреля 2011 в 12:37 пользователем mystes
|
ACnuPAHT
|
Сообщение #36
9 апреля 2011 в 13:52
|
Маньяк
15 |
Переходы учитываются "скользящим" суммированием сложности, например, диграмм или триграмм при сдвиге на 1 букву. Только потом надо отнормировать (поделить). Т.е. для слова "если" будут три диграммы "ес", "сл", "ли" или две триграммы "есл", "сли". Димаст17, соображения, высказанные тобой, описаны на сайтах codesharp и модели carpalx. Соответственно, я их тоже учитывал при построении алгоритма оптимизации. Ни в каком оптимизаторе не видел, чтобы нижний ряд был проще, чем верхний. По-моему, как раз наоборот. Лично для меня особое зло - буквы "ч" и "с" ("б", "ю" на правой попроще, но тоже сложно). Палец на большой скорости просто скользит ногтем по этим клавишам. Из-за этого частые ошибки. Бомбо, статистики реальных языков имеют степенной характер (см., например, книгу М.Шредер "Фракталы, хаос, степенные законы"), поэтому при диапазоне несколько порядков лучше брать логарифм (в данном случае частотности). Но корень тоже ничего (и оценка будет более чувствительной) ;) Последний раз отредактировано 9 апреля 2011 в 14:19 пользователем ACnuPAHT
|
Bombo
|
Сообщение #37
10 апреля 2011 в 11:44
|
Маньяк
33 |
ACnuPAHT - ничего себе! *сижу читаю, вникаю
|
Bombo
|
Сообщение #38
10 апреля 2011 в 12:07
|
Маньяк
33 |
техническая сложность (моя) - 1/3; степень отработанности сочетаний (твоя) - 2/3; суммируем, и получаем достаточно обоснованную оценку сложности. Т.е. мои коэффициенты можно умножить на 20-25 и сложить с твоими :) А может просто домножать мое значение на твой коэффициент?
|
morozovlalex
|
Сообщение #39
10 апреля 2011 в 12:16
|
Гонщик
29 |
Dimast17 писал:Изначально можно оттолкнуться от расстояния, которое "проходят" пальцы при наборе. За ноль считаем исходную позицию. Интересная мысль, но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль ;) и как их при этом сравнивать, какое из них сложнее? Вероятно, то, что короче. (я имею ввиду раскладку "фыва олдж") Последний раз отредактировано 10 апреля 2011 в 12:31 пользователем morozovlalex
|
ACnuPAHT
|
Сообщение #40
11 апреля 2011 в 03:32
|
Маньяк
15 |
Bombo писал(а): А может просто домножать мое значение на твой коэффициент? Да можно и домножать, особой роли это не сыграет, но разброс значений увеличится. Попробуй, посмотри что получится. Хотя... при умножении две величины входят равноправно, а твоему коэффициенту я бы хотел дать больший вес. morozovlalex писал(а): но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль Для этого во всех "нормальных" моделях учитываются затраты как на перемещения, так и на нажатия, причем нажатиям отдается предпочтение (у них весовой коэффициент больше). Так что при адекватном учете в любом случае ноль не получается. Последний раз отредактировано 11 апреля 2011 в 03:37 пользователем ACnuPAHT
|
Dimast17
|
Сообщение #41
11 апреля 2011 в 09:03
|
Маньяк
47 |
morozovlalex писал(а): Dimast17 писал:Изначально можно оттолкнуться от расстояния, которое "проходят" пальцы при наборе. За ноль считаем исходную позицию. Интересная мысль, но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль ;) и как их при этом сравнивать, какое из них сложнее? Вероятно, то, что короче. (я имею ввиду раскладку "фыва олдж") По ощущениям я бы сказал, что нажатия указательными и средними пальцами можно брать за 0, а вот безымянные и мизинцы, скажем, 0.3 и 0.5, соответственно.
|
mystes
|
Сообщение #42
11 апреля 2011 в 09:20
|
Новичок
1 |
У меня безымянный хуже мизинца в среднем ряде. Чередования пальцев одной руки тоже не все одинаково полезны.
|
Cheatah
|
Сообщение #43
11 апреля 2011 в 11:53
|
Маньяк
16 |
Боюсь оказаться Капитаном Очевидность, но мне представляется, что сложность состоит из двух больших факторов: позиционный и частотный. Для новичков наиболее выражен позиционнный фактор, а частотный вообще не имеет существенного значения; для опытных наборщиков частотный фактор гораздо более важен, а позиционный потихоньку утрачивает свою роль. Поэтому сделать одинаково ровный словарь и для новичков, и для опытных не вполне получится; с другой стороны, если опираться на частотность, можно сделать словарь, который позволит стать "почти опытным наборщиком" за более короткое время, потому что будет тренировать в существенной степени именно частотные, а не редкие сочетания.
|