Как сравнить два слова по сложности? - Академия - Форум - Клавогонки

▲ Все форумы

← Ctrl предыдущая следующая Ctrl→ Страницы

1 2 3

Форум «Академия» / Как сравнить два слова по сложности?

Переборыч

Сообщение #23 9 апреля 2011 в 11:32

Клавомеханик-Организатор событий

Bombo писал(а):

Тему глянул, но там только рассуждения. Никакой реализации.

В первом сообщении Владимир предложил частотность, как критерий сложности:

archi77 писал(а):

Сложность текста можно замерять по таким параметрам:
2. количество 2-х буквенных сочетаний, и их частотность.

Твоё первое сообщение вторит. Кроме среднего арифметического частот диграмм, дополнительные мат. операции с цифрами с потолка будут избыточны.

Последний раз отредактировано 9 апреля 2011 в 11:33 модератором Переборыч

Arkaine

Сообщение #24 9 апреля 2011 в 11:41

Маньяк

А почему именно 2-х буквенные сочетания?

Bombo

Сообщение #25 9 апреля 2011 в 11:42

Маньяк

хм. не понял

DIgorevich

Сообщение #26 9 апреля 2011 в 11:46

Новичок

Bombo писал(а):

хм. не понял

Серега, у нас, как всегда пытается всё проарксинусить

... А твой алгоритм очень даже наглядно работает и, что главное, подтвержден результатами рекордов.

Bombo

Сообщение #27 9 апреля 2011 в 11:48

Маньяк

Arkaine писал(а):

А почему именно 2-х буквенные сочетания?

Просто я представлял как это реализовать.

Так же можно реализовать для другого критерия и (возможно) объединить результаты.

Переборыч

Сообщение #28 9 апреля 2011 в 11:58

Клавомеханик-Организатор событий

DIgorevich писал(а):

Серега, у нас, как всегда пытается всё проарксинусить

... А твой алгоритм...

В данном случае я пытаюсь разарксинусить ввиду очевидно излишнего нагромождения и назвать разрез сложности своим именем: "средняя частотность диграмм".

Bombo

Сообщение #29 9 апреля 2011 в 12:03

Маньяк

Слишком велика разница в значениях чтобы использовать среднее арифметическое

Переборыч писал(а):

"средняя частотность диграмм".

Переборыч

Сообщение #30 9 апреля 2011 в 12:10

Клавомеханик-Организатор событий

Действительно, я не учёл, что ты сделал обратнопропорциональную зависимость сложности от частотности.

Arkaine

Сообщение #31 9 апреля 2011 в 12:20

Маньяк

Ведь разные последовательности 2-х буквенных сочетаний тоже встречаются с разной частотностью.

Вот даже слова «азиатский» и «Азия» — «ази» здесь как бы два совершенно разных слова. Ведь в первом случае мы нажимаем клавишу с буквой «З» из основной позиции, а во втором мы прямо от shift'а «идём» на это клавишу. И само собой, во втором случае задействуется навык нажимания и отпускания shift'а.

Также, достаточно частотное (употребляемое и в бытовой и в литературной речи) слово «неуправляемый» при всей частотности последовательностей букв в нём, из-за этого «еуп» и следующим за ним «яемый» принуждает запястье двигаться в разных направлениях. Такое сочетание последовательностей букв, думается, не очень частое.

Зато вот набирая, например, «аэродинамический», ты набираешь как бы «аэро» и «динамический».

И как это всё учитывать?

Bombo

Сообщение #32 9 апреля 2011 в 12:28

Маньяк

вот список который я использую: ---------->

И я вообще не учитываю движений пальцев, рук и так далее.

Исходя из списка ты за жизнь набрал "ст" 6792140 раз за жизнь и где бы эти буквы не стояли, как бы сложно тебе небыло их нажимать.. Ты бы их нажал очень быстро, так как привык! А вот с "йв" дела бы обстояли гораздо сложнее)

неуправляемый 15.783
загнанный 8.65785
уполномоченный 10.9889
завязанный 9.70679
замурованный 8.29558
изолированный 9.07489
приставленный 8.31114
подкопанный 9.28293
называемый 9.08346
изгоняемый 11.399
зарубаемый 9.42736
проветриваемый 9.44912

вот прогнал подобные слова вместе со словом "неуправляемый"

Последний раз отредактировано 9 апреля 2011 в 12:36 пользователем Bombo

ACnuPAHT

Сообщение #33 9 апреля 2011 в 12:30

Маньяк

Сложность текста зависит от раскладки, постановки рук, от того, статический набор или динамический. А количественно сложность текста можно определить по любому из готовых алгоритмов оптимизации раскладки, немного переделав его (в первом случае варьируется раскладка, во втором - прогоняемый текст).
Давайте тексты, погоняю в Маткаде по своей модели (была описана в профиле у JohnnyCar). Скидывайте на t-p-l@inbox.ru

mystes

Сообщение #34 9 апреля 2011 в 12:34

Новичок

Верно, переходы между пакетами надо как-то учитывать.

ACnuPAHT писал(а):

Сложность текста зависит от раскладки, постановки рук, от того, статический набор или динамический.

И от конструкции клавиатуры.

Последний раз отредактировано 9 апреля 2011 в 12:37 пользователем mystes

ACnuPAHT

Сообщение #36 9 апреля 2011 в 13:52

Маньяк

Переходы учитываются "скользящим" суммированием сложности, например, диграмм или триграмм при сдвиге на 1 букву. Только потом надо отнормировать (поделить). Т.е. для слова "если" будут три диграммы "ес", "сл", "ли" или две триграммы "есл", "сли".

Димаст17, соображения, высказанные тобой, описаны на сайтах codesharp и модели carpalx. Соответственно, я их тоже учитывал при построении алгоритма оптимизации. Ни в каком оптимизаторе не видел, чтобы нижний ряд был проще, чем верхний. По-моему, как раз наоборот.
Лично для меня особое зло - буквы "ч" и "с" ("б", "ю" на правой попроще, но тоже сложно). Палец на большой скорости просто скользит ногтем по этим клавишам. Из-за этого частые ошибки.

Бомбо, статистики реальных языков имеют степенной характер (см., например, книгу М.Шредер "Фракталы, хаос, степенные законы"), поэтому при диапазоне несколько порядков лучше брать логарифм (в данном случае частотности). Но корень тоже ничего (и оценка будет более чувствительной) ;)

Последний раз отредактировано 9 апреля 2011 в 14:19 пользователем ACnuPAHT

Bombo

Сообщение #37 10 апреля 2011 в 11:44

Маньяк

ACnuPAHT - ничего себе!
*сижу читаю, вникаю

Bombo

Сообщение #38 10 апреля 2011 в 12:07

Маньяк

техническая сложность (моя) - 1/3;
степень отработанности сочетаний (твоя) - 2/3;
суммируем, и получаем достаточно обоснованную оценку сложности.
Т.е. мои коэффициенты можно умножить на 20-25 и сложить с твоими :)

А может просто домножать мое значение на твой коэффициент?

morozovlalex

Сообщение #39 10 апреля 2011 в 12:16

Гонщик

Dimast17 писал:

Изначально можно оттолкнуться от расстояния, которое "проходят" пальцы при наборе. За ноль считаем исходную позицию.

Интересная мысль, но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль ;) и как их при этом сравнивать, какое из них сложнее? Вероятно, то, что короче.
(я имею ввиду раскладку "фыва олдж")

Последний раз отредактировано 10 апреля 2011 в 12:31 пользователем morozovlalex

ACnuPAHT

Сообщение #40 11 апреля 2011 в 03:32

Маньяк

Bombo писал(а):

А может просто домножать мое значение на твой коэффициент?

Да можно и домножать, особой роли это не сыграет, но разброс значений увеличится. Попробуй, посмотри что получится.
Хотя... при умножении две величины входят равноправно, а твоему коэффициенту я бы хотел дать больший вес.

morozovlalex писал(а):

но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль

Для этого во всех "нормальных" моделях учитываются затраты как на перемещения, так и на нажатия, причем нажатиям отдается предпочтение (у них весовой коэффициент больше). Так что при адекватном учете в любом случае ноль не получается.

Последний раз отредактировано 11 апреля 2011 в 03:37 пользователем ACnuPAHT

Dimast17

Сообщение #41 11 апреля 2011 в 09:03

Маньяк

morozovlalex писал(а):

Dimast17 писал:

По ощущениям я бы сказал, что нажатия указательными и средними пальцами можно брать за 0, а вот безымянные и мизинцы, скажем, 0.3 и 0.5, соответственно.

mystes

Сообщение #42 11 апреля 2011 в 09:20

Новичок

У меня безымянный хуже мизинца в среднем ряде. Чередования пальцев одной руки тоже не все одинаково полезны.

Cheatah

Сообщение #43 11 апреля 2011 в 11:53

Маньяк

Боюсь оказаться Капитаном Очевидность, но мне представляется, что сложность состоит из двух больших факторов: позиционный и частотный. Для новичков наиболее выражен позиционнный фактор, а частотный вообще не имеет существенного значения; для опытных наборщиков частотный фактор гораздо более важен, а позиционный потихоньку утрачивает свою роль. Поэтому сделать одинаково ровный словарь и для новичков, и для опытных не вполне получится; с другой стороны, если опираться на частотность, можно сделать словарь, который позволит стать "почти опытным наборщиком" за более короткое время, потому что будет тренировать в существенной степени именно частотные, а не редкие сочетания.

Чтобы писать в форуме, нужно зарегистрироваться.

← Ctrl предыдущая следующая Ctrl→ Страницы

1 2 3

Форум «Академия» / Как сравнить два слова по сложности?

Чтобы писать в форуме, нужно зарегистрироваться.

Автор:

Обратный адрес:

Тема:

Сообщение: