[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .
Ctrl предыдущая следующая Ctrl Страницы
1 2 3

Форум «Академия» / Как сравнить два слова по сложности?

Переборыч Сообщение #23 9 апреля 2011 в 11:32
Клавомеханик-Организатор событий
55
Bombo писал(а):
Тему глянул, но там только рассуждения. Никакой реализации.

В первом сообщении Владимир предложил частотность, как критерий сложности:
archi77 писал(а):
Сложность текста можно замерять по таким параметрам:
2. количество 2-х буквенных сочетаний, и их частотность.

Твоё первое сообщение вторит. Кроме среднего арифметического частот диграмм, дополнительные мат. операции с цифрами с потолка будут избыточны.
Последний раз отредактировано 9 апреля 2011 в 11:33 модератором Переборыч
Arkaine Сообщение #24 9 апреля 2011 в 11:41
Маньяк
1
А почему именно 2-х буквенные сочетания?
Bombo Сообщение #25 9 апреля 2011 в 11:42
Маньяк
33
хм. не понял
DIgorevich Сообщение #26 9 апреля 2011 в 11:46
Новичок
62
Bombo писал(а):
хм. не понял

Серега, у нас, как всегда пытается всё проарксинусить ... А твой алгоритм очень даже наглядно работает и, что главное, подтвержден результатами рекордов.
Bombo Сообщение #27 9 апреля 2011 в 11:48
Маньяк
33
Arkaine писал(а):
А почему именно 2-х буквенные сочетания?

Просто я представлял как это реализовать.

Так же можно реализовать для другого критерия и (возможно) объединить результаты.
Переборыч Сообщение #28 9 апреля 2011 в 11:58
Клавомеханик-Организатор событий
55
DIgorevich писал(а):
Серега, у нас, как всегда пытается всё проарксинусить ... А твой алгоритм...

В данном случае я пытаюсь разарксинусить ввиду очевидно излишнего нагромождения и назвать разрез сложности своим именем: "средняя частотность диграмм".
Bombo Сообщение #29 9 апреля 2011 в 12:03
Маньяк
33
Слишком велика разница в значениях чтобы использовать среднее арифметическое
Переборыч писал(а):
"средняя частотность диграмм".

Переборыч Сообщение #30 9 апреля 2011 в 12:10
Клавомеханик-Организатор событий
55
Действительно, я не учёл, что ты сделал обратнопропорциональную зависимость сложности от частотности.
Arkaine Сообщение #31 9 апреля 2011 в 12:20
Маньяк
1
Ведь разные последовательности 2-х буквенных сочетаний тоже встречаются с разной частотностью.

Вот даже слова «азиатский» и «Азия» — «ази» здесь как бы два совершенно разных слова. Ведь в первом случае мы нажимаем клавишу с буквой «З» из основной позиции, а во втором мы прямо от shift'а «идём» на это клавишу. И само собой, во втором случае задействуется навык нажимания и отпускания shift'а.

Также, достаточно частотное (употребляемое и в бытовой и в литературной речи) слово «неуправляемый» при всей частотности последовательностей букв в нём, из-за этого «еуп» и следующим за ним «яемый» принуждает запястье двигаться в разных направлениях. Такое сочетание последовательностей букв, думается, не очень частое.

Зато вот набирая, например, «аэродинамический», ты набираешь как бы «аэро» и «динамический».

И как это всё учитывать?
Bombo Сообщение #32 9 апреля 2011 в 12:28
Маньяк
33
вот список который я использую: ---------->

И я вообще не учитываю движений пальцев, рук и так далее.

Исходя из списка ты за жизнь набрал "ст" 6792140 раз за жизнь и где бы эти буквы не стояли, как бы сложно тебе небыло их нажимать.. Ты бы их нажал очень быстро, так как привык! А вот с "йв" дела бы обстояли гораздо сложнее)

неуправляемый 15.783
загнанный 8.65785
уполномоченный 10.9889
завязанный 9.70679
замурованный 8.29558
изолированный 9.07489
приставленный 8.31114
подкопанный 9.28293
называемый 9.08346
изгоняемый 11.399
зарубаемый 9.42736
проветриваемый 9.44912

вот прогнал подобные слова вместе со словом "неуправляемый"
Последний раз отредактировано 9 апреля 2011 в 12:36 пользователем Bombo
ACnuPAHT Сообщение #33 9 апреля 2011 в 12:30
Маньяк
15
Сложность текста зависит от раскладки, постановки рук, от того, статический набор или динамический. А количественно сложность текста можно определить по любому из готовых алгоритмов оптимизации раскладки, немного переделав его (в первом случае варьируется раскладка, во втором - прогоняемый текст).
Давайте тексты, погоняю в Маткаде по своей модели (была описана в профиле у JohnnyCar). Скидывайте на t-p-l@inbox.ru
mystes Сообщение #34 9 апреля 2011 в 12:34
Новичок
1
Верно, переходы между пакетами надо как-то учитывать.

ACnuPAHT писал(а):
Сложность текста зависит от раскладки, постановки рук, от того, статический набор или динамический.

И от конструкции клавиатуры.
Последний раз отредактировано 9 апреля 2011 в 12:37 пользователем mystes
ACnuPAHT Сообщение #36 9 апреля 2011 в 13:52
Маньяк
15
Переходы учитываются "скользящим" суммированием сложности, например, диграмм или триграмм при сдвиге на 1 букву. Только потом надо отнормировать (поделить). Т.е. для слова "если" будут три диграммы "ес", "сл", "ли" или две триграммы "есл", "сли".

Димаст17, соображения, высказанные тобой, описаны на сайтах codesharp и модели carpalx. Соответственно, я их тоже учитывал при построении алгоритма оптимизации. Ни в каком оптимизаторе не видел, чтобы нижний ряд был проще, чем верхний. По-моему, как раз наоборот.
Лично для меня особое зло - буквы "ч" и "с" ("б", "ю" на правой попроще, но тоже сложно). Палец на большой скорости просто скользит ногтем по этим клавишам. Из-за этого частые ошибки.

Бомбо, статистики реальных языков имеют степенной характер (см., например, книгу М.Шредер "Фракталы, хаос, степенные законы"), поэтому при диапазоне несколько порядков лучше брать логарифм (в данном случае частотности). Но корень тоже ничего (и оценка будет более чувствительной) ;)
Последний раз отредактировано 9 апреля 2011 в 14:19 пользователем ACnuPAHT
Bombo Сообщение #37 10 апреля 2011 в 11:44
Маньяк
33
ACnuPAHT - ничего себе!
*сижу читаю, вникаю
Bombo Сообщение #38 10 апреля 2011 в 12:07
Маньяк
33
техническая сложность (моя) - 1/3;
степень отработанности сочетаний (твоя) - 2/3;
суммируем, и получаем достаточно обоснованную оценку сложности.
Т.е. мои коэффициенты можно умножить на 20-25 и сложить с твоими :)


А может просто домножать мое значение на твой коэффициент?
morozovlalex Сообщение #39 10 апреля 2011 в 12:16
Гонщик
29
Dimast17 писал:
Изначально можно оттолкнуться от расстояния, которое "проходят" пальцы при наборе. За ноль считаем исходную позицию.

Интересная мысль, но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль ;) и как их при этом сравнивать, какое из них сложнее? Вероятно, то, что короче.
(я имею ввиду раскладку "фыва олдж")
Последний раз отредактировано 10 апреля 2011 в 12:31 пользователем morozovlalex
ACnuPAHT Сообщение #40 11 апреля 2011 в 03:32
Маньяк
15
Bombo писал(а):
А может просто домножать мое значение на твой коэффициент?

Да можно и домножать, особой роли это не сыграет, но разброс значений увеличится. Попробуй, посмотри что получится.
Хотя... при умножении две величины входят равноправно, а твоему коэффициенту я бы хотел дать больший вес.
morozovlalex писал(а):
но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль
Для этого во всех "нормальных" моделях учитываются затраты как на перемещения, так и на нажатия, причем нажатиям отдается предпочтение (у них весовой коэффициент больше). Так что при адекватном учете в любом случае ноль не получается.
Последний раз отредактировано 11 апреля 2011 в 03:37 пользователем ACnuPAHT
Dimast17 Сообщение #41 11 апреля 2011 в 09:03
Маньяк
47
morozovlalex писал(а):
Dimast17 писал:
Изначально можно оттолкнуться от расстояния, которое "проходят" пальцы при наборе. За ноль считаем исходную позицию.

Интересная мысль, но тогда целые слова "вдова", "вода", "фалда", "вожжа", "лажа" и т.д. и т.п. можно посчитать за ноль ;) и как их при этом сравнивать, какое из них сложнее? Вероятно, то, что короче.
(я имею ввиду раскладку "фыва олдж")

По ощущениям я бы сказал, что нажатия указательными и средними пальцами можно брать за 0, а вот безымянные и мизинцы, скажем, 0.3 и 0.5, соответственно.
mystes Сообщение #42 11 апреля 2011 в 09:20
Новичок
1
У меня безымянный хуже мизинца в среднем ряде. Чередования пальцев одной руки тоже не все одинаково полезны.
Cheatah Сообщение #43 11 апреля 2011 в 11:53
Маньяк
16
Боюсь оказаться Капитаном Очевидность, но мне представляется, что сложность состоит из двух больших факторов: позиционный и частотный. Для новичков наиболее выражен позиционнный фактор, а частотный вообще не имеет существенного значения; для опытных наборщиков частотный фактор гораздо более важен, а позиционный потихоньку утрачивает свою роль. Поэтому сделать одинаково ровный словарь и для новичков, и для опытных не вполне получится; с другой стороны, если опираться на частотность, можно сделать словарь, который позволит стать "почти опытным наборщиком" за более короткое время, потому что будет тренировать в существенной степени именно частотные, а не редкие сочетания.

Чтобы писать в форуме, нужно зарегистрироваться.

Ctrl предыдущая следующая Ctrl Страницы
1 2 3

Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена