[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .
Ctrl предыдущая следующая Ctrl Страницы
1 2 3

Форум «Академия» / Как сравнить два слова по сложности?

mystes Сообщение #44 11 апреля 2011 в 15:38
Новичок
1
Не осилил позиционный фактор. :( Что это?
Cheatah Сообщение #45 11 апреля 2011 в 15:49
Маньяк
16
mystes писал(а):
Не осилил позиционный фактор. :( Что это?

Я имею в виду сложности, связанные с расположением клавиш - например, когда требуются мизинцы; несколько клавиш подряд нажимаются одним и тем же пальцем; всякие сочетания типа -люб- и т. п.

Взять к примеру слово "которого" - для новичка оно сложное (я так думаю), а для опытного наборщика оно будет гораздо проще какого-нибудь "позиционно простого" набора букв типа "влававо".
Bombo Сообщение #46 11 апреля 2011 в 16:33
Маньяк
33
которого 3.55526
влавав 4.43484

моя прога тоже считает что влавав сложнее чем которого =)

А вообще я считаю что со временем каким бы расстояние небыло, верх берет частота встреч со словом. грубо говоря на дистанции "техническая сложность" отходит на второй план. =)
mystes Сообщение #47 11 апреля 2011 в 16:41
Новичок
1
Cheatah писал(а):
mystes писал(а):
Не осилил позиционный фактор. :( Что это?

Я имею в виду сложности, связанные с расположением клавиш - например, когда требуются мизинцы; несколько клавиш подряд нажимаются одним и тем же пальцем; всякие сочетания типа -люб- и т. п.

А тут не два фактора (ориентирование в раскладке и техника рук)?
Cheatah Сообщение #48 11 апреля 2011 в 16:48
Маньяк
16
mystes писал(а):
А тут не два фактора (ориентирование в раскладке и техника рук)?

Не очень понял. По-моему любой "фактор" можно сколь угодно подробно раздробить на составляющие "подфакторы" при желании. Я просто общую закономерность, которая мне показалась очевидной, набросал - а в реальности факторов конечно побольше будет. Хотя бы те же простота восприятия слова (ср. чувственный, соответствие), грамотность и словарный запас наборщика и пр.
mystes Сообщение #49 11 апреля 2011 в 16:53
Новичок
1
Ну ладно. :)
Переборыч Сообщение #50 11 апреля 2011 в 16:54
Клавомеханик-Организатор событий
55
На вопрос: что появляется первее - курица или яйцо моторика или частотнозависимость можно ответить, сопоставив таймауты с частотностью и таймауты с позиционированием (по данным TS).
Cheatah Сообщение #51 11 апреля 2011 в 16:55
Маньяк
16
Переборыч, а что за таймауты? Это которые 30 секунд, 20 секунд, 10 секунд, или 5 секунд в одиночном?
скрытый текст…
Последний раз отредактировано 11 апреля 2011 в 16:57 пользователем Cheatah
ACnuPAHT Сообщение #52 12 апреля 2011 в 11:42
Маньяк
15
Мое письмо к Bombo (от 10 апреля):
"...задачи оптимизации раскладки и определения сложности текста принципиально отличаются.
При оптимизации раскладки мы оперируем со среднестатическими данными языка и меняем раскладку, чтобы максимально согласовать ее с этими данными.
При подсчете сложности играет роль тот факт, что текст может быть далек от среднестатистического.
Во-первых, из этого следует, что он может быть как легче, так и сложнее среднестатистического.
Во-вторых, эта сложность должна выражаться:
а) технической сложностью набора, поскольку она всегда присутствует;
б) степенью отличия от среднестатистического текста (которая может быть посчитана на основе частотности диграмм - ты здесь правильно сделал);
в) на коротких текстах (допустим, до 500 символов) отличие от среднестатистического случая может быть очень значительным, поэтому весовые коэффициенты для сложностей, посчитанных по а) и б) предлагаю брать так:
техническая сложность (моя) - 1/3;
степень отработанности сочетаний (твоя) - 2/3;
суммируем, и получаем достаточно обоснованную оценку сложности.
...
P.S. А в задаче оптимизации раскладки фактор б) выпадает (всегда подразумевается среднестатистический текст для этого языка), поэтому играет роль только техническая сложность."

Еще я ему скинут листинг своей программы в MathCAD (по оценке чисто технической сложности, идущей от оптимизатора раскладки). Если захочет - использует :) но пока что-то не вижу...

Каждому понятно, что на коротких текстах полнота статистической выборки будет маленькой (просто очень мало диграмм вообще встретятся и еще меньше шанс, что в среднестатистической пропорции), поэтому отличие от среднестатистической структуры чаще всего будет большим. Значит, основную роль играет отработанность, и ее коэффициент должен быть больше при взвешивании 2 сложностей (допустим, 2/3 или 3/4 для отработанности - тогда как для технической сложности 1/3 или 1/4 - чтобы сумма была 1).

А вообще для практических целей при оценке сложности текстов (не очень длинных) можно ограничиться только отработанностью (или частотностью) диграмм по Bombo. На этом, наверное, можно и закрыть тему.
Bombo Сообщение #53 12 апреля 2011 в 19:49
Маньяк
33
+1

Чтобы писать в форуме, нужно зарегистрироваться.

Ctrl предыдущая следующая Ctrl Страницы
1 2 3

Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена