[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .

Форум «Академия» / Критерии сложности текста

archi77 Сообщение #1 24 марта 2010 в 21:58
Профи
12
Поднял забытую тему на урикоре: http://urikor.net/phpBB2/viewtopic.php?p=71156#71156
Продублирую тут:
Однажды задавшись этим вопросом, я постепенно выработал критерии.

Сложность текста можно замерять по таким параметрам:
1. количество букв алфавита в тексте, их насыщеность и частотность.
2. количество 2-х буквенных сочетаний, и их частотность.
3. Количество заглавных букв.
4. Количество и длина сочетаний, набираемых одним пальцем (зависит от раскладки).
5. Количество знаков препинания.
6. Средняя длина слов.

Добавляйте, обсуждайте. Могу привести примеры.
zenz Сообщение #2 24 марта 2010 в 22:10
Экстракибер
42
раскладка у всех может быть разная и т.п. поэтому 4ый пункт нельзя приводить критерием оценки сложности текста.
пример - словарь тренируем указательные. по этому пункту сложен, но для меня и некоторых других клавогонщиков - простой. этот пункт для личных, частых мнения и оценки. но не объективен для словаря в целом.

остальные пункты всецело за :)
Последний раз отредактировано 24 марта 2010 в 22:13 пользователем zenz
olimo Сообщение #3 24 марта 2010 в 22:17
Супермен
51
А зачем вообще нужны эти критерии сложности?
gosknyaz Сообщение #4 24 марта 2010 в 22:31
Гонщик
33
Видимо, в связи с введением такого параметра, как сложность словаря. Нужно же установить объективные условия установки того или иного его значения.
archi77 Сообщение #5 24 марта 2010 в 22:32
Профи
12
От сложности текста зависит потолок возможной скорости для каждого.
Например, на простом тексте из слов, состоящих только из двухбуквенных сочетаний первой частотной сотни, скорость будет выше чем на тексте "съешь ещё этих французских булок, да выпей же чаю" в котором почти все буквы алфавита.

(добавлено):
gosknyaz писал(а):
Видимо, в связи с введением такого параметра, как сложность словаря. Нужно же установить объективные условия установки того или иного его значения.

кстати да, я даже не думал что сразу найдется применение :)

(добавлено):
zenz писал(а):
раскладка у всех может быть разная и т.п. поэтому 4ый пункт нельзя приводить критерием оценки сложности текста.

Да, для этого в скобках "(зависит от раскладки)".
Последний раз отредактировано 25 марта 2010 в 15:43 модератором Fenex
Русинов Сообщение #8 24 марта 2010 в 22:44
Маньяк
24
1,2,3 и пятый с некоторыми оговорками да. Почему 4 нельзя включать Зенз уже объяснил. 6 – это зависит от слова, некоторые слова набираются, несмотря на свою длину, набираются очень просто, тогда как некоторые короткие могут вызвать проблемы.
Наиболее важный пункт для меня это он заключается в том, насколько легко я могу читать предвосхищать текст. Если текст по каким-то субъективным читается сложно или с большим количеством «отсебятины» такой текст даже при всей простоте всех прошедших пунктов я не смогу назвать простым (для себя). И как показала практика, даже если такой текст приходится набирать несколько раз подряд (спринт, или чемпионаты Юрикора) для меня такие тексты продолжают оставаться сложными.

P.S. Мне кажется, сложно формализовать сложность текста.
Какое-то время назад читал такую тему: http://mkweb.bcgsc.ca/carpalx/?typing_effort
gosknyaz Сообщение #9 24 марта 2010 в 22:55
Гонщик
33
Русинов писал(а):

Перевод необходим.
olimo Сообщение #10 24 марта 2010 в 23:05
Супермен
51
Не, я именно что в формализации сложности не вижу смысла. Сложность словаря оценить не проблема, если он на русском языке. Берешь да сравниваешь рекорды нескольких человек с их же рекордами в обычном... можно свои рекорды. "Марафонистые" словари будут сложнее обычного, т.е. 400-450. Короткие тексты - проще, скорее 550-600, а то и 650.

С иностранными словарями сложнее, т.к. капча проходится на русском языке, а в принципе возможно, что кто-то на иностранном языке набирает лучше, чем на русском.
Русинов Сообщение #11 24 марта 2010 в 23:42
Маньяк
24
gosknyaz писал(а):
Русинов писал(а):

Перевод необходим.

http://translate.google.com/translate?u=ht...l=&ie=UTF-8
Так вроде вполне понятно
Машинный перевод – ужасен, но с другой стороны он даёт доступ к десяткам языков. И чем больше практикуешься извлекать из таких текстов нужную тебе информацию, тем меньше смущаёт его ошибки и неправильно переведённые слова, из контекста становится понятно многое.
Название статьи Typing Effort Model - Модель сложности печати
В статье рассматриваются методы определения сложности печати, как прикладная задача для разработки раскладки более удобной раскладки.
Переборыч Сообщение #12 25 марта 2010 в 00:26
Клавомеханик
55
archi77 писал(а):
Добавляйте, обсуждайте. Могу привести примеры.

Поскольку речь в первую очередь идёт о расчётной (теоритической) сложности, то:
  • 7. Соотношение левой руки к правой.
  • 8. Соотношение гласных к согласным.
  • 9. Соотношение орфографических слов и обычных.
  • 10. Расстояние полёта пальцев (ранее обсуждаемый спорный момент).
  • 11. Соотношение движений от центра к краю / наоборот.
  • 12. Плотность перекрытий внутри слова (одна буква более одного раза).
С удовольствием бы обсудил анализ по критериям сложности в общем зачёте по расчётной балловой системе. Есть примеры совпадения теории с практикой?
gard Сообщение #13 25 марта 2010 в 03:58
Профи
9
Мне кажется, сама точка зрения выбрана не вполне корректно.

Если уж вы допустили множество технологий (в 4 пункте), то уместней было бы говорить не о сложности текста, а сложности технологии набора данного текста, и уровне владения этой технологией. Тем более, что самый "сложный" текст может быть простым для Профи, а самый "простой" — сложным для Новичка...

Кстати, сравнение методов печати — дело весьма сложное (и часто неблагодарное :)). Оно требует приблизительно одинакового уровня владения ими и технологически-нейтральной позиции, иначе любая оценка будет выглядеть пристрастной.
Последний раз отредактировано 25 марта 2010 в 04:27 пользователем gard
zenz Сообщение #14 25 марта 2010 в 06:25
Экстракибер
42
Переборыч писал(а):
  • 7. Соотношение левой руки к правой.
  • 8. Соотношение гласных к согласным.
  • 9. Соотношение орфографических слов и обычных.
  • 10. Расстояние полёта пальцев (ранее обсуждаемый спорный момент).
  • 11. Соотношение движений от центра к краю / наоборот.
  • 12. Плотность перекрытий внутри слова (одна буква более одного раза).

8 в топку вместе с 10ым.
7 - вроде да, под специфические словари. можно сказать так, если это соотношение находится в рамке от 10% до 90% то этот пункт исключать.
(0-10% - это только правая получается, 90-100% - только левая)
9 - да! это как-то упустили, хотя можно подумать, что в пункте 1 и 2... тут подумать еще надо... потому что при высоком уровне пункта 2 и 9 - получаем абракадабру. при низком уровне пункта 2, средним уровнем пункта 6 и высоким 9 ым - получаем буквы :)
11 - не понимаю зачем... это уже какое-то "мне тяжело набирать "жо" а "ож" легко, потому что я только учусь печатать, но хочу списать это все на сложность словаря"... :
12 - может проще? частота повторений_подряд буквы:)

систему... надо утвердить список пунктов, сделать баллы в зависимости от процентов (каждому пункту разный предел)
ыыыыы, я кажется придумал как! :)
делается уравнение (привет переборычу, любишь это дело)
A1*x1+...+A10*x10=сложность
А1 - коэффициент баллов.
х1 - сколько баллов за режим начислять, каждый "икс" отдельно рассчитывать.

при этом по уже существующим режимам можно подобрать адекватную оценку :) для начала правда надо пункты утвердить :)
gard писал(а):
Тем более, что самый "сложный" текст может быть простым для Профи, а самый "простой" — сложным для Новичка...
Боюсь всем не угодить. А оценка идет для
предела более менее адекватного текста. Тексты типо "ооооооооооооооооооооооооооооооооооооооо" оценивать никто не собирается, тут и так все ясно. хотя систему можно и под это подобрать. система набора тут не при чем, я уже говорил, что 4 пункт - это персональная оценка. личная. для меня просто или же для меня сложно. а "сложность текста" я понимаю как средний предел на этом тексте, выраженный в баллах.
Последний раз отредактировано 25 марта 2010 в 06:28 пользователем zenz
gard Сообщение #15 25 марта 2010 в 15:38
Профи
9
скрытый текст…


(под спойлером "разоблачение" zenz'а и olimo) [M]
PS: можете обращайться в личку за подробностями или отписать тут.
Последний раз отредактировано 25 марта 2010 в 16:05 модератором Переборыч
GOTTERDAMMERUNG Сообщение #17 20 декабря 2015 в 20:39
Супермен
1
Последний раз отредактировано 21 декабря 2015 в 20:36 пользователем GOTTERDAMMERUNG
infrareda Сообщение #18 28 января 2016 в 11:21
Новичок
1
а что тогда говорить о языках програмирования и об их читабельности
Mask2017 Сообщение #22 12 мая 2020 в 08:52
Гонщик
18
Не понимаю, как оценивают степень сложности текстов. У меня все время легкие тесты это куча ошибок и скорость низкая. Как попадает текст выше 4, скорость выше и ошибок меньше... Вчера попал легкий, якобы, текст. Сложность 2. А в нем оказалась куча знаков. Скобки, кавычки, пара тире. За скобки надо сразу балл накидывать. Появится когда-нибудь объективная оценка сложности? Или мы ее не дождемся?:)
Doctorisimus Сообщение #23 12 мая 2020 в 13:17
Супермен
59
Mask2017 писал(а):
Не понимаю, как оценивают степень сложности текстов. У меня все время легкие тесты это куча ошибок и скорость низкая. Как попадает текст выше 4, скорость выше и ошибок меньше... Вчера попал легкий, якобы, текст. Сложность 2. А в нем оказалась куча знаков. Скобки, кавычки, пара тире. За скобки надо сразу балл накидывать. Появится когда-нибудь объективная оценка сложности? Или мы ее не дождемся?:)
Так ты просто на легком торопишься отсюда и ошибки. А на более сложном где пальцы не могут набрать так же быстро последовательность определенных букв скорость твоя падает, но ошибок за этот счет ты не допускаешь и в чистом итоге выигрываешь. На легких нужно максимально концентрироваться на наборе, потому что там ты можешь выйти за рамки своей комфортной скорости набора и отсюда непривычность к такой скорости и отсюда "срыв" на ошибку.
Ну а сложные словами и тексты с длинными словами многие любят набирать. У меня они часто самые безошибочные.
pashkhan Сообщение #24 12 мая 2020 в 14:53
Супермен
78
http://klavogonki.ru/forum/wishes/15358/page3/#post45

У нас есть код, текущего определителя сложности. Да, он не идеален, и в нем не все аспекты учтены (и требуются правки и дополнения) - но он есть, и он работает! Для подавляющего большинства случаев, прогноз достаточно точно отражает картину. Я считаю, для прогресса в навыке набора, поиск рекорднопригодных текстов просто необходим - и данный скрипт очень помогает в этом вопросе (+ просто дает больше удовольствия от игры, т.к. видеть сложность заранее - это приятно). Может кто-то проанализировать код и написать простым языком, на какие принципы опирается данный скрипт (что учтено, и какие коэффициенты этому даны)? Тогда мы, обычные клавогонщики, сможем понять - что еще необходимо включить в список правил, и какие коэффициенты следует подкорректировать. Главное, у нас есть фундамент, и заложены основы - чтобы сделать определятор универсальным (не зависящим от раскладки пользователя). В идеале, если мы все сделаем правильно - то не будет проблемы адаптировать его и для английского языка, что тоже крайне важно!

• кол-во знаков в тексте - чем текст длиннее, тем он сложнее.
• кол-во предложений (точек) - чем больше - тем хуже. (в идеале, только одна точка в конце; каждая точка подразумевает под собой Заглавную букву + новая мысль (предложение) которая может вас сбить)
• кол-во слов с заглавной буквы - коррелирует с кол-вом предложений. Если слово "внутри" предложения с заглавной буквы - то значит это имя, название и т.д. Это особенно плохо! И за Заглавные "внутри" предложения должен идти солидный штраф (повышение сложности этого текста). Особенно плохо, если идут несколько слов с заглавной буквы подряд - это значит предстоит длинная череда выдуманных имен и названий, отчеств и т.п.
• кол-во тире и дефисов (слова с дефисом, плохо)!
• кол-во слов - много мелких плохо (частотка не всегда - к скорости)
Улей сокращенно звали Великую Удаль, а Путей – Забаву. Лена долго не могла понять, почему вдруг Забава стала Путей, пока кто-то ей не объяснил, что Шиня, ухаживавшая за ней в Лучевом, завидовала двойной кличке Великой Удали и потому стала звать Забаву – Забавой Путятишной, как героиню мультика. (4.74)
заглавные буквы недооценены, они очень сильно снижают скорость. ухудшается как восприятие текста, так и проблемы с шифтом (медленно и очень вероятна ошибка)
• цифры в тексте - это не к добру, если цифры идут подряд (год, телефонный номер) - то это совсем мусорный текст. Скобки и кавычки - тоже, практически гарантированно, делают текст нерекордопригодным.
• все рассматривать как отклонение от "золотого стандарта" - когда чего-то чрезмерно много, это минус (много заглавных, много знаков препинания, много коротких слов, много длинных слов и т.д.)

Уверен, вместе мы сможем выработать окончательный свод правил которые должен учитывать анализатор, чтобы выдавать максимально точную оценку! И коэффициенты подберем, математиков у нас хватает, а скрипт нам Докториссимус напишет - если мы очень его попросим
Doctorisimus Сообщение #25 12 мая 2020 в 15:40
Супермен
59
а скрипт нам Докториссимус напишет
Последний раз отредактировано 12 мая 2020 в 15:41 пользователем Doctorisimus
Mask2017 Сообщение #26 13 мая 2020 в 13:34
Гонщик
18
Я специально не смотрел сложность перед набором. И выяснил, что на рекордных и легких, как они якобы оценены, ошибок гораздо больше и скорость на них часто очень средняя, а не рекордная. Больше половины этих тестов явно недооценены. В них попадаются сложные слова и неудобные сочетания знаков, замедляющие скорость набора. И наоборот, часто попадают тексты от 4 и выше, где хорошо разгоняешься, не запинаясь.

Чтобы писать в форуме, нужно зарегистрироваться.


Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена