[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .

Форум «Академия» / Разработка Мегачастотного словаря

Smuglik Сообщение #1 27 апреля 2011 в 23:05
Маньяк
26
Очень хочется присутствие такого вот словаря. Можно называть его Мегачастотный. Думаю, что он будет пользоваться большой популярностью. Я, во всяком случае, с удовольствием катал бы его. Вручную его набрать нереально, я сам не справлюсь, но уверен, что мегапрошаренные ребята смогут за вечер его сделать )))

Вот, что можно засунуть в него:

1. Список наиболее популярных слов и их разновидностей:
а) Существительных (все падежи) 50 слов
б) Прилагательных (все падежи, роды и т.д. + уменьшительно-ласкательные) 50 слов
в) Глаголов (все времена + лица) 50 слов
г) Причастий (времена, роды ) 50 слов
д) Деепричастий (чего-там-у-них-есть) 50 слов
е) Наречий 50 слов

2. Союзы, частицы и предлоги (можно все, что есть, их немного)


Думаю, что преимущества данного словаря очевидны. Мы получим возможность катать окончания, приставки и суффиксы на самых знакомых корнях слов. Причем охватится почти все засилье русского языка. Есть ли желающие сделать совместный проект? Я могу помочь разве что в плане грамматики )))
Последний раз отредактировано 27 апреля 2011 в 23:14 пользователем Smuglik
Uncle_Sam Сообщение #2 27 апреля 2011 в 23:14
Кибергонщик
43
охватится почти все засилье русского языка


А не проще ли кататься в режиме обычный? Все вышеперечисленные преимущества есть там :)
Smuglik Сообщение #3 27 апреля 2011 в 23:30
Маньяк
26
Да нет. В том и суть, что катаются привычные словоформы с довесками. В результате довески хорошо отрабатываются )))
Fenex Сообщение #4 28 апреля 2011 в 00:29
Клавомеханик
49
Причастия в частотке? О_o
Мда, веселый будет словарик...
Smuglik Сообщение #5 28 апреля 2011 в 00:51
Маньяк
26
А чего - 50 частых причастий:

делавший, говоривший, просивший, молчавший и их модификации ))) Это будет весело...
morozovlalex Сообщение #6 28 апреля 2011 в 09:45
Гонщик
29
Ребят, по-моему, все давно уже изобретено. В Стамине есть целый комплекс упражнений, так и называемых "Части речи". В них входят приставки, суффиксы, окончания, позволяющие отрабатывать набор "кирпичиков", из которых слагаются слова. Из Стамины можно создать словарь и на клавогонках. Я попытался это сделать, но объем большой, не очень удобно набирать.
mystes Сообщение #7 28 апреля 2011 в 14:25
Новичок
1
У меня давно есть задумка сдобрить словарь лемм окончаниями форм, равномерно распределив их по по леммам одной парадигмы. Но пока руки не дошли...
Smuglik Сообщение #8 28 апреля 2011 в 18:34
Маньяк
26
morozovlalex, а можно эти упражнения выложить куда-нибудь, чтобы знающим людям доступ был?
MathKidd Сообщение #9 28 апреля 2011 в 19:44
Маньяк
1
скажи где достать эти частотные "вещи" и будет тебе словарик
я его обработаю и обдумаю
Smuglik Сообщение #10 28 апреля 2011 в 20:43
Маньяк
26
Кстати, да... Можно в студию список самых популярных слов по частям речи?
mystes Сообщение #11 28 апреля 2011 в 21:08
Новичок
1
http://dict.ruslang.ru
Берём оттуда частотный список лемм (там 20000, за глаза).
А дальше всё просто (первые пятьсот по частям речи и убыванию частоты):
head 500 lemma.txt | sort -k3,3 -k4,4nr
Последний раз отредактировано 28 апреля 2011 в 21:09 пользователем mystes

Чтобы писать в форуме, нужно зарегистрироваться.


Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена