Клавомеханик-Организатор событий
55 |
Решил проанализировать данный момент… Словарь в полной мере покрывает 69% существующих комбинаций. Наверно на то это и топ 100, чтобы упускать малоиспользуемые, хотя можно было бы перераспределить некоторые сочетания и построить словарь по данным критериям в точности с корпусом. Кстати, для этой цели можно было бы одно слово в разных словоформах накрутить, но лучше, наверно, всё же уникальные слова. Короче, вот статистика: скрытый текст… Впередиидущая буква – "ыва" (@) – следующая буква – общая частотность – частотность по словарю: з@е 8,3% & 3,0% з@_ 6,6% & 11,0% з@т 4,1% & 3,0% т@_ 4,0% & 4,0% з@ю 3,9% & 1,0% д@_ 3,8% & 7,0% р@л 3,7% & 3,0% р@_ 3,2% & 5,0% б@е 2,9% & 2,0% р@е 2,7% & 3,0% б@л 2,6% & 2,0% т@т 2,3% & 3,0% р@т 2,2% & 12,0% д@т 2,1% & 1,0% б@_ 2,0% & 2,0% т@е 1,9% & 1,0% с@_ 1,5% & 6,0% б@т 1,3% & 5,0% б@ю 1,2% & 1,0% м@_ 1,2% & 3,0% в@л 1,2% & 1,0% р@ 1,0% & 5,0% с@т 0,9% & 1,0% м@л 0,8% & 2,0% в@_ 0,7% & 1,0% п@_ 0,6% & 1,0% м@т 0,6% & 1,0% р@я 0,5% & 1,0% л@е 0,3% & 2,0% л@т 0,3% & 1,0% п@т 0,2% & 1,0% н@_ 0,2% & 2,0% з@ 0,2% & 2,0% в@н 0,1% & 1,0%
Отсутствующие в словаре маски: з@л 6,7% д@л 2,9% т@л 2,3% д@е 1,7% р@ю 1,6% т@ю 1,3% с@е 1,1% с@л 1,0% д@ю 0,9% д@я 0,8% б@н 0,8% с@ю 0,6% в@т 0,6% л@л 0,6% р@в 0,5% в@е 0,4% м@е 0,4% з@н 0,3% л@_ 0,3% з@й 0,3% в@ю 0,3% з@в 0,3% л@ю 0,3% т@я 0,3% п@л 0,3% б@й 0,2% м@я 0,2% т@н 0,2% п@ю 0,2% н@т 0,2% м@ю 0,2% д@й 0,2% р@м 0,2% п@е 0,2% п@н 0,1% Итого: 28,5% и чуть более
|