[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .
Программирование python
(0)       Используют 55 человек

Комментарии

Ни одного комментария.
Написать тут
Описание:
куски кода на python, пришлось повыпиливать спецсимволы
Автор:
splogin
Создан:
7 декабря 2012 в 20:35 (текущая версия от 7 декабря 2012 в 20:41)
Публичный:
Да
Тип словаря:
Тексты
Цельные тексты, разделяемые пустой строкой (единственный текст на словарь также допускается).
Содержание:
1 # all methods for text processing class TextProcessor(): def __init__(self, text):
words = nltk.PunktWordTokenizer().tokenize(text) words = filter(lambda x: len(x) > 3, words) # filter 1-2 symbols words
stemmer = nltk.stem.snowball.RussianStemmer()
self.words = map(stemmer.stem, words) # apply stemmer to each word
self.originalForm = self.saveOriginalFormOfWords(words)
# save original form of word
# here it's first occurred word of the text corresponded to the particular token
def saveOriginalFormOfWords(self, tokenizedText):
originalForm = dict()
for i in xrange(len(self.words)):
if not(originalForm.has_key(self.words)):
originalForm = tokenizedText
2 return originalForm
# return sorted list of pairs (object, number of its occurrences in the list)
# it is used for counting unigrams and bigrams in text
def objectCounter(self, listOfObjects):
return (obj, listOfObjects.count(obj)) for obj in set(listOfObjects)
# training of algorithms
#here we only compute IDf
class Trainer():
# model is a pair of (dict: word -> idf_score) and (number of files in training set)
model = None
def __init__ (self):
if not(self.loadModel()):
self.model = self.computeIDF()
self.saveModel()
3 # return TopN object (unigram of bigram) from list
def getTopN(self, listOfObjectsWithCounts, N):
sortedListOfObjectsWithCounts = sorted(listOfObjectsWithCounts, key=lambda x:-int(x1)):N
# return sortedListOfObjectsWithCounts
return item0 for item in sortedListOfObjectsWithCounts
# Assign weights to unigrams and bigrams
# here we use TF*IDF weighting scheme
def weightingScheme(self, listOfCountedObjects, model):
return (objectName, objectCount * model0.setdefault(objectName, -math.log(1.0 - model1)))
for objectName, objectCount in listOfCountedObjects

Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена