CountVectorizer的参数中可传入分词器
vectorizer = CountVectorizer(tokenzer.cut) corpus = [ "中文的信息无处不在"] X=vectorizer.fit_transform(corpus)
sklearn中CountVectorizer使用小记录
原文:https://www.cnblogs.com/chuanyang/p/14952050.html