TfidfVectorizer、CountVectorizer 和 TfidfTransformer 的简单教程

TfidfVectorizer、CountVectorizer和TfidfTransformer是sklearn中处理自然语言常用的工具。TfidfVectorizer相当于CountVectoriz
NLP 2020年04月17日 165次浏览

使用多进程处理 DataFrame

基本思路是,将DataFrame拆成若干组分,最后通过pandas.concat合并起结果defparallelize_dataframe(df,func,n_jobs=3,split_num=10)
数据处理 2020年04月13日 141次浏览