TfidfVectorizer、CountVectorizer 和 TfidfTransformer 的简单教程

TfidfVectorizer、CountVectorizer和TfidfTransformer是sklearn中处理自然语言常用的工具。TfidfVectorizer相当于CountVectoriz
NLP 2020年04月17日 118次浏览

第二届易观算法大赛 baseline 分享

赛题描述本文介绍第二届易观算法大赛——性别年龄预测的代码和思路,这是比赛地址。这虽然是一年多前的比赛,其中的数据处理和特征工程等思路依然值得学习。这次大赛的要求根据用户手机数据、和手机上的应用数据等,
数据处理 机器学习 2020年04月16日 279次浏览

使用多进程处理 DataFrame

基本思路是,将DataFrame拆成若干组分,最后通过pandas.concat合并起结果defparallelize_dataframe(df,func,n_jobs=3,split_num=10)
数据处理 2020年04月13日 109次浏览

Graph-Based Object Classification for Neuromorphic Vision Sensing 论文解读

TitleGraph-BasedObjectClassificationforNeuromorphicVisionSensingSummaryNVS可以显著提高采样率,同时显著提高能量效率和对光照变化
论文 AI 2020年04月06日 144次浏览

计算机网络

OSI七层协议应用层主要是HTTP协议表示层信息的语法语义表示以及它们之间的关联,如加密解密、转换翻译、压缩解压缩等会话层不同机器上的用户之间建立以及管理会话传输层接收上一层数据,在必要时把数据进行分
2020年03月18日 1,784次浏览

Java的IO机制

BIO、NIO、AIO的区别BIO包括基于字节流的InputStream和OutputStream,以及基于字符流的Reader和Writer。NIONonBlock-IO:构建多路复用的、同步非阻塞
2020年03月17日 146次浏览

J.U.C(java.util.concurrent)包的梳理

java.util.concurrent提供了并发编程的解决方案,主要包括两大块:CAS:是java.util.concurrent.atomic包的基础AQS:是java.util.concurre
2020年03月17日 162次浏览

Java 集合框架

数据结构常见考点数组和链表的区别链表的操作:如反转、链表环路检测、双向链表、循环链表以及相关操作队列、栈的应用二叉树的遍历以及其递归和非递归的实现红黑树的旋转算法常见考点内部排序:如递归排序、交换排序
2020年03月17日 138次浏览

Java异常体系

Java从诞生之初就提供了完善的异常处理机制,大大降低了编写和维护可靠程序的门槛。Java的异常处理机制主要回答了3个问题:What:异常类型回答了什么被抛出Where:异常堆栈跟踪回答了在哪里被抛出
2020年03月16日 146次浏览

Java 线程池

在Java中,一般都会利用Executors创建不同的线程池满足不同场景的需求。Executors.newFixedThreadPool(intnThreads)指定工作线程数量的线程池,每来一个任务
2020年03月16日 149次浏览