跨专业自学NLP,这个90后撸出了开源类库HanLP,已在GitHub收获1.5W星

截止2019年10月底,一款名为HanLP的自然语言处理类库在GitHubStar数达到了15.5K,超过了宾夕法尼亚大学的NLTK、斯坦福大学的CoreNLP、哈尔滨工业大学的LTP。这是一款由一系列模型与算法组成的自然语言处理(NLP)开发工具包。
你或许想象不到,这款NLP工具包被开发出来时,它的作者何晗,还是一位日语专业的大二学生。如今,在攻读博士期间,何晗又创作了一本《自然语言处理入

如何正确地做误差分析,NLP研究人员们需要学习一下

笔者按:尝试分析机器学习模型在什么时候、以什么方式、由于什么原因失效,我们把这称为「误差分析(erroranalysis)」。对科研人员来说,他们需要通过误差分析选择后续的改进方向;模型的实际使用者们也需要根据误差分析来确定模型部署的许多细节。由于误差分析对后续的行动方向有显著的影响,如果误差分析中出现了偏倚,或者误差分析不完整,很可能会带来我们不想看到的后果。
NLP任务误差分析的现状
但是