跨专业自学NLP,这个90后撸出了开源类库HanLP,已在GitHub收获1.5W星

截止2019年10月底,一款名为HanLP的自然语言处理类库在GitHubStar数达到了15.5K,超过了宾夕法尼亚大学的NLTK、斯坦福大学的CoreNLP、哈尔滨工业大学的LTP。这是一款由一系列模型与算法组成的自然语言处理(NLP)开发工具包。
你或许想象不到,这款NLP工具包被开发出来时,它的作者何晗,还是一位日语专业的大二学生。如今,在攻读博士期间,何晗又创作了一本《自然语言处理入