将sklearn训练速度提升100多倍,美国「返利网」开源sk-dist框架

在本文中,Ibotta(美国版「返利网」)机器学习和数据科学经理EvanHarris介绍了他们的开源项目sk-dist。这是一个分配scikit-learn元估计器的Spark通用框架,它结合了Spark和scikit-learn中的元素,可以将sklearn的训练速度提升100多倍。
在Ibotta,我们训练了许多机器学习模型。这些模型为我们的推荐系统、搜索引擎、定价优化引擎、数据质量等提供

制定机器学习训练数据策略的6个技巧

人工智能(AI)和机器学习(ML)如今已经十分常见。AI指的是机器模仿人类进行认知的概念,ML是一种用于构建AI的方法。如果AI是指计算机可以根据指令执行一组任务,那么ML就是机器从数据中摄取、解析和学习的能力,以便更精确地完成任务。
汽车、金融、政府、医疗、零售和科技等行业的大部分管理者都已经对ML和AI有了基本的了解。不过,并非每个人都是一个制定训练数据策略的专家——而这往往是实现ML高投

滴滴开源自然语言理解模型训练平台DELTA

当地时间7月28日至8月2日,自然语言处理领域顶级会议ACL2019在意大利佛罗伦萨召开,会上滴滴正式宣布开源基于深度学习的语音和自然语言理解模型训练平台DELTA,以进一步帮助AI开发者创建、部署自然语言处理和语音模型,构建高效的解决方案,助力NLP应用更好落地。
滴滴自然语言处理首席科学家KevinKnight在ACL2019现场
DELTA是滴滴第22个开源项目。自然语言处理模型和语音

半天2k赞火爆推特,李飞飞高徒发布33条神经网络训练秘技

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
同学,现在有一份33条神经网络训练秘笈,摆在你面前。
AI大佬AndrejKarpathy (简称AK),刚刚发布了一篇长长长长博客,苦口婆心地列举了33条技巧和注意事项,全面避免大家踩坑,推特已有2,300多赞。

AK在斯坦福读博的时候,是飞飞实验室的成员,毕业去了OpenAI,然后又成了特斯拉的AI负责人,直