16个用于数据科学和机器学习的顶级平台

调研机构Gartner公司将数据科学和机器学习平台定义为“具有凝聚力的软件应用程序,它提供了创建多种数据科学解决方案以及将这些解决方案合并到业务流程、周围基础设施和产品中所必需的基本构建块的混合体。”

这样的平台支持数据科学家在整个数据和分析管道中执行任务。这些任务包括与数据访问和接收、数据准备、交互式探索和可视化、功能工程、高级建模、测试、培训、部署和性能工程相关的任务。考虑到这一点,Ga

Flask探索:存储数据

大部分 Flask 应用程序会在某一时刻处理存储数据。存在许多不同的方式来存储数据。寻找最好的一种方式完全取决于你要存储的数据。如果你存储关系型数据(例如,一个用户有多篇文章,每篇文章都有一个作者等等),一个关系型数据库可能是一种合适的方式。其它类型的数据可能适合 NoSQL 数据存储,像 MongoDB。我将不会告诉你们该如何为你的应用程序选择数据库引擎。有些人会告诉你 NoSQL 是唯一的选择

零基础学Python:处理股票数据

这段时间某国股市很火爆,不少砖家在分析股市火爆的各种原因,更有不少人看到别人挣钱眼红了,点钞票杀入股市。不过,我还是很淡定的,因为没钱,所以不用担心任何股市风险临到。但是,为了体现本人也是与时俱进的,就以股票数据为例子,来简要说明pandas和其它模块在处理数据上的应用。下载yahoo上的数据或许你稀奇,为什么要下载yahoo上的股票数据呢?国内网站上不是也有吗?是有。但是,那时某国内的。我喜欢y

零基础学Python:将数据存入文件

在《文件(1)》和《文件(2)》中,已经学习了如何读写文件。如果在程序中,有数据要保存到磁盘中,放到某个文件中是一种不错的方法。但是,如果像以前那样存,未免有点凌乱,并且没有什么良好的存储格式,导致数据以后被读出来的时候遇到麻烦,特别是不能让另外的使用者很好地理解。不要忘记了,编程是一个合作的活。还有,存储的数据不一定都是类似字符串、整数那种基础类型的。总而言之,需要将要存储的对象格式化(或者叫做

数据集查找神器!100个大型机器学习数据集都汇总在这了

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
想自己构建机器学习模型,没想到首先就卡在了第一步。
网上各种数据集鱼龙混杂,质量也参差不齐,简直让人挑花了眼。想要获取大型数据集,还要挨个跑到各数据集的网站,两个字:麻烦。
如何才能高效找到机器学习领域规模最大、质量最高的数据集?
为了响应广大网友的呼声,网友u/UpdraftDev将全网最大的机器学习数据集整理汇集

Gartner报告:正处于数据科学与机器学习工具 “大爆炸”的时代

Gartner表示,目前用于数据科学的工具正在迅速发生变化。该公司在其最新的数据科学和机器学习平台的报告中称,我们正处于“大爆炸”中。
 

日前,Gartner发布了2019年版面向数据科学与机器学习工具的魔力象限。Gartner的魔力象限是在某一特定时间内对市场情况进行的图形化描述,根据Gartner的定义,它描述了Gartner依据标准对该市场内的厂商所进行的分析。Datanami的Al

学好机器学习和大数据必备的6本好书!

机器学习和数据科学是复杂而相互关联的概念。要想让自己在技术紧跟趋势,你必须消耗大量的时间进行知识的更新。
日复一日的重复劳动不等于学习,这样仍有可能掉队。
所以一方面我们需要学习新知识,一方面保持实操经验。这样完美技能的组合,才能帮助你在行业中取得成功。
尽管互联网上存在大量的学习资源,但对于信息的选择并不是一件容易的事情,所以,选择几本优秀的书籍尤为重要。
这里我们精选出六本好书,助你学好机