一部电影能否大卖?用机器学习来精准预测吧

电影数据库(TMDB)为电影数据提供了一个API,人们可以从该数据库中下载数据。那么,在仅知道电影上映前的部分信息的情况下,是否能预测电影的评分和票房?什么参数最能预测一部好的或最卖座的电影?采用什么阵容或用什么演员是否能帮助预测电影票房?
我们随机地在90%的电影上做了一个模型,并在剩下的10%的电影上测试了该模型。而对于这些测试模型的电影:

准确地预测电影票房具有一定的挑战性。按照外行的

人工智能背后的人工力量:机器学习必需数据标注

资料图:市民用手机体验最新产品。殷立勤摄
“目前我国已有庞大的数据加工队伍,仅北京就有一百多家专门从事数据标注的公司,全国从事这项工作的人大概超过千万,很多头部的互联网技术企业都有自己的数据标注公司。”
目前人工智能落地场景不断丰富,智能化应用正改变着我们的生活。而在AI产业高速发展的背后,数据标注师这个新职业的从业人数也正在壮大。数据标注行业流行着一句话,“有多少智能,就有多少

2019年10大机器学习Q&A,面试应知!

新兴技术风靡全球,它们所带来的创新、机遇和威胁也是前所未有的。而这些领域所需要的专家人才也随之增长。
根据最新的行业报告显示,新兴技术领域的工作,如机器学习、人工智能和数据科学等,是最热门的新兴职业。从事此类新兴技术工作既能获得丰厚的利润,又能开发智力。
本文整理了一些最常见的机器学习面试问题及其相应的回答。机器学习有志者以及经验丰富的ML专业人员可以在面试前以此巩固其基础知识。

1.机器学

35岁入场机器学习和人工智能?

这几天和朋友在探讨这个问题,众所周知,IT类职业在行业是标准的“青春饭”,这个行业的发展太快了,需要不停的更新现有的知识体系,才能跟上技术的发展,因为随着新技术的出现能让你多年在技术中取得的先发优势转眼之间丧失。比如计算机视觉领域在没有深度学习之前和在有深度学习之后是完全两个不同的世界。

网上还盛传很多企业会直接将35岁的程序员给开除了,所以很多人认为35岁对IT人而言是个尴尬的年纪?不否认

民主化与自动化:降低机器学习门槛的六大工具

过去,机器学习这个名词的头上曾经笼着科学的光环,只有少数高薪数据科学家才懂得如何用数据“喂养”复杂的算法,得出有用的分析结果。但如今随着自动化工具的快速发展,数据的采集、结构化和分析已经变得更加容易,机器学习的使用门槛已经大幅降低,即使那些不懂编程的业务人员,只要能提出正确的问题,同样也能用机器学习工具得到想要的结果。

机器学习的民主化进程正在加速,标志之一就是AutoML最近成了热门词汇,

制定机器学习训练数据策略的6个技巧

人工智能(AI)和机器学习(ML)如今已经十分常见。AI指的是机器模仿人类进行认知的概念,ML是一种用于构建AI的方法。如果AI是指计算机可以根据指令执行一组任务,那么ML就是机器从数据中摄取、解析和学习的能力,以便更精确地完成任务。
汽车、金融、政府、医疗、零售和科技等行业的大部分管理者都已经对ML和AI有了基本的了解。不过,并非每个人都是一个制定训练数据策略的专家——而这往往是实现ML高投

论机器学习模型的可解释性

在2019年2月,波兰政府增加了一项银行法修正案,该修正案赋予了客户在遇到负面信用决策时可获得解释的权利。这是GDPR在欧盟实施的直接影响之一。这意味着如果决策过程是自动的,银行需要能够解释为什么不批准贷款。
在2018年10月,“亚马逊人工智能招聘工具偏向男性”的报道登上了全球的头条新闻。亚马逊的模型是基于有偏见的数据进行训练的,这些数据偏向于男性应聘者。该模型构建了不利于含有“Women’

云计算的限制:为什么需要边缘的机器学习

机器学习有着很高的处理需求,而其通信成本意味着人们最终需要它在边缘的地方(智能手机)发挥作用。

如今,人们正在进入由人工智能(AI)驱动的新一轮技术创新时代,机器学习处于技术最前沿。即使在今天,机器学习也是任何设备体验的重要技术,为各种任务、功能、应用程序提供支持。从设备上的安全性(如面部解锁、面部识别和指纹识别),到智能手机摄像头和音频功能(允许用户通过诸如Socratic、Snapcha

排雷避坑,机器学习一定要避开的3大陷阱

几十年来,机器学习领域一直饱受“坦克问题(tankproblem)”的折磨。

故事发生在上个世纪60年代(此研究已知的最早文献,此处感谢软件工程师JeffKaufman),事件的细节已湮没在时间的迷雾当中,不过故事大概是这样子的:
研究者们编写了个算法来从军方提供的照片中识别坦克。该模型成功地在测试图中找到了坦克,但随后使用真实的照片时却失败了。
原因是什么呢?口口相传的具体细节各不相同,

真正的大数据问题以及为什么只有机器学习才能解决它

为什么很多公司仍在努力构建从采集数据到获得洞察力的平稳运行的管道?他们希望投资和采用机器学习算法来分析数据,并做出商业预测。
但是,不可避免的是,他们应该意识到算法并不是魔法:如果采用的是垃圾数据,得出的就不会是一流的见解。因此,他们雇佣了一些数据科学家,但通常他们90%的时间都花在数据清洁上,只剩下10%的时间来完成分析工作。

这个过程的缺点还在于企业喜欢采用终端算法的机器学习。Tamr公