IT思维

文章页右侧顶部广告

仰望星空vs.脚踏实地—AI领域技术从业者进阶指南

2018-12-20 22:18:06 0 人工智能 | , ,

From: QRIUS 编译:Lin

人工智能是最令人兴奋和最具吸引力的领域之一。根据Gartner的数据,全球机器学习市场预计从2017年到2022年将获得迅速发展。到2020年,人工智能预计将创造230万个相关工作岗位。 机器学习工程师的平均工资在125,000美元到175,000美元之间。在AI人才收入最高的十大公司中,平均工资轻松超过20万美元。但除了诱人的经济利益外,迅速发展的行业和高速学习的氛围都让这一领域产生了难以抵挡的魅力。本文将详细介绍人工智能领域工作所要求的行业技能,以及如何脚踏实地地提高自己、习得足够的能力。

人工智能领域的工作是怎样的呢?

首先,我们需要清晰的定义这一领域的工作内容和岗位职责。

人工智能是一个非常广泛的术语——它涉及在机器中复制人类学习和行为的理想动力。那我们如何打破夸张的说法呢?让我们首先谈谈人工智能的一个特定要素,它有效且能到良好的回报:机器学习。机器学习是人工智能的一个子集,它涉及使用某些规则和算法来尝试将有用信息从一个数据集推广到更广泛的数据集。

您可以采用人工分类的标记数据,并通过机器学习扩展逻辑,或让计算机浏览未标记的数据并为您解决问题。您可能会采用类似于深度学习或者强化学习的形式来达到预期的结果。

如果您选择进入机器学习行业,您将使用数据管道——在从类似数据集中提炼出某些规则后,让机器为新数据集做出预测和标签的技能。机器学习是一组用于处理数据的编程工具,深度学习或强化学习是其中的一个子集。

关键的区别在于深度学习将通过多层反馈来运作。类似神经网络的深度学习模型将自我纠正并针对某个结果进行优化,调整自身,使其输出通过模型中权重的自我修改逐渐匹配其输入。

这可能是最简单的深度学习模型:也即上文提及的的感知器。在这种情况下,从一系列输入中,在输入和输出之间执行的隐藏计算层会自我修改,直到它到达所需的输出。

为什么这很重要呢?因为它构成了您所听到的各种令人兴奋的人工智能创新的基础,从自动驾驶汽车到视频/图像识别。通过创建越来越高效的模型,帮助机器管理数据模式的复杂性,可以扩展到数万亿的可能性,人类可以从自动处理更大规模的数据中受益——从丰富的数据集中获得更多的信息。这些信息可以让像Facebook这样的社交网络自动对其网络上的照片进行分类,或者允许某人根据您的搜索历史进行模式匹配和预测您的行为。

基础概念和定义

接下来,让我们明确定义机器学习领域的一些术语,以便我们清晰地理解。

数据科学涉及使用统计和理论来处理大型数据集,以便您可以根据基础数据集获得商业领域的答案或预测。

人工智能是使机器像人类一样学习和推理的更广泛的理念,但其中大部分的内容理论多于实践、想法多于落地。

机器学习是一种创建预测模型的方法,不需要详尽的编程即可从数据中学习,这是一个具备可操作性的人工智能的子集。

深度学习是机器学习的一个子集,很多情况下特指像卷积神经网络这样的模型,它将输入和输出与密集的隐藏层相协调,这些隐藏层通过数据给出的监督信号来修正权重的,以达到预期的结果。

当您使用数据集和人工智能/机器学习时,传统而言,在职位上有两个基本区别:

数据科学家:他们通过模型的结果来分析和重构商业逻辑,并对业务流程给出指导性建议。数据科学家将数据模型的结果传达给商业决策者,他们也帮助调整和定制模型,帮助企业提出和解决正确的数据问题。

机器学习工程师:他们构建数据管道,允许数据科学家处理大量不断更新的数据。在实践中,他们负责为数据科学家定义的模型提供其所需数据,且他们经常负责实现理论中的数据科学模型,并使其大规模地稳定地运行,实现适应超大数据量的产品级的服务。

虽然这里分为了两个职位,但根据经验来看即使两个广泛的角色有一些重叠,数据科学家也经常会使用人工智能数据科学背后的理论,而机器学习工程师将在实践中实施模型。数据科学家往往在机器学习、统计学和数学方面拥有更强的理论基础,而机器学习工程师通常拥有更强大的软件工程背景。

长远前景

很多人对人工智能或机器学习的长远前景仍然缺乏信息。这项工作是否会随着其他人工智能的自动化而自动化?这个问题的确存在,但就目前而言,更重要的是要将人工智能放到与过去工业革命同样的情况下去考虑:这波技术浪潮为人们带来的是全新能力和创造新经济的可能性。例如,ATM与银行员工的数目相关。我们可以从ATM的历史中了解到,自动化并不总是意味着失业,它还意味着新技术可以颠覆已确立的真理。

薪酬

数据科学家在这里的分类定义中有一个广泛存在的差异:数据分析师也属于他们的职权范围。主要区别在于数据分析师更倾向于分析数据并对已建立的数据模型进行一次性查询,这些数据模型往往由数据科学家定义。下面将数据分析师和数据科学家角色之间的区别。

了解这一差异可能非常重要。在美国,数据分析师的平均工资约为6万美元。 而数据科学家每年将获得约3万美元的收入。与此同时,数据工程师每年平均收入约为9万美元。 然而,专门致力于实现机器学习的工程师收入明显增加,每年轻松超过10万美元。AI领域的知名人士有时会获得数百万美元的红利和股票,尽管他们往往是在全球顶尖大学或实验室从事尖端工作和研究的AI从业者。

从广义上讲,如果你想开启自己人工智能的职业道路,可以开始学习软件开发的背景知识并学习机器学习理论,或者你可以从机器学习理论并逐步掌握编程在机器学习中的应用。

所需的技能

为了使用人工智能/机器学习,您通常需要四种技能:

· 软件工程技能——在实践中构建模型。您要经常使用Python、Pandas、Scikit-Learn、TensorFlow和Spark等工具。在该工具集中熟练工作的能力将决定您处理和管理数据的能力。

· 机器学习理论知识,这让您了解要构建的模型和原理,以及将某些方法应用于某些数据问题的优缺点。

· 使用统计推断来快速评估模型是否正常工作的能力。

· 专业的知识以及与商务人士沟通的能力。这不仅因为可以扩大数据中发现价值的影响力,更能在商业层面推动正确的行动,可以帮助实际的业务场景建立起数据驱动的能力。

总的来讲机器学习工程师将会在软件方面投入更多,而数据科学家则更多地依赖于他们在机器学习和统计推理方面的能力,以及与人沟通和分享数据中的发现。

学习方向

为了让希望入坑的小伙伴们更好地地掌握机器学习和人工智能,下面提供了软件、理论和就业方面的资源。

软件能力(偏向大数据方向)

· python与机器学习:作为使用最为广泛的AI/机器学习语言,python丰富的生态和工具栈为每一个数据科学、机器学习从业人员提供了强大的工具。其中numpy、scipy、pandas、sci-kit等都是重要的python工具包。

· Apache Spark on Databricks:作为工程师需要熟悉大规模数据的使用。Spark提供了丰富的教程来讲解如何使用大数据集进行工作的流程。

· Tensorflow:作为使用最为广泛的深度学习框架之一,学习tensorflow深入理解人工智能的具体流程的工作方法,同时分布式的机器学习、产品级部署和维护也是工程师的一项重要技能。

理论

要想深入理解和熟练掌握机器学习和人工智能,就需要有坚实的理论基础。需要学习的方向包括概率论、贝叶斯统计、统计学习以及机器学习中的常用算法和现代深度学习的基本理论。

就业

要进入AI行业就需要先了解这个行业。下面推荐了一些社区和网站,可以从中找到丰富的行业经验和工作信息。包括技术社群Hacker News,初创公司集合AngelList、数据科学邮件列表Data Elixir,以及AI和数据科学领域的工作信息网站KDNuggets和icrunchdata的AI工作信息板。此外要想面试不慌,下面这个链接还有高频41题可以参考:

41 Essential Machine Learning Interview Questions (with answers)

希望想进入AI行业的小伙伴们可以通过上面的介绍,更加清楚自己的方向和所需的准备,然后脚踏实地、梦想成真。

附录AI学习、就业资源链接:

Sotfware:
https://www.springboard.com/resources/learning-paths/machine-learning-python
https://databricks-prod-cloudfront.cloud.databricks.com/public/4027ec902e239c93eaaa8714f173bcfc/346304/2168141618055109/484361/latest.html
https://www.learningtensorflow.com/
https://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html
理论:
https://towardsdatascience.com/a-tour-of-the-top-10-algorithms-for-machine-learning-newbies-dde4edffae11
https://medium.com/mlreview/modern-theory-of-deep-learning-why-does-it-works-so-well-9ee1f7fb2808
https://github.com/norvig/pytudes/blob/master/ipynb/Probability.ipynb
http://www.kevinboone.net/bayes.html
https://machinelearningmastery.com/statistics-for-evaluating-machine-learning-models/
Jobs:
https://news.ycombinator.com/item?id=18113144
https://angel.co/jobs
https://jobs.dataelixir.com/
https://www.kdnuggets.com/jobs/index.html
https://icrunchdata.com/artificial-intelligence-jobs/
https://career.berkeley.edu/Info/InfoInterview
https://www.springboard.com/resources/data-scientist-interview-guide/
https://www.springboard.com/blog/machine-learning-interview-questions/

IT思维

IT思维(itsiwei.com)是互联网首个定位在科技与电商“思维”韬略的平台,我们时刻关注互联网电商行业新动向; 诚邀行业资深从业者加入“思维客家族”!

发表留言

Return to Top ▲Return to Top ▲