宁德生活圈

网站首页 信息互动 > 正文

数据科学还是机器学习下面是如何发现差�

2021-10-16 12:05:29 信息互动 来源:
导读 在这个人工智能和数据管理的新世界中,IT很容易被IT世界中一些最常用的术语所迷惑。例如,数据科学和机器学习有许多相互关系。毫不奇怪,很

在这个人工智能和数据管理的新世界中,IT很容易被IT世界中一些最常用的术语所迷惑。

例如,数据科学和机器学习有许多相互关系。毫不奇怪,很多只懂这些学科的人会发现它们之间的区别。

这是将数据科学和机器学习作为一种原理和技术方法分开的最好方法。

数据科学和机器学习:广义和狭义术语。

首先,数据科学实际上是一个广泛而通用的技术范畴,涵盖了许多不同类型的项目和创造。

科学本质上是处理大数据的实践。它出现了摩尔定律,更高效的存储设备的激增导致公司和其他各方收集了大量数据。然后,像Hadoop这样的大数据平台和工具开始通过改变数据管理的工作方式来重新定义计算。现在,随着云和容器化以及全新的模式,大数据已经成为我们工作和生活方式的主要驱动力。

从最简单的形式来看,数据科学就是我们管理数据的方式,从清理和改进数据到以洞察的形式使用数据。

机器学习的定义要窄得多。在机器学习中,技术接收数据,并通过算法来模拟人类的认知过程,称为“学习”。换句话说,在接收数据并对其进行训练后,计算机可以提供自己的结果。这项技术似乎是从程序员实现的过程中学到的。

数据和机器学习技能集。

比较数据科学和机器学习的另一种方法是看看这些领域中对专业人士最有价值的不同技能。

普遍的共识是,数据科学家受益于对数学技能的深入分析,并实践经验丰富的数据库技术和编程语言知识,如Python或其他用于分析大数据的包。

Simplilearn的Srihari Sasikumar写道:“任何对在(数据科学)领域建立强大职业感兴趣的人都应该获得三个部门的关键技能:分析、编程和领域知识。“走出去更深一层,以下技能将帮助你以数据科学家的身份闯出一片新天地:在Python中,SAS拥有强大的知识-[R(和)Scala,SQL数据库编码的实际操作经验,能够和各种来源(如视频和社交媒体)的非结构化数据打交道和工作,了解各种分析功能(和)机器学习知识。”

在机器学习中,专家经常引用数据建模技能、概率和统计知识以及更广泛的编程技能作为机器学习工程师工具包中的有用工具。

如何发现机器学习?

关键是各种东西都包括数据科学,但它不是机器学习,除非你有一个非常严格的计划来帮助计算机从输入中学习。

当它到位时,它会产生一些令人惊讶的系统,这些系统会对我们的生活产生广泛的影响。

据报道,亚马逊创始人杰夫贝索斯表示,“我们在机器学习中做的许多事情都发生在表面之下”,并指出这些类型系统的一些应用。“机器学习驱动我们的算法,用于需求预测、产品搜索排名、产品和交易建议、产品展示位置、欺诈检测、翻译等。虽然不明显,但机器学习的大部分影响都属于这种类型——悄悄地但有意义地改进核心操作。”

这里最有用的一个例子是神经网络的出现,这是一种常见和流行的构建机器学习过程的方法。

神经网络最基本的形式是由人工神经元层组成。每个人工神经元都具有与生物神经元相同的功能——但它不是突触和树突,而是有输入、激活和最终输出。

神经网络就像人脑一样。机器学习专业人员经常使用这种模型来创建机器学习结果。

然而,这并不是机器学习的唯一方法。一些比较基础的机器学习项目只包括向计算机展示各种照片(或提供其他原始数据),通过监督机器学习和标注数据的过程输入想法,最终使计算机能够区分视野中的各种形状或物体。(机器学习的基础知识,请查看机器学习101。)

两个前沿学科。

总之,机器学习是数据科学的重要组成部分。但是数据科学代表了更广阔的前沿和机器学习的背景。

某种程度上可以说,没有大数据,机器学习永远不会发生。然而,大数据本身并没有创造机器学习——相反,在我们集体收集了如此多的数据,以至于我们几乎不知道如何处理这些数据之后,顶级思想家们提出了这些生物模拟过程,以此来增加压力,提供见解。

另一件需要记住的好事是,数据科学可以以两种主要方式应用——我们可以拥抱机器学习和人工智能,让计算机为我们思考,或者我们可以将数据科学带回一种更加以人为本的方法,在这种方法中,计算机只是呈现结果,我们作为人类做出决策。

这导致一些专家,包括一些当今的顶尖创新者,要求对我们使用这些技术的方式进行更动态的解释。

报道援引埃隆马斯克(Elon Musk)的话说:“人工智能(AI)的能力远超几乎所有人的认知,改进的速度是指数级的”,他警告称,机器学习和AI程序需要监管。

无论如何,数据科学和机器学习是当今我们社会技术进步的核心部分。


免责声明: 本文由用户上传,如有侵权请联系删除!


标签: