开始使用数据砖用于了解大规模数据集的工具

  • 罗伯特Ilijason

您的浏览器需要成为JavaScript查看这个视频

请尝试重新加载此页,或检查您的浏览器设置

您正在观看订阅内容的预览。登录检查访问

一个旗开得胜介绍了解您的数据的广阔世界。如果你不明白数据分析的喧嚣是什么,但你知道你需要跳进去,这个视频就是为你准备的。学习一些将大量数据转化为有用信息的技术,这些信息可以帮助您更好地理解自己的数据世界。

本视频是一个用户友好的入门点,教你如何使用机器学习算法从数据的战壕中移动,做出明智的数据驱动的决定。首先简要介绍数据分析,并指导如何在Databricks中设置开发环境。然后,您将使用流行的工具(如Apache Spark上的SQL和Python)研究数据。从那里,您将继续学习如何清理数据,并为在机器学习算法中使用它做准备。最后一部分提供了可视化呈现结果的指导。

你将学到什么

  • 使用SQL和Python研究小型和大型数据集

  • 为高级分析清理和准备数据

  • 运行机器学习算法

  • 使用可视化显示数据结果

这个视频是给谁看的

与数据打交道的人,包括分析师、数据工程师、数据科学家和对数据感到好奇的人。假设有关于数据领域的基本知识,但不需要特殊技能。

本视频将向您展示如何开始使用Databricks,从数据的战壕中走出来,做出明智的数据驱动的决策。

关于作者

罗伯特Ilijason

Robert Ilijason是商业情报部门的20年退伍军人。他作为欧洲一些最大的公司的承包商担任承包商,并在零售,电信,银行,政府等内完成了大规模的分析工作。他已经看到了很多趋势来了多年来,但与大多数人不同,他认为云中的火花,特别是与Databricks,是一个游戏更换者。

关于这个的视频

作者
罗伯特Ilijason
DOI
https://doi.org/10.1007/978-1-4842-6919-0
在线国际标准图书编号
978-1-4842-6919-0
总持续时间
1小时
出版商
安排
版权信息
Robert Ilijason: 2021年

相关内容

视频记录

(播放音乐)

大家好,欢迎来到Databricks的介绍。我是Robert Ilijason,我会在整个课程中跟随你们。我在商业智能和数据科学领域工作了大约20年,主要与大型企业客户打交道。我已经在Spark和Databricks公司工作了四五年多了。

我甚至写了一本关于它的书,使用Azure Databricks进行Apache Spark for Apress。随意检查一下。所以在本课程中,我们将看大规模分析。它是什么,为什么它现在很热,将来会发生什么。而且,我们正在寻找DataMricks,并了解它是如何适合较大的画面。

当然,您还将学习如何使用该工具并学习一些该行业的技巧,这样您就可以比从头开始更容易、更快地开始。在整个课程中,我们将研究一个案例,并试图通过观察如固定酸度、柠檬酸和密度等核心成分来判断葡萄酒的质量。

这是一个经典的机器学习问题,因为我们有一堆旧数据,我们试图将其推断为新数据——新葡萄酒。要做到这一点,我们需要学习如何查看数据并理解它。我们需要学习如何清理数据,并为机器学习做准备。当然,我们需要学习如何运行机器学习算法并读取结果。

在课程结束时,我希望你们能学会如何在Databricks中做一个完整的机器学习项目。谢谢你们选修这门课,希望你们会喜欢。