白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版

白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版

编辑点评:

白话大数据与机器学习以降低学习曲线和阅读难度为宗旨,重点讲解了统计学、数据挖掘算法、实际应用案例、数据价值与变现,以及高级拓展技能,清晰勾勒出大数据技术路线与产业蓝图

20201117182732.png

编辑推荐

资深大数据专家多年实战经验总结,拒绝晦涩,开启大数据与机器学习妙趣之旅

以降低学习曲线和阅读难度为宗旨,重点讲解了统计学、数据挖掘算法、实际应用案例、数据价值与变现,以及高级拓展技能,清晰勾勒出大数据技术路线与产业蓝图

目前很多大中型企业都有数据分析岗位,尤其是和自己业务结合紧密的分析岗位。企业求贤若渴,而求职者对数据分析岗位望而却步。这就是当前大数据分析市场的尴尬。

原因有三:

数学基础薄弱:很多应用中的统计学、概率学,成为学习中的巨大阻力。

学习成本高:数学和相关的算法过于抽象,布道者往往忽略了很多解释性的内容,使得读者学习起来费时费力。

变现不确定:这也是数据分析人员的尴尬。个人对数据的加工增值以及变现有多大的贡献难以度量。

本书通俗易懂,有高中数学基础即可看懂,同时结合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,将源自生活的抽象还原出来,帮助读者理解后,又带领大家将这些抽象的规律与算法应用于实践,贴合读者需求。同时,本书不是割裂讲解大数据与机器学习的算法和应用,还讲解了其生态环境与关联内容,让读者更全面地知晓渊源与未来,是系统学习大数据与机器学习的不二之选:

大数据产业解读——剖析产业情况,人才供需、职业选择与相应“武器”库;

步入大数据之门——解读数据、信息、算法,以及与大数据应用的关系;

大数据基石——结合大量示例和漫画,趣味讲解大数据算法应掌握的数学知识,无障碍学习;

大数据算法奥义——信息论、向量空间、回归、聚类、分类等*为核心的算法的释义与应用,举重若轻;

大数据热门应用——关联分析、用户画像、推荐算法、文本挖掘、人工神经网络等*实用、*需要了解的应用的原理与实现;

大数据主流框架——介绍了主流的大数据框架(Hadoop、Spark和Cassandra);

系统架构与调优——从速度与稳定性方面给出调优的一般性“内功心法”;

大数据价值与变现——从运营指标、AB测试、大数据价值与变现场景多维度解读。

内容简介

资深大数据专家多年实战经验总结,拒绝晦涩,开启大数据与机器学习妙趣之旅。以降低学习曲线和阅读难度为宗旨,系统讲解统计学、数据挖掘算法、实际应用案例、数据价值与变现,以及高级拓展技能,并清晰勾勒出大数据技术路线与产业蓝图。

本书共分18章。用通俗易懂的语言,结合大量案例与漫画,不枯燥,实用、接地气。

第1~5章,这部分是大数据入门所需的系统性知识,剖析大数据产业、数据与信息算法等的关系,妙解数学基础(排列组合、概率、统计与分布),以及指标化运营及体系构建。这部分补足读者的产业与相关概念认知,以及所需的数学知识。为下面的数据挖掘算法的理解与应用夯实基础。

第6~8章,这部分介绍数据挖掘基础知识与算法,讲解了与数据息息相关的信息论,重点讲解了:多维向量空间(向量和维度、矩阵及其计算、上卷和下钻);

回归(线性回归、残差分析、拟合相关问题);

聚类(K-Means算法、有趣模式、孤立点、层次与密度聚类,聚类的评估等);

分类(朴素贝叶斯、决策树归纳、随机森林、隐马尔科夫模型、SVM、遗传算法)。

第11~18章,这部分介绍生产应用与高级扩展。其中第11~15章介绍生产应用实践,涵盖关联分析、用户画像、推荐算法、文本挖掘、人工神经网络。这些也是工业界和学术界研究的热点。第16章讲解了著名的大数据框架及其安装与配置,如Hadoop、Spark、Cassandra、PrestoDB。第17章从速度与稳定性维度介绍了大数据系统的架构与调优。第18章则从数据运营、评估、展现与变现场景层面进行了解读。

附录部分给出了大数据平台运行可能需要的软件和库,以及群众如何看待炙手可热的大数据。

作者简介

高扬,金山软件西山居资深大数据架构师与大数据专家,有多年编程经验(多年日本和澳洲工作经验)和多年大数据架构设计与数据分析、处理经验,目前负责西山居的大数据产品市场战略与产品战略。专注于大数据系统架构以及变现研究。擅长数据挖掘、数据建模、关系型数据库应用以及大数据框架Hadoop、Spark、Cassandra、Prestodb等的应用。负责西山居紫霞系统——大数据日志处理系统的系统架构与设计工作。

卫峥,西山居软件架构师,多年的软件开发和架构经验,精通C/C++、Python、Golang、JavaScript等多门编程语言,近几年专注于数据处理、机器学算法的研究、应用与服务研发。曾在新浪网平台架构部负责音视频转码平台的架构和研发工作,为新浪微博,新浪微盘,秒拍等提供视频在线观看服务。51CTO讲师。

尹会生,西山居高级系统工程师。曾任新浪研发中心技术经理、北京尚观科技高级讲师。在新浪广告、微博广告、西山居大数据平台架构中担任关键角色。擅长企业集群解决方案和内核调优经验,并提供高性能和高可用性集群咨询服务。近4年专注于Hadoop集群、Spark集群在推荐系统和BI相关领域的解决方案。

万娟,星盘科技有限公司UI设计师平面,对VI设计、包装、海报设计等、商业插画、App交互、网页设计等有独到认识。多次参与智能家居和智能音箱等项目的UI设计。多次参加国际和国内艺术和工业设计比赛,并获奖。从小酷爱绘画,理想是开一个属于自己的画室。

为什么要写这本书

不知从何时开始我们已周身没入大数据时代的潮流,不知不觉被卷入了大数据时代。

无论是每天上网看网页、聊QQ、聊微信,或者登录银行、网购、买票,或者出行、投宿,甚至是出入任何公众场合、驾车、用水用电……我们无时无刻不在生产着各种数据。而同时我们也在消费着其他人生产的数据,我们使用的众多家电产品,每一个设计细节都融入了设计者对用户体验数据的调查与分析;我们使用的每一部手机、每一台电脑,每一个部件的产出都融入着多得无法想象的指标数据控制下的生产与监控;我们访问的每一个网页、每一个软件,每一次享受到的贴心的产品改动和服务的升级,无不浸透着无数的数据汇集与精细的分析和反馈。这是一场慢慢到来的、贯穿所有产业的革命,这是一次润物细无声的各行业精耕细作的开端。

不管我们是不是愿意,不管我们有没有意识到,我们现在已经身处大数据时代的奇点,而未来要迎接的是大数据奇点爆炸给我们带来的冲击力。我们需要力量来驾驭浪里的航船,我们需要乘风破浪前进的动力。

在这一次远航中,我们不必担心自己的能力水平无法感知数据这种磅礴之力的气魄,不必担心晦涩难懂的公式定理会让我们感到阻力。

请相信我,这是一本通俗易懂的大数据图书,这是一本轻松愉悦的数据挖掘和机器学习的读本,这是一本没有门槛的机器学习实战手册。让我们一起扬帆远航吧!

白话大数据与机器学习PDF电子书下载截图

白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版插图(1)白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版插图(2)白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版插图(3)白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版插图(4)白话大数据与机器学习豆瓣在线阅读-白话大数据与机器学习PDF电子书下载完整高清版插图(5)

评分及评论

无用户评分

来评个分数吧

  • 5 分
    0
  • 4 分
    0
  • 3 分
    0
  • 2 分
    0
  • 1 分
    0

Comments