作者:刘永川(AlexLiu)(作者),闫龙川(译者),高德荃(译者),李君婷(译者)&1更多 出版:北京华章图文信息有限公司 图书简介 本书由Apache Storm项目核心贡献者亲笔撰写,融合了作者丰富的Storm实战经验,通过大量示例,全面而系统地讲解使用Storm进行分布式实时计算的核心概念及应用,并针对不同的应用场景,给出多种基于Storm的设计模式,为读者快速掌握Storm分布式实时计算提供系统实践指南。
全书分为10章:第1章介绍使用Storm建立一个分布式流式计算应用所涉及的核心概念,包括Storm的数据结构、开发环境的搭建,以及Storm程序的开发和调试技术等;第2章详细讲解Storm集群环境的安装和搭建,以及如何将topology部署到分布式环境中;第3章通过传感器数据实例详细介绍Trident topology;第4章讲解如何使用Storm和Trident进行实时趋势分析;第5章介绍如何使用storm进行图形分析,将数据持久化存储在图形数据库中,通过查询数据来发现其中潜在的联系;第6章讲解如何在Storm上使用递归实现一个典型的人工智能算法;第7章演示集成Storm和非事务型系统的复杂性,通过集成Storm和开源探索性分析架构 Druid实现一个可配置的实时系统来分析金融事件。第8章探讨Lambda体系结构的实现方法,讲解如何将批处理机制和实时处理引擎结合起来构建一个可纠错的分析系统;第9章讲解如何将Pig脚本转化为topology,并且使用Storm-YARN部署topology,从而将批处理系统转化为实时系统;第lo章介绍如何在云服务提供商提供的主机环境下部署和运行Storm。 作者段落 "Brian O''Neill (作者), Peter Taylor Goetz (作者), 董昭 (译者) & 0 更多" 图片名 41XYFipEZcL 结束 标题 Apache Spark机器学习 (大数据技术丛书) 纸质书价格 ¥45.53 电子书价格 ¥36.42 专题 大数据技术丛书 文件大小 24470 KB 纸书页数 出版社 机械工业出版社; 第1版 (2017年3月1日)
服务:人工校对0错代录+录完后精校排版 此为收费服务:会收取文档代录之人工费 预估录入后页数:(带目录书签跳转) 请支持正版图书,莫将本服务所得用于非法目的 ✅文档录入及格式制作人工服务,非骗流量 ❤️ 录入后格式:PDF、Word、PPT、ePub、TXT

Apache Spark机器学习 (大数据技术丛书)(ePub+AZW3+PDF+高清)电子书下载 刘永川(AlexLiu)(作者),闫龙川(译者),高德荃(译者),李君婷(译者)&1更多

作为数据科学家和机器学习专业人员,我们的工作是建立模型进行欺诈检测、预测客户流失,或者在广泛的领域将数据转换为洞见。为此,我们有时需要处理大量的数据和复杂的计算。因此,我们一直对新的计算工具满怀期待,例如Spark,我们花费了很多时间来学习新工具。有很多可用的资料来学习这些新的工具,但这些资料大多都由计算机科学家编写,更多的是从计算角度来描述。