分布式实时计算框架原理及实践案例(Word+PDF+ePub+PPT)
作者:王成光(作者)
出版:异步社区 图书简介
作者介绍:
Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。 他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。内容介绍:
数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。 本书讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。 本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。 作者段落 "戴维·纳蒂加 (作者)" 图片名 51wPqZf1ckL 结束 标题 分布式实时计算框架原理及实践案例 纸质书价格 ¥58.65 电子书价格 ¥46.92 专题 文件大小 111918 KB 纸书页数 292 出版社 电子工业出版社; 第1版 (2016年8月1日) 服务:人工校对0错代录+录完后精校排版 此为收费服务:会收取文档代录之人工费 预估录入后页数:292(带目录书签跳转) 请支持正版图书,莫将本服务所得用于非法目的 ✅文档录入及格式制作人工服务,非骗流量 ❤️ 录入后格式:PDF、Word、PPT、ePub、TXT“授人以鱼不如授人以渔”,本书是作者以如此初心写成的,主要参考当前主流分布式实时计算框架Storm的任务分发和Spark Streaming的Mini-Batch设计思想,以及底层实现技术,开源了作者自研的轻量级分布式实时计算框架——Light_drtc,并且重点介绍设计思想和相关实现技术(Kafka/RabbitMQ、Redis/SSDB 、GuavaCache、MongoDB、HBase、ES/SolrCloud、Thrift、Avro、Jetty),最后从工程角度向大家介绍完整的个性化推荐系统,并实