大数据导论 思维、技术与应用(Word+PDF+ePub+PPT)
作者介绍:
武志学,剑桥大学博士,曾任思杰(Citrix)公司主任研究员、成都国腾实业集团CTO、电子科技大学成都学院云计算科学与技术系第一任系主任。现任洛阳汽车工业大学副校长兼人工智能学院院长、成都信息工程大学大数据与安全工程中心主任、成都鼎晟数智科技有限公司董事长。兼任四川省云计算产业联盟副主任、四川省高性能计算专家委员会副主任委员、成都市软件行业协会专家委员会委员。 云计算开源平台OpenStack顶层设计者之一,发表国际会议和期刊论文20多篇 ,获得相关专利20余项,编写云计算、大数据图书4部,大数据在线培训平台“志学课堂” 发起人。
内容介绍:
本书将基本概念与实例相结合,由浅入深、循序渐进地对大数据思维、技术和应用做了全面系统的介绍。全书共12章,分为大数据基础篇、大数据存储篇、大数据处理篇、大数据挖掘篇和大数据应用篇。 大数据基础篇的内容涵盖了大数据思维理念、大数据的产生与作用、大数据基本概念、大数据采集工具Flume和Scribe、大数据爬虫工具Nutch和Scapy、大数据预处理工具Kettle、大数据处理架构Hadoop;大数据存储篇的内容包含分布式文件存储系统HDFS、海量数据存储数据库系统HBase和海量数据仓库系统Hive;大数据处理篇主要介绍了分布式并发计算批处理模式MapReduce,基于内存的快速处理模式Spark,以及基于实时数据流的实时处理模式Spark Streaming;大数据挖掘篇主要对分类、预测、聚类和关联等各类大数据挖掘算法的原理和使用场景进行了描述,并使用Spark MLlib提供的机器学习算法进行了实例讲解;大数据应用篇分别从大数据场景应用的横向和纵向出发,介绍了大数据在各个功能领域的应用场景和在各个行业的应用场景。
更多详情: