近年来,大数据分析逐渐火热,成为提升企业竞争力的重要手段。由于传统关系型数据库有难以扩展的弱点,以Hadoop为主流的新兴分布式集群解决方案逐渐击败传统数据库,成为大数据分析领域的霸主。在炼数成金的基础课程《Hadoop数据分析平台》里,对Hadoop的两大支柱技术HDFS和Map-Reduce以及Hadoop生态圈的各个子产品作了详细的介绍和学习。
我们致力于向学员描画若干真正的企业级数据分析项目的全貌,我们会分别站在甲方——需求者,乙方团队——数据架构师、算法设计师、IT系统架构师、开发工程师等多个角色的角度来审视项目整个过程,向大家展示项目的业务背景,数据建模,算法设计,集群设计和部署,系统开发编码等过程的全貌,使大家有亲历其境的感觉,犹如自己身处于项目团队之中,熟悉大数据分析项目的完成工序。无论你的个人目标是何种角色,都能在课程中有所收获。
本课程覆盖互联网,电子商务,电信运营商,金融行业,地理位置应用等多个领域,每一次课就是一个独立的项目,这些实战内容将可以使大家在基础课程之后,更加理解Hadoop在实际中是如何使用,同时吸取跨行业的项目知识经验,对将来的个人发展将大有裨益。
第1节 Hadoop基础回顾
第2节 Hadoop应用情况综述
第3节 巨型网站日志系统分析,提取KPI数据(Map-Reduce)
第4节 电信运营商LBS应用,分析手机用户移动轨迹(Map-Reduce)
第5节 电信运营商用户分析,通过通话指纹判断重入网用户(map-Reduce)
第6节 电子商务推荐系统设计(Map-Reduce)
第7节 更复杂的推荐系统场景(Mahout)
第8节 社交网络,判断微博用户关系亲疏程度,发现社区(Pig)
第9节 在社交网络中衡量节点的重要程度(Map-Reduce)
第10节 聚类算法应用,分析优质客户(Map-Reduce,Mahout)
第11节 金融数据分析,从历史数据中提取逆回购信息(Hive)
第12节 通过数据分析制定股票策略(Map-Reduce,Hive)
第13节 GPS应用,签到数据分析(Pig)
第14节 Map-Reduce全排序实现和优化
第15节 中间件开发,让多个Hadoop集群协作起来 |