曙海教育集团
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 
 
     班.级.规.模.及.环.境--热.线:4008699035 手.机:15921673576( 微.信.同.号)
         实战授课,培训后免费技术支持。
     上.课.时.间.和.地.点
  上课地点:【石家庄分部】:河北科技大学/瑞景大厦 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【广州分部】:广粮大厦 【西安分部】:协同大厦 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路)【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【北京分部】:北京中山学院/福鑫大楼 【成都分部】:领馆区1号(中和大道)
最近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服!
     实.验.设.备
       ☆资深工程师授课
        
        ☆注重质量 ☆边讲边练

        ☆合格学员免费推荐工作
        ★实.验.设.备请点击这儿查看★
     质.量.保.障
 

        1、免费重修;
        2、课程结束后,授课老师留联系方式,保障培训效果,免费技术支持。
        3、推荐机会。

 
课程大纲
   
 
  • 课程详细介绍

    R语言基础

    1.1 基础语法入门

    * 什么是 R

    * 如何学习 R

    * 如何得到帮助,相关资源和书籍

    * RStudio,扩展包,工作空间

    * 数据对象

    * 向量化操作

    * 函数和控制语句

    摘要:讲解R的基本操作知识,了解R的特点、资源获取方式,并掌握基本的程序编写

    案例和练习:使用R语言完成若干欧拉项目(euler project)

     

    1.2 数据获取

    * 本地文档的读写

    * 连接数据库

    * Web数据抓取

    * API数据源

    * 其它数据资源

    摘要:R语言如何从各种方式读取数据,通过基本的WEB知识进行网页抓取,连接数据库,通过sql语句调用数据,从本地读取excel等各种文件数据。

    案例和练习:使用网页抓取和API获得豆瓣网站上的数据。

     

    1.3 数据整理 

    * 数据变换

    * 数据重塑

    * 拆分合并

    * 汇总数据

    * 字符串操作

    * 日期操作

    摘要:讲解R语言如何操作数据,能对数据进行自由的操作转换,特别是对于字符串和日期的操作处理。

    案例和练习:分析NBA数据,判断金融市场中的一月效应,找出QQ群中的话唠

     

    1.4 数据可视化 

    * R 语言中的可视化函数

    * 单变量的特征

    * 比例的构成

    * 多变量的关系

    * 展现时间的变化

    * 地理信息

    摘要:讲解R语言中基础绘图函数和高级绘图包的使用,理解可视化探索的各种方法

    案例和练习:使用图形来对之前的NBA数据进行分析

     

    R数据挖掘(一)

    2.1 数据挖掘工业流程

     

    摘要:讲解数据挖掘的主要任务,各挖掘方法的简要介绍和应用场景,典型的工作流步骤,以及R和数据挖掘之间的关系。

     

    2.2 先修统计知识 

    * 描述统计

    * 推断统计

    * 统计模拟计算

    摘要:讲解必要的统计学知识,了解各种概率分布、统计描述函数,以及学习假设检验的原理和应用

    案例和练习:报摊进货决策

     

    2.3 挖掘预处理 

    * 数据的类型

    * 数据的可能问题

    * 数据预处理的方法

    摘要:讲解分析前的数据处理工作,包括如何识别数据中可能的问题,如数据缺失和数据噪声,如何解决这些问题。

     

    2.4 线性回归

    * 简单线性回归

    * 回归诊断

    * 多元回归

    * 非参数回归

    摘要:讲解最经典的回归分析方法,即对连续数值进行预测,学习其基本原理和前提假设,以及如何在R中实施回归

    案例和练习:葡萄酒的定价分析

     

    2.5 logistic回归

    * logstic回归原理

    * 实现原理

    * 输出解释

    摘要:讲解logistic回归,即对离散的类别数据进行预测,了解系数解释和模型的意义

    案例和练习:是否能升入大学的数据预测

     

    2.6 模型评价 

    * 回归模型评价

    * 分类模型评价

    * underfit和overfit

    摘要:讲解如何对分类模型和回归模型进行评价,学习过度拟合与拟合不足的区别,并如何规避这些陷阱

    第三天:R数据挖掘(二)

    3.1 K近邻方法 9:00-10:00

    * 最近邻分类器原理

    * 各种距离的定义

    * 使用KNN对乳腺癌数据分析

    摘要:学习KNN分类方法的原理和实现过程,它的优点缺点,以及如何在R中的函数应用

     

    3.2 决策树方法和集成学习 10:00-12:00

    * 理解决策树算法

    * 决策树和回归的结合

    * 随机森林

    * 提升算法

    摘要:学习决策树分类器,以及在其基础上的装袋算法、提升算法、随机森林

     

    3.3 K均值聚类 13:00-14:00

    * K-means聚类

    * 改进算法

    * K的选择

    摘要:学习用kmeans来进行无监督学习,了解其原理和改进方法,并了掌握如何选择关键参数

    案例和练习:对青少年群体进行分群

     

    3.4 推荐算法 14:00-15:00

    * 协同过滤算法简介

    * 奇异值分解

    摘要:介绍基本的协同过滤方法,并使用奇异值分解来避免高维问题

     

    3.5 文本挖掘入门 15:00-17:30

    * 文本挖掘的基础术语

    * 朴素贝叶斯方法

    * 文本挖掘案例:垃圾邮件过滤、红楼梦文本分析、航空公司满意度分析

android开发板
linux_android开发板
fpga图像处理
曙海培训实.验.设.备
fpga培训班
 
本课程部分实验室实景
曙海实验室
实验室
曙海培训优势
 

        Troubleshooting Java Applications
                Classpath Errors
                Class Loaders
                Common Java Errors
        Troubleshooting Servers
                Native Libraries
                Threading Architecture
                Work Managers
                Deadlocks
                Overload Protection
                Deployment Problems
        Troubleshooting JDBC
                Data Source Management
                Diagnostics
                Debug Flags
                Connectivity Problems
                Connection Leaks
                Database Availability
        Troubleshooting JMS
                Management
                MBean Hierarchy
                Message Logging
                Diagnostics
                Debug Flags
                Overload Protection
                Lost Messages
                Duplicate Messages
        Troubleshooting Security
                SSL Internals
                Keystore Management
                Debug Flags
                Common SSL Problems
                Certificate Validation
                Embedded LDAP
                Security Audit
                Common LDAP Problems
        Troubleshooting Node Manager
                Internals
                Security
                Common Issues
        Troubleshooting Clusters
                Plug-in Configuration
                OHS Overview
                Plug-in Connectivity
                Plug-in Diagnostics
                Unicast Communication
                Replication Debug Flags
                Typical Replication Issues
热线:4008699035 手机:15921673576( 微信同号)
备案号:沪ICP备08026168号 .(2014年7月11).....................
友情链接:Cadence培训 ICEPAK培训 EMC培训 电磁兼容培训 sas容培训 罗克韦尔PLC培训 欧姆龙PLC培训 PLC培训 三菱PLC培训 西门子PLC培训 dcs培训 横河dcs培训 艾默生培训 robot CAD培训 eplan培训 dcs培训 电路板设计培训 浙大dcs培训 PCB设计培训 adams培训 fluent培训系列课程 培训机构课程短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班培训 南京 NS3培训 OpenGL培训 FPGA培训 PCIE培训 MTK培训 Cortex训 Arduino培训 单片机培训 EMC培训 信号完整性培训 电源设计培训 电机控制培训 LabVIEW培训 OPENCV培训 集成电路培训 UVM验证培训 VxWorks培训 CST培训 PLC培训 Python培训 ANSYS培训 VB语言培训 HFSS培训 SAS培训 Ansys培训 短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班 曙海 教育 企业 学院 培训课程 系列班 长期课程列表实践课程高级课程学校培训机构周末班 短期培训系列课程培训机构 曙海教育企业学院培训课程 系列班