R语言数据挖掘、机器学习、文本分析案例实战
       2017年7月22日--7月23日 北京理工大学(具体教室会另行通知报名学员)
       (时间安排:外地参会人员21日报到,22日~23日正式会议,24日答疑,学员可针对自身情况选择参加 )
主办方:雪晴数据网
       雪晴数据网是以数据科学为主题的在线社区,运营实体为绘辰科技(北京)有限公司。网站包含视频课程、问答、资讯等模块。雪晴数据网专注于大数据、数据分析、数据挖掘、数据科学技术的普及和推广,致力于向数据科学从业者提供沟通平台。
雪晴数据网已成为Microsoft高级分析培训团队的在中国大陆地区唯一的合作伙伴,也是RStudio公司在中国大陆唯一的合作伙伴。
协办方:北京理工大学大数据创新学习中心、北京友万信息科技有限公司、爬虫俱乐部
       本次研讨会采取深入浅出的方法,先以简单的案例引入R数据分析的基本原理,随后重点讲解多种常用单元的功能和特性,以及有R数据分析与数据的实用技术和处理方法,结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升与会者解决复杂问题的能力。学完课程之后,学员可以用R作为工具独立完成数据挖掘的整个流程。
       有别于其他培训机构将机器学习、数据挖掘技术拆解开讲解的方法,我们以全流程的完整案例讲解利用R完成数据整理、探索性数据分析、建模分析、模型评估、报告展示等环节。
       有别于有些培训机构将R语言的培训做成编程语言和函数介绍的做法,我们将R语言的应用与业务实际相结合。
       我们还有动手实践环节,有老师和助教解答学员在操作中遇到的问题。
       还将针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升学员解决复杂问题的能力。
       学习结束后,学员可得到本次课程的全程视频,以便进一步学习。
为什么要学R语言,学了以后有什么好处?
       不论您是在互联网行业,还是在银行,抑或是在高校里做教学科研的工作,有可能会接触到数据处理、数据建模的问题。有可能在你组织机构内部的数据不够,你需要从网上爬取更多的数据。在将你的业务问题转化为数据分析的问题之后,就需要使用工具来帮你做数据处理和建模的工作。相对于SPSS来说,R更加灵活,包含有从数据获取、数据整理、建模、可视化展示、自动化报告等完整的分析流程所需要的功能。相对于C++、Java这些通用编程语言来说,R是专门为数据分析的任务设计的,语法更简洁,学习成本更低,功能更强大。根据我们多年的经验,非计算机专业的人学习R语言,会更快上手。
网上有很多R语言的课程,为什么要选雪晴数据网?
       市场上有各种R语言的课程,各有各的特色及优点,有的还是免费的,这里我们不比较各自的不同,就说说我们有什么优点吧:
       ● 优秀的讲师团队:我们的讲师不但有多年的工作经验,也有丰富的教学经验,不但技术过硬,也善于用通俗的语言讲解复杂的知识点,更有耐心为学员解答学习过程中的问题。每次课程我们都会反复研究,花大量时间准备课程材料,力求用最适合的案例和方式为学员讲解。
       ● 案例教学的方法:我们从2013年开始举办公开的技术培训,也曾多次给企业做内部培训,从多年的教学实践中,我们发现,用传统以知识点讲解为主线,案例为辅的方式,效果并不好。学员反映,听了后面忘前面,学了一堆东西却不知道怎么用。经过多次尝试,我们摒弃了这种教学方式,采用以案例为主线,在案例中讲解知识点的方法,在一个案例中串联多个知识点,利用遗忘曲线的原理,我们用多个案例重现数据分析的流程,学员自然会举一反三了。
       ● 选取有实用价值的案例:iris数据集、titanic数据、NBA比赛数据跟我们的工作和科研有什么关系?基本没关系,那我们在讲课的时候就不会用这种数据。而且我们教的是如何使用数据分析技术,并不是教你怎么写代码,我们不培养码农的。所以我们选择的案例,都是有现实的商业意义,或者科研价值。在讲解过程中,不但告诉你代码怎么写,还会教你怎么解决问题,为什么要这么做。
       ● 贴心的助教制度:我们每次开课都会有助教,因为是手把手的课程,助教的存在,就是为了能解答您的问题,确保您有学会,满载回家。而且我们的助教都有实战经验,有的来自业界,有的可能就是前几批的优秀学员,我们也欢迎您以后加入我们的助教或讲师团队。
       ● 对课程品质的坚持:我们在不同场合讲解过课程的内容,不断调整打磨课程,即使是相近的主题,我们也会对课程内容和案例进行升级,挑选出最适合市场趋势的案例和技术来讲解。
报名参加培训之后,还能得到什么福利?
       ● 报名参加我们的课程,就自动成为我们的VIP会员,以后购买我们的线下或线上课程都有优惠。
       ● 加入到我们的VIP微信群、QQ群中,以后在学习中如果遇到问题,我们的老师和助教会帮忙解答
       ● 一些不方便大范围分享的演讲视频和课程视频,我们会优先分享给VIP会员
       ● 我们组织的内部分享会,VIP会员有优先报名权
没有学过R,也可以来上课吗?
       当然可以。其实每次都有对编程一无所知的小白来参加我们的课程,他们甚至对电脑的很多知识都不甚了解,经过两三天的课程,不少人不但跟下来了,还很有收获。对R有一点认识的朋友相信一定可以得心应手,针对完全没有碰过R的新手,报名之后我们会推荐您R的基础在线课程进行课前的练习,也可以提前一天报到,参加我们的课前辅导。
       从事互联网、金融、医疗、生态、经济、统计、银行、通信、环境行业的数据分析从业人员,以及相关企事业单位技术骨干、科研院所研究人员,和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员。
陈堰平,雪晴数据网创始人,北京理工大学大数据创新学习中心导师团成员,2017年1月获“微软最有价值专家”荣誉称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为国家统计局、微软、惠普、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通、国家检察官学院等机构做过数据科学方面的培训和咨询。曾开发贝叶斯动态预测模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲的在线公开课《R语言数据分析入门》、《R语言大规模数据分析实战》已在多个平台上发布,累积学习人数过万人。
       在职人员2000元/人,学生1600元/人(含会议注册费、资料费、场地费)。食宿费用自理。
       参与雪晴数据网奖学金计划,更可以减免大笔学费,只要你足够勤奋,可以免费学!!
       1. 为雪晴数据网(www.xueqing.tv)投稿的用户(原创或翻译文章),可以获得代金券(按文章质量,奖励50到200元不等),以抵扣线上线下课程学费,投稿请联系管理员 contact@xueqing.tv
       2. 注册并登录雪晴数据网,进入用户中心,然后进入邀请页面(http://www.xueqing.tv/me/invite ),获得邀请链接后,转发给好友,如果对方成功注册,双方都可获得奖励,可抵扣学费。
       3.累计五天(可不连续)转发本课程通知到自己朋友圈,并附上推荐理由,截图发给我们的工作人员,报名可优惠200元。
       现场班老学员8折优惠
       三人以上同时报名9折优惠
       六人以上同时报名8折优惠
       本次讨论会采取“线上+线下”的方式,雪晴数据网已经上线了数门在线课程,免费向公众开放,我们会在课程里介绍R语言的基础知识。参加线下课程的学员,除了可以学习线上免费课程,还可以在线下学习更加深入的行业案例,并在课后得到线下课程的视频。
       R语言的介绍及基础语法:如何学习R,R的数据结构,控制语句等
       读写数据:从文件、网络、数据库等数据源读取数据,保存数据到文件、数据库
       数据整理入门:数据的变换、重塑、拆分合并以及汇总
       数据可视化:基础绘图系统、lattice、ggplot2等介绍
       请于线下课程开始之前自己学习以下课程
       http://www.xueqing.tv/course/1
       http://www.xueqing.tv/course/64
       http://www.xueqing.tv/course/31
       http://www.xueqing.tv/course/66
       http://www.xueqing.tv/course/67
       http://www.xueqing.tv/course/69
       时间:2017年7月22日(周六)~23日(周日) 地点:北京理工大学
第一天
第一讲
R语言介绍及R语言基础语法
1. 什么是R 及如何学习R
2. Rstudio,扩展包,工作空间
3. 数据对象
4. 向量化操作
5. 函数和控制语句
6. R命令提示符及R 脚本文件
涉及知识点:
dplyr包:数据整理、筛选、汇总
ggplot2:数据可视化
探索性数据分析:交叉表
预测性分析:利用指数平滑等方法预测销售量
knitr包:自动化报表
flexdashboard包:仪表盘
网络爬虫
文本分析
案例一: 针对一份电子商务网站的订单数据,从产品、客户、地区等维度来分析销售额和利润,也可以时间的维度纵向分析销售趋势。
案例二: 抓取中国政府网历年政府工作报告,并做文本分析
第二讲
数据整理与数据可视化
1. 数据变换、重塑及拆分合并
2. 汇总数据、字符串操作、日期操作
3. R 语言中的可视化函数
4. 单变量的特征 、比例的构成
5. 多变量的关系、展现时间的变化
第三讲
用R做可重复研究和自动化仪表盘
1. 如何用R在重复研究中自动生成分析报告
2. 可视化展示:并用shiny包创建基于Web的动态仪表盘,实现各地区销售额动态比较图
3. 用knitr编写自动化报告
第四讲
网络爬虫与文本分析
1. 利用rvest包爬取页面
2. 分词、词频分析、词云等文本分析
第二天
第五讲
初等统计方法及线性回归模型
1. 简单线性回归
2. 回归诊断
3. 多元回归
4. 主成分分析等等
涉及知识点:
glm、glmnet、rpart、xgboost等函数和包的使用
因子变量的处理
共线性的识别和处理
Logistic回归模型系数的商业理解
Microsoft R Server的介绍
案例三: 某连锁餐厅为提高营业额,做了一次市场调查,根据收集到的数据,分析是哪些因素影响营业额,并提出改善经营的建议
案例四: 预测贷款逾期者(银行业) -- 某银行希望根据客户过去的贷款数据来建模,以便用模型来预测新的贷款者,核贷后会逾期的机率,以做为银行是否核贷的依据,或提供给客户其他类型的贷款产品。
案例五: 零售业销售促销(零售业):此案例的目的是想根据零售产品过去的促销记录,利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。
第六讲
Logistic回归及多分类Logistic模型
1. logistic回归原理
2. 实现原理及输出解释
3. 无序多分类的logistic回归模型
第七讲
数据挖掘模型
1. 基于树的模型:决策树、随机森林
2. boosting方法:adaboost、XGBoost
3. 神经网络与深度学习
第八讲
利用Microsoft R Server突破内存限制做海量数据挖掘
1. Microsoft R Server 9.1的下载及安装
2. Microsoft R Server中大数据包的介绍
3. 案例演示
       请填写表格后于7月14日前,发送“报名回执表+支付截图”至邮箱:peixun@uone-tech.cn或直接发送给联络员,邮件主题为:“友万科技R语言20170722+姓名+单位”。
方式一: 对公转账
       开户名 绘辰科技(北京)有限公司
       开户银行 中国工商银行股份公司北京大钟寺东路支行
       账号 0200151609100034763
方式二: 支付宝
       账号 pay@xueqingtv.com
       户名 绘辰科技(北京)有限公司
方式三: 现场缴费
       外地学员请于7月21号提前报到,北京学员可于22号早上8点~8点半报到,缴费并领取发票和纸质邀请函,以及上课教材。
       由于21号早上现场人比较多,鼓励北京学员也于21号报到。
       问:是否能开正规发票?
       —— 答:我们是正规公司,可以开具增值税普通发票和增值税专用发票,用户根据需要来选择发票类型。
       问:我是高校老师,是否可以到现场刷公务卡?
       —— 答:可以,我们有POS机,可以打印小票。
       问:我是小白,完全不会编程,可以报名参加吗?
       —— 答:你可以先看看我们网站的视频课程入个门,再决定是否报名,另外,希望你有大学数学的基础,否则会很吃力。
       问:是否提供纸质版会议邀请函?
       —— 答:提供,请与我们的工作人员联系。
联系人:陈洁老师
手机/微信:136-6072-3699
QQ :529698127       验证信息请填写友万科技Python培训
Email:peixun@uone-tech.cn
相关新闻链接:
雪晴数据网R语言数据挖掘实战案例研讨会
                         R语言数据挖掘实战案例研讨会回执表下载
                         R语言机器学习核心技术案例实战研讨会(往期风采)
北京友万信息科技有限公司,英文全称:Beijing Uone Info&Tech Co.,Ltd ( Uone-Tech )是中国大陆领先的教育和科学软件分销商,已在中国300多所高校建立了可靠的分销渠道。拥有最成功的教学资源和数据管理专家。如需申请软件采购及老版本更新升级请联系我们,咨询热线:010-56548231 ,咨询邮箱:info@uone-tech.cn 感谢您的支持与关注。