返回
顶部

邀请函下载 Python爬虫技术与机器学习实战研讨会





       Python作为一门面向对象的编程语言,简洁的语法使得编写数十行代码即可实现爬虫功能,获取海量互联网数据。使用Python来编写爬虫实现简单且效率高,同时爬取的数据可以使用Python强大的第三方数据处理库来进行分析,最重要的是学习成本低,如此之好的东西怎能不学习呢?为提升相关科技工作者的技术水平,北京理工大学大数据创新学习中心特联合绘辰科技(北京)有限公司(即雪晴数据网)举办Python爬虫与机器学习应用案例研讨会的专题讨论会议。

会议主题


        Python爬虫与机器学习应用案例研讨会

时间地点


        2017年6月2日-- 6月4日 北京理工大学,理工国际教育交流大厦
       (时间安排:外地参会人员6月1日报到,2日~4日正式会议,2日~3日晚上安排答疑)

主办机构


主办方:雪晴数据网
       雪晴数据网是以数据科学为主题的在线社区,运营实体为绘辰科技(北京)有限公司。网站包含视频课程、问答、资讯等模块。雪晴数据网专注于大数据、数据分析、数据挖掘、数据科学技术的普及和推广,致力于向数据科学从业者提供沟通平台。
雪晴数据网已成为Microsoft高级分析培训团队的在中国大陆地区唯一的合作伙伴,也是RStudio公司在中国大陆唯一的合作伙伴。

企业培训介绍
线下培训介绍

协办方:北京友万信息科技有限公司北京理工大学大数据创新学习中心

合作出版社:清华大学出版社,中国人民大学出版社

会议目标


       本次研讨会采用全案例教学模式,通过理论知识+案例示范+练习,突出软件学习的应用性,从应用案例入手讲解知识点,既用简洁易懂的语言讲述理论方法,又同时进行实际数据挖掘分析演示。

研讨会特点


       ● 体系完整科学,可以系统化学习;
       ● 课程通俗易懂,可以让学员真正学会;
       ● 从零开始教学直到深入,零基础的同学亦可以学习;
       ● 例教学,用一个案例贯通爬虫到数据分析的整个流程,用多个案例来加深印象。

参会对象


       从事金融、医疗、保险、生态、卫生、计量、统计、银行、通信、环境、基金等与数据分析统计相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员,以及广大Python爱好者。

讲师介绍


曾有杰,人人车计算平台架构师及策略小组负责人,前搜狐大数据平台研发工程师,多年数据分析与开发的工作经验,擅长网络爬虫技术和自然语言处理,对大数据平台、数据挖掘有丰富的实战经验。

陈堰平,雪晴数据网创始人,北京理工大学大数据创新学习中心导师团成员,2017年1月获“微软最有价值专家”荣誉称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为国家统计局、微软、惠普、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通、国家检察官学院等机构做过数据科学方面的培训和咨询。曾开发贝叶斯动态预测模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲的在线公开课《R语言数据分析入门》、《R语言大规模数据分析实战》已在多个平台上发布,累积学习人数过万人。

主题安排


第一天
案例一
爬取某二手房网站某市在售二手房房源信息,然后分析该市二手房价格影响因素
第一讲
Python环境的搭建与基础语法
1. 安装anaconda套件
2. Jupyter Notebook的使用
3. 基本数据结构(列表、字典、元组)
4. 基本语法(条件、循环、函数、类)
第二讲
数据导入导出、数据整理与变换
1. 使用Pandas库导入/导出数据
2. 使用Pandas筛选、整理数据,分组汇总
3. 数据变换,重编码
第三讲
可视化与描述性统计
1. 饼图、柱形图、折线图、箱线图
2. 列联表与马赛克图
第四讲
Python爬虫技术初步
1. 网页结构分析
2. 网络协议
3. Beautiful Soup库的介绍
4. 使用Beautiful Soup写爬虫
第二天
案例二
抓取全国PPP综合信息平台项目信息

案例三
二手车定价模型

案例四
小额贷款公司用户信用评分
第五讲
Python爬虫技术进阶
1. Ajax异步请求数据的抓取
第六讲
Python机器学习
1. statsmodels库和scikit-learn库介绍
2. 主成分分析
3. 线性回归/ Logistic回归
4. 支持向量机
5. XGBoost算法
第三天
案例五
根据关键词在社交网络上抓取与汽车相关的新闻和评论,使用自然语言处理技术做汽车的舆情分析
第七讲
爬虫技术高级
1. 爬虫框架scrapy介绍
2. 架构概览
3. 使用xpath解析页面元素
4. 数据持久化方案(文件/数据库)
5. 爬取微博、知乎话题讨论结果
第八讲
机器学习与自然语言处理
1. 使用中文切词,TF-IDF提取文章关键词
2. 一种简单的统计方法判断文章的情感色彩
3. 使用朴素贝叶斯算法判断文章情感色彩

培训费用


       在职人员3200元/人,学生2500元/人。含会议注册费、资料费、场地费。食宿费用自理。

       参与雪晴数据网奖学金计划,更可以减免大笔学费,只要你足够勤奋,可以免费学!!

       与会者可申请全国通信和信息技术创新人才培养工程《数据挖掘与分析应用高级工程师》职业技术水平证书,通过考核后即可获得证书,需另交考试费、证书工本费共400元。

奖学金计划


       1. 为雪晴数据网www.xueqing.tv投稿的用户(原创或翻译文章),可以获得代金券(按文章质量,奖励50到200元不等),以抵扣线上线下课程学费,投稿请联系管理员 contact@xueqing.tv
       2. 参与北理工大数据创新学习中心的活动,表现优秀的学员,有机会免费学习。
       3. 注册并登录雪晴数据网,进入用户中心,然后进入邀请页面http://www.xueqing.tv/me/invite ,获得邀请链接后,转发给好友,如果对方成功注册,双方都可获得奖励,可抵扣学费。
       4.累计五天(可不连续)转发本课程通知到自己朋友圈,并附上推荐理由,截图发给我们的工作人员,报名可优惠200元。

优惠政策


       1. 现场班老学员8折优惠
       2. 三人以上同时报名9折优惠
       3. 五人以上同时报名8折优惠

报名方式


       请填写表格后于5月26日前,发送“报名回执表(邀请函中的附件2)+支付截图”至邮箱:peixun@uone-tech.cn或传真至(010)56451128,邮件或传真主题为:“Python20170602北京培训+姓名+单位”。

支付方式:


方式一: 对公转账
       开户名 绘辰科技(北京)有限公司
       开户银行 中国工商银行股份公司北京大钟寺东路支行
       账号 0200151609100034763

方式二: 支付宝
       账号 pay@xueqingtv.com
       户名 绘辰科技(北京)有限公司

方式三: 现场缴费
       外地学员请于1号提前报到,北京学员可于2号早上8点~8点半报到,缴费并领取发票和纸质邀请函,以及上课教材。
       由于2号早上现场人比较多,鼓励北京学员也于1号报到。

常见问题


       问:是否能开正规发票?
       —— 答:我们是正规公司,可以开具增值税普通发票和增值税专用发票,用户根据需要来选择发票类型。

       问:我是高校老师,是否可以到现场刷公务卡?
       —— 答:可以,我们有POS机,可以打印小票。

       问:我是小白,完全不会编程,可以报名参加吗?
       —— 答:你可以先看看我们网站的视频课程入个门,再决定是否报名,另外,希望你有大学数学的基础,否则会很吃力。

       问:是否提供纸质版会议邀请函?
       —— 答:提供,请与我们的工作人员联系。

联系方式


联系人:陈洁老师
手机/微信:136-6072-3699
QQ :529698127       验证信息请填写友万科技Python培训
Email:peixun@uone-tech.cn



相关新闻链接: Python爬虫技术与机器学习实战研讨会(雪晴数据网)

                         Python爬虫技术与机器学习实战研讨会邀请函+报名表下载