由爬虫俱乐部携友万科技举办的“爬虫俱乐部第五届Stata编程技术训练营”2017年北京专场于4月16日在北京理工大学大数据创新中心圆满落幕。
       北京的热情似火并没有影响大家学习的热情,为期三天的培训让大家收获满满。现场有来自北京大学、中国人民大学、天津大学、北京理工大学、中央财经大学、中南财经政法大学、吉林大学、武汉大学、对外经济贸易大学、河北经贸大学、重庆大学、湖南第一师范学院、山东财经大学、中国石油大学、河南大学、北京师范大学、华中师范大学、中山大学、江西财经大学、南开大学、青岛理工大学、首都经济贸易大学、北京工商大学、中国农业科学院农业信息研究所、中国农业科学院棉花研究所、北京市农林科学院农业信息与经济研究所的教师和学者一起参与了本次会议。
       本次会议内容秉承由简入深、删繁就简的原则,课程主要的内容覆盖了多种复杂数据的读取、各种数据整理的技巧、源代码脚本的快速处理、简单网络爬虫工具、利用正则表达式的文本处理技术和利用正则表达式的网络爬虫技术等实用技术。通过具体的案例对每部分技术进行讲解,使大家能够快速的掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。通过本次培训,让大家对STATA软件编程技术有了更深入的认识,并在其工作岗位上发挥其强大的功能。
       前两天由李春涛教授讲解Stata基础与DOS命令介绍、数据的读入、局部宏与全局宏的定义、宏扩展函数应用、系统常量的访问、循环格式、copy命令、post命令、以及回归与结果输出等。
       并通过用Stata整理CSSCI期刊目录、股价同步性与事件研究等案例来展示这些技术的运用方法。
       他还通过对上市公司公告的抓取、NBER工作论文的下载等案例讲解了Stata网络爬虫技术的整体思路,以及对网络信息与数据的抓取和抓取之后处理信息与数据的方法。
       在会议期间,会务组一如既往地安排了参会嘉宾现场操作与交流答疑环节,并提供了丰富的午餐及交流晚宴,让大家在学习的同时为所有喜爱STATA软件的专业人士搭建起沟通的桥梁。
       第三天,由薛原老师介绍了Stata中与正则表达式相关的字符串函数、元字符与匹配模式,并通过几个案例介绍了正则表达式在词频统计、网络爬虫中的运用。
       在热烈的掌声中,培训课程圆满结束。感谢爬虫团队提供丰富的培训内容;感谢李春涛教授和薛原老师的精彩讲解;感谢参会学员对我们工作的支持和理解;感谢北京理工大学大数据创新学习中心、雪晴数据网对本次会议的大力支持。
       为了保证培训课程质量,我们一直控制会议的规模,参会人数有限,导致有些老师和学者没有参加此次培训,请大家继续关注友万科技;继续关注爬虫俱乐部(微信公众号)。今后我们将携手定期举办Stata软件在编程及数据统计分析方面技能等培训、以及分行业的专题研讨会。
        Uone-Tech "智慧教育、创新科研" 2017,我们在路上……
相关新闻链接:
爬虫俱乐部第五届Stata编程技术训练营——2017年北京专场
                        爬虫俱乐部第四届Stata编程技术训练营——2017年武汉专场