Dr. Hua Peng (彭华)StataCorp LP 软件工程总监 |
Dr. Hua Peng has a PhD in mathematics from Brandeis University. He joined StataCorp LLC in 2004 as a software developer and is now the Director of Software Engineering. His areas of responsibility include Unicode, the Mata language, Stata/MP, Stata's Do-file Editor, and more. |
连玉君中山大学岭南学院金融系 副教授 |
中山大学岭南学院金融系副教授及硕士导师。毕业于西安交通大学,获经济学博士学位。是国内知名的青年学者。研究领域为金融计量和公司金融,尤其擅长Stata数据分析和编程。他已经在China Economic Review、经济研究、管理世界、经济学季刊、金融研究、会计研究等期刊发表论文50余篇。连玉君教授已经应邀在中国人民大学、武汉大学、上海财经大学等25所高校讲授过“高级计量经济学与stata应用”、“金融计量”、“实证金融”等课程和专题讲座。多次应邀参加中国经济学年会、中国金融学年会,以及中国留美经济学会年会,并参与论文研讨。 |
王存同中央财经大学社会发展学院 教授 |
人口学博士、教授。博士毕业于北京大学(与University of Michigan合作培养),博士后研究员就职于美国伊利诺伊大学(University of Illinois at Urbana-Champaign)。现主要任职于中央财经大学,从事社会统计及计量经济分析、人口健康学、人口社会学、人口经济学等领域的研究与教学。2013年入选教育部新世纪优秀人才计划,现为中央财经大学青年科研创新团队负责人,兼任国家人口计生委综合改革专家组专家、美国人口学会(PAA) 会员、国际人口联盟(IUSSP)会员、IUSSP社会科学定量方法培训专家组成员、北京大学社会科学方法培训特聘教授、中国性学会青少年性健康教育常务委员、美国伊利诺伊大学及芝加哥大学合作研究员。曾在SSCI/SCI索引期刊发表研究论文20余篇、在《中国社会科学》《社会学研究》《中国人口科学》等中文核心期刊发表定量研究论文40余篇,出版著作4部;主持国家社科基金项目2项、横向课题12项;以子课题负责人身份参与国家重大自然科学基金2项、国家部委横向课题10余项。 |
李春涛中南财经政法大学金融学 教授 |
爬虫俱乐部创始人,香港大学博士,中南财经政法大学金融学教授,博士生导师。李春涛教授有15年的Stata编程经验,编写过ttable2、chinafin、cntrade、eventstudy、psemail等Stata命令,这些命令让中国的股票日交易数据、日内分时数据和上市公司财务数据免费且唾手可得,让Stata可以发送电子邮件,让中文地址和经纬度轻松转换等。李教授主要的研究方向为公司治理和企业创新,在Journal of Comparative Economics、International Journal of Auditing、Stata Journal、《经济研究》和《金融研究》等期刊发表论文近30篇。 |
陈堰平雪晴数据网 创始人 |
雪晴数据网创始人,北理工大数据创新学习中心导师团成员,2017 年 1 月获“微软最有价值专家”称号。毕业于中国人民大学统计学院,曾先后任新华社指数中心技术总监、SupStat Analytics 中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为微软、联想、丰田、惠普、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通等机构做过数据科学方面的培训和咨询。曾开发贝叶斯动态线性模型的 R 包 ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R 语言临床数据分析》等。 |
薛原爬虫俱乐部 高级成员 |
爬虫俱乐部高级成员,中南财经政法大学金融学院金融学硕士研究生,擅长Stata编程、正则表达式、字符串处理、网络爬虫等技术。参与过chinagcode、chinaaddress、cnintraday、cnstock、subinfile等命令的编写,实现了中文地址与经纬度之间的转换、中国上市公司股票代码和分时交易数据的获取以及修改文本文件。参与了中国高校财经、管理与综合类期刊灌水排行榜以及各高校引用次数最多十篇文章排行榜的发布工作。 |
俞俊利《会计史学刊》 副主编 |
上海交通大学工商管理博士后、南京大学管理(会计)学博士,上海市晨光学者、《会计史学刊》副主编、国际会计史研究中心研究员、工商管理一流学科成员、香港中文大学访问学者。研究领域为量化文化(文学、历史)与治理;大数据与财务信息系统;熟练运用Stata、SAS、Lisrel等统计软件及掌握SQL、Java、Python编程语言,从文本中提取史料分析研究,撰写了《诗歌、道德与治理——基于唐代科举的量化历史实证研究》、《宗法关系、权力分配与激励机制——基于<红楼梦>的家族治理证据》。荣获财政部会计学优秀论文奖、优秀学位论文奖、优秀博士毕业生等荣誉。承担或主要参加国家自然科学基金、教育部人文社会科学项目、国家博士后面上资助项目、国家博士后特别资助项目、财政部全国会计科研课题等。 |
彭文威小花经济学术 创始人 |
香港科技大学社会科学部 MPhil in Social Science、小花经济学术创始人,主要分享计量经济学方法应用,计量经济学等数据分析编程软件应用和原创应用开发以及国际前沿文献评论推文等。其很多订阅者是来自新加坡国立大学、香港科技大学、香港大学、清华大学、北京大学、中国社会科学院、复旦大学等国内顶尖院校及科研机构的教授和博士研究生。熟练掌握数据分析技能,特别擅长于应用计量经济学建模与数据分析,同时熟悉多种编程语言:Stata、Python、Julia、R、LATEX 等,也长于利用这些编程工具进行功能开发,比如制作Python 脚本程序,网络数据搜集(又称网络爬虫)等。 |
社会信息化、智能化的快速发展过程产生了极其丰厚的数据资源,也创造了数据科学跨越式发展的前所未有的机遇。数据价值驱动的社会对数据科学人才的需求猛增,特别是在政府、企业、高校与科研机构、新型产业所需的数据科学家需求量增长尤为明显。因此,掌握了大数据时代所需的计算科学与计算机技术,掌握了大数据挖掘与分析的理论与技能,才能创造性地发现数据问题和产出数据价值,才能真正成为数据社会科技发展的卓越人才。Stata软件是国际上最流行的数据分析、数据管理、数据呈现的整合型软件,该软件以其友好的人机界面,简单的编程语言和强大的功能,赢得了越来越多专业人士的关注和认可。为了探索前沿科学的应用领域,北京友万信息科技有限公司和爬虫俱乐部团队精心策划,国内外行业专家全程参与的“第一届Stata中国用户大会”,火热八月,扬帆起航,为业界搭建更广阔、更高端的产学研合作平台。届时,除了将汇集业界重磅专家、学者及领导外,值得期待的主题演讲和精选应用案例,在展示技术功能和应用的同时,力求能体现出国内Stata应用的深度和广度。
会议展望
2017年第一届Stata中国用户大会将于8月19日-20日在温州商学院召开。今年大会的主题是“Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata”。爬虫俱乐部创始人、中南财经政法大学教授李春涛,中山大学岭南学院教授连玉君及中央财经大学教授王存同、雪晴数据网创始人陈堰平、同StataCorp LLC软件工程总监 Dr.Hua Peng等业界大咖将出席盛会,带来业界的前瞻观点。
会议亮点
全程设十二大演讲主题,围绕Stata网络数据抓取和中文文本分析、方法及进展、进阶回归分析中应用、中文编码、函数、自动化报告与可重复研究及正则表达式等领域,覆盖经济学、金融学、会计学、计算语言学、新闻学、政治学、历史学、医药卫生等微观计量分析的热门应用领域。这些领域的研究,数据量大,来源千差万别,抓取和整理的难度很大,但是需求量很大,学者们缺乏一个交流的空间。虽然国外的Stata用户大会已经存在多年,但是中国用户遇到的问题又往往是中文的数据问题,不仅难以为国外同行所识别,也由于中文文本本身的特点(比如汉字之间没有空格)带来了更大的复杂性。大会期间特别安排了圆桌会议,让参会嘉宾与用户深入讨论能够进行零距离的交流。
用户诉求
近年来,中国的Stata用户群发展壮大得非常快,但是局限于语言本身的问题,Stata公司并没有能够很好地照顾中文用户的利益,比如最近的utf8编码将一个汉字当作三个英文字符的做法,以及Stata中文显示乱码的问题,这些也需要一个组织担当沟通的任务,我们因此希望组织一年一度的Stata中国用户大会,并向Stata原厂提出中文用户的建议。希望通过用户大会,使中国用户对Stata软件有更深入的认识,并在其工作岗位上发挥其强大的功能;同时,也希望Stata用户大会作为中国Stata用户的媒介与原厂更好联系,为所有喜爱Stata软件的专业人士以及相关学者搭建起沟通的桥梁。
Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata
演讲主题 | 演讲人 |
《Stata 15 新版本发布及新功能研讨》 | 彭华 StataCorp LP 软件工程总监 |
《内生性问题:方法及进展》 | 连玉君 中山大学 |
《putdocx与格式化输出》 | 李春涛 中南财经政法大学 |
《unicode与中文编码》 | 彭华 StataCorp LP 软件工程总监 |
《Stata函数》 | 彭华 StataCorp LP 软件工程总监 |
《Subinfile,网页源代码分析的神器》 | 薛原 爬虫俱乐部 |
《Stata自动化报告与可重复研究》 | 陈堰平 雪晴数据网 |
《分词与情感分析》 | 薛原 爬虫俱乐部 |
《文本分析在量化文史学研究中的应用—以<唐书>与<红楼梦>为例》 | 俞俊利 上海交通大学 |
《Stata、cURL交互与网络爬虫:以微博API为例》 | 彭文威 香港科技大学 |
《Stata数据清洗常用技巧》 | 彭文威 香港科技大学 |
《Econometric convergence test and club clustering using Stata》 | 杜克锐 山东大学 |
圆桌会议 | 主导人 |
讨论话题1: Stata的bugs及Stata 15 新版本特色功能 | 彭华、薛原 |
讨论话题2: Stata与中文的兼容性 | 彭华、陈堰平 |
讨论话题3: 用户提出问题,专家提供现场咨询 | 连玉君、李春涛 |
讨论问题4: 用户的需求 | 连玉君、徐青青 |
2017年8月19日 | |
时间 | 议程 |
8:00-9:00 | 参会登记、发放资料 |
9:00-9:05 | 开幕致辞 |
9:05-9:10 | 温州商学院领导 致辞 |
9:10-10:10 | 演讲主题: 《Stata 15 新版本发布及新功能研讨》 演讲人:彭华 StataCorp LP 软件工程总监 |
10:10-11:10 | 演讲主题: 《内生性问题:方法及进展》 演讲人:连玉君 中山大学 |
11:10-11:30 | 茶歇 |
11:30-12:30 | 演讲主题: 《进阶回归分析中的Stata应用》 演讲人:王存同 中央财经大学 |
12:30-13:30 | 午餐 |
13:30-14:30 | 演讲主题: 《putdocx与格式化输出》 演讲人:李春涛 中南财经政法大学 |
14:30-15:00 |
《文本分析在量化文史学研究中的应用—以<唐书>与<红楼梦>为例》 演讲人:俞俊利 上海交通大学 |
15:00-15:20 | 茶歇 |
15:20-16:20 | 演讲主题: 《unicode与中文编码》 演讲人:彭华 StataCorp LP 软件工程总监 |
16:20-16:50 | 演讲主题: 《Stata、cURL交互与网络爬虫:以微博API为例》 演讲人:彭文威 香港科技大学 |
16:50-17:30 |
圆桌会议: 讨论话题1(主导人:薛原、彭华): Stata的bugs及Stata 15 新版本特色功能 讨论话题2(主导人:彭华、陈堰平): Stata与中文的兼容性 |
2017年8月20日 | |
时间 | 议程 |
9:00-10:30 | 演讲主题: 《Stata函数》 演讲人:彭华 StataCorp LP 软件工程总监 |
10:30-10:50 | 茶歇 |
10:50-12:10 | 演讲主题: 《Subinfile,网页源代码分析的神器》 演讲人:薛原 爬虫俱乐部 |
12:10-13:30 | 午餐 |
13:30-14:30 | 演讲主题: 《Stata自动化报告与可重复研究》 演讲人:陈堰平 雪晴数据网 |
14:30-15:00 | 演讲主题: 《Stata数据清洗常用技巧》 演讲人:彭文威 香港科技大学 |
15:00-15:20 | 茶歇 |
15:20-16:20 | 演讲主题: 《分词与情感分析》 演讲人:薛原 爬虫俱乐部 |
16:20-16:40 | 演讲主题: 《Econometric convergence test and club clustering using Stata 》 演讲人:杜克锐 山东大学 |
16:40-17:20 | 圆桌会议: 讨论话题3(主导人:连玉君、李春涛): 用户提出问题,专家提供现场咨询 讨论问题4(主导人:连玉君、徐青青): 用户的需求 |
17:20 | 闭幕 |
    “爬虫俱乐部第六届Stata编程技术训练营-2017年8月16日至18日温州专场”即日起开始正式报名,此次培训课程内容覆盖了Stata基础与数据读入、各种数据库操作技巧、简单网络爬虫入门与工具应用、回归分析和结果分析等实用技术。培训课程经过爬虫俱乐部团队多年的精心策划,通过选择合理的内容,合适的顺序,引用大量的案例,旨在帮助大家在较短的时间内掌握Stata软件与金融计算的核心技术和方法。
第一部分:Stata初步与数据读入
1)熟悉界面
2)读入Stata格式的数据
3)寻求帮助
4)DOS命令
5)Winexec调用windows系统
6)Copy 命令
7)常用命令
8)日期定义
9)函数
10)egen函数
11)stata数据文件
12)读入TXT、CSV文件
13)Excel文件
14)固定宽度的txt文件
15)分行显示的txt文件
16)基金经理变更案例
17)Music案例
18)CSSCI案例
第二部分:宏与循环
1)Local
2)Global
3)Macro extended function
4)While 循环
5)Forvalue 循环
6)跳出循环的continue 和continue, break
7)NBER案例
8)年报案例
9)Foreach 循环
10)Wind2007案例
11)多个Excel和多个Sheet案例
12)Levels of
13)Fs
第三部分:数据库操作
1)数据的纵向合并(交易数据为例)
2)数据的横向合并 (财务数据为例)
3)数据长宽变换 (reshape)
4)起死回生(preserve restore命令)
5)文件Label
6)变量label
7)数值label
8)工业企业调查数据库使用方法
9)专利数据库使用方法
10)上市公司高管数据库
第四部分:Post命令与网络爬虫入门
1)post 原理
2)定义post
3)计算同步性和Beta
4)新浪公告数据抓取
5)P2P平台数据抓取方法
6)抓取银监会银行牌照数据及后处理
第五部分:回归分析及结果输出
1)基本统计信息 tabstat与tabstatmat
2)ttable2
3)相关系数矩阵 pwcorr
4)简单线性回归 regress
5)interaction term
6)logit、Probit and Tobit
7)xtfmb
8)esttab与格式化输出结果
9)rtf系列命令
       本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。希望通过本次培训,使培训人员对Stata软件有更深入的认识,并在其工作岗位上发挥其强大的功能;同时,也希望通过本次培训,为所有喜爱Stata软件的专业人士搭建起沟通的桥梁。
培训时间及地点
       时间:2017年8月16日至18日(周三-周五上午),共2.5天。
       地点:温州商学院
培训对象
       
国内高校教师、硕士生、博士生、科研院所科研人员、社会团体及Stata爱好者。
培训详细信息请点击:《爬虫俱乐部第六届Stata编程技术训练营-2017年8月16日至18日温州专场》
★ 参与本次培训的学员可免费参与Stata用户大会。
       Stata因为功能强大、操作灵活、开放的平台和强大的兼容性,越来越受到广大中国用户的好评,用户规模迅速攀升,用户覆盖经济、管理、生物、历史、法学、劳动、人口、地理、环境、教育和心理学等各个学科门类。近年来,随着大数据产业的兴起,Stata也加强了其在文本分析、矩阵语言等领域的功能模块,在企业界的用途也越来越广泛。随着用户群体的扩大,在使用Stata的过程中,中国用户也积累了一系列宝贵的经验,也遇到一些使用中的问题,迫切需要建立一个交流切磋的平台。在大数据产业方兴未艾之时,更需要建立学术界与产业之间的沟通,让Stata用户更好地服务于大数据产业界广泛的需求。Stata在开发过程中,难免有未能充分考虑中国用户使用习惯的设计,也迫切需要建立中国用户与Stata公司之间的定期沟通和磋商机制。为此本次用户大会特设会议投稿,我们诚邀广大用户向会议投稿,这些稿件包括如下,但是不局限于如下的类型:
              (1)用户编写的Stata命令
              (2)用户数据处理中遇到的问题
              (3)结果输出的格式化、自动化问题
              (4)关于数据处理的需求
              (5)网络数据挖掘需求或应用前景
              (6)文本分析中遇到的问题、经验和教训
              (7)Stata软件遇到的Bug
              (8)Stata与windows\unix\IOS系统的兼容性和外部程序的调用
              (9)对Stata新版本的期望
       对优秀的稿件,我们将安排大会演讲,并可获得会务组赠送的精美礼品一份。投给大会的优质稿件,我们将安排小编润色后,以投稿者的名义通过爬虫俱乐部微信公众号推送,欢迎广大Stata用户及爱好者踊跃投稿!
       来稿请投递至:marketing@uone-tech.cn,邮件标题标注为:Stata用户大会投稿。
      Stata是一套集数据分析、数据管理以及绘制专业图表于一体的整合性统计软件,功能非常强大,具有操作灵活、简单、易学易用、运行速度极快等优点。通过Stata可以进行各种预测,包括线性预测、非线性预测、动态预测等;或者对参数和模型进行各种检验,比如似然比、Hausman检验、Granger因果检验、嵌套Cox检验等。除了Stata内设的OLS、GLS、NLS、ML、TSLS、GMM等估计方法之外,用户还可以自己设定似然估值函数进行NLS、ML估计和GMM估计,或者利用MATA的最优化模块进行数值最优化或者模型最优化。
Stata能为您做什么?
贝叶斯分析,IRT,Unicode,处理效应,整合excel,多层次模型
标准方法统计工具
基本表格和总结、ARIMA、线性回归、广义线性模型(GLM)、对比和比较、样本选择、案例对照分析、ANOVA和MANOVA、时间序列平滑、聚类分析、功率分析
高级统计工具
多层模型、动态面板数据回归、二进制、计数和审查结果、多重替代法、Treatment effects、贝叶斯分析、生存分析、结构方程建模、ARCH、调查数据、精确统计
Stata 15 版本已更新,软件详细信息请点击: Stata——数据统计分析软件包
北京友万信息科技有限公司作为Stata软件在中国大陆的指定经销商及合作伙伴,
希望能给Stata中国用户提供更多服务与支持,并帮助中国用户建立完善的软件售后服务体系。
★ 基础服务:
1、Stata软件购买服务;
2、Stata软件升级服务;
3、Stata软件培训服务;
★ 附加服务:
4、Stata软件定制培训计划;
5、Stata软件研讨会;
6、Stata软件中国用户大会;
★ 增值服务:
7、提供数据处理/大数据分析/统计咨询及网络爬虫服务;
8、提供软件管理平台服务,本地部署让管理更便捷;
9、提供经管类案例库,可实时导出PPT格式用于老师讲课与教学相结合;
10、针对学校和科研机构提供内训服务, 行业专家上门服务;
专享礼遇:
1、凡参加本次用户大会,一年内购买Stata IC/SE/MP软件单机版本,给予10%价格优惠。
2、凡参加本次用户大会,一年内购买Stata IC/SE/MP软件实验室版本,给予10%价格优惠,并
免费赠送Stata视频培训DVD学习课程一套。
3、构建包括Stata软件在内的大数据实验室软件,项目完成后免费奉送现场Stata为期三天培训
券1张。邀请免费参加年度Stata用户大会。
附:该活动的解释权在法律规定的范围内归北京友万信息科技有限公司所有。                                   
主办单位:
北京友万信息科技有限公司 — 简称:友万科技。英文全称:Beijing Uone Info&Tech Co.,Ltd,简称:Uone-Tech,是一家专注于引进国外市场软硬件
产品的高科技企业。通过聚焦客户深层次需求,将国外先进的信息技术、科研成果及企业经验与传统教学和科研领域的具体实际相结合,提供全方位的解
决方案,帮助提高教学水平和科研能力,与时代接轨,与国际接轨,使教学和科研在激烈的市场竞争中始终保持竞争力。
爬虫俱乐部
(微信公众号) — 是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。爬虫俱乐部团队是stata技术控,专注于分
享使用stata的技术,解决stata相关问题。提供编程技术咨询,编程和实证培训。“爬虫俱乐部”为提高爬虫君们的技术需求,以每天至少更新一个Stata
技术的速度在为爬虫君们服务。
承办单位:
温州商学院 — 温州商学院位于温州市高教园区,设9个二级学院,23个本科专业和5个专科专业,全日制在校生9000余人。学校是由原温州大学城市学
院转设为独立设置的普通本科院校,是目前浙南地区唯一一所商科类本科院校。携手国际名校、传承温商精神,旨在培养具有国际视野、现代商业精神的
高素质复合应用型人才。
会议时间: 2017年8月19-20日
会议费: 800元/人(食宿差旅自理)
培训时间: 2017年8月16-18日
培训含会议费: 3600元/人 (食宿自理差旅)
(参与本次培训的学员可免费参与Stata用户大会。学员可申请全国通信和信息技术创新人才培养工程《Stata数据挖掘与分析高级工程师》职业技术
水平证书。该证书可用作岗位聘用、任职、定级、晋升,通过考核后即可获得证书。需准备一张一寸或两寸照,另交考试费、证书工本费共400元。)
与会地址: 温州商学院
联系人: 陈老师
手机/WeChat: 18600528290
QQ: 2196837879(验证信息请填写:Stata用户大会)
电话: 010-56451126、010-56451129
传真: 010-56451128
邮箱: marketing@uone-tech.cn
★ 报名回执表下载请点击
电话:+86-10-56548231
传真:+86-10-56548231
爬虫俱乐部
温州新金融研究院
北京理工大学大数据创新学习中心