跳转至

案例比赛

第三季 配对交易

展开查看详细信息

(1)背景介绍

配对交易原本是在以物易物的时代,就已经存在的一种寻求套利机会的交易策略,二十世纪七八十年代随着对冲基金的繁荣及电子化交易的发展,配对交易及可视为其一分支的统计套利,再一次在华尔街复兴,在低风险水平上实现了较高收益,很多投资机构和个人都使用了相关的投资策略。2002年以后,长期被使用的简单的距离模型(Distance Model)由于使用者众多,导致模型钝化,交易机会减少,收益率降低,投资市场对新的配对交易策略需求逐渐增加。近几年随着大数据、数据科学、计算机算法和人工智能等领域的发展,新的配对交易算法不断涌现,如何在海量的数据中提取有用的信息,将其数据化,并找到有效的特征,利用统计及机器学习的方法设计新型的配对交易算法,再次成为学术界和业界的关注焦点。

(2)目标

基于美国股票市场2000年至2015年数据,提取有效的特征和指标,设计市场中性的配对交易策略,实现稳健盈利。

(3)关于数据

锐思数据网站,美股数据库2000—2015年数据。(官方网站访问: http://www.resset.com  点击页面右侧的“RESSET数据库”链接后输入对应的用户名及密码进行登录。

(4)参赛形式

建议3-5人组队参赛,每队人数上限为6人。

(5)评选标准

最终呈现的案例分析报告,包括思路(清晰),方法(合理),结果(预测效果,可解释性),图表的使用以及写作是否规范等。

竞赛委员会中相关老师(至少三位)对每份报告统一打分评判,最后综合成绩评选出Finalist。

进入答辩环节的同学们收到通知后,准备ppt,按时答辩。答辩时的ppt及临场表现均作为考核内容。

(6)如何报名

有意愿参加比赛的同学,请自行商量组队。自行组好队后,由队长将小组信息以Excel表格格式发送至官方邮箱,格式请参考下例:

队伍名称 超越队
姓名 专业 年级 学号
组长 张三 应用统计 研一 2120180001
组员 李四 统计学 研二 2120180002
组员 王五 应用数学 博一 2120180003
组员 赵六 计算数学 大四 2120180004

(7)官方邮箱

官方邮箱:nk_datajobs@163.com

报名表格、中期报告和最终报告需要发到此邮箱中,同时,也请大家及时关注此邮箱的回信,比如进入最终答辩等环节的通知。

(8)参考文献

作为附件通过邮箱发送。

第二季 观菌识人

展开查看详细信息

(1)背景介绍

从调控食物消化能力到维持免疫系统的运作,肠道菌发挥着巨大的作用。近日研究人员通过对上千人的肠道细菌进行分析,发现微生物群是一个准确性“惊人”的生物钟,利用肠胃中肠道菌的种类和数量能够准确预测大多数人的年龄。随着人们年龄渐长,一些肠道菌的数量会增多,比如霍氏真杆菌(一种对肠道新陈代谢非常重要的细菌);也有一些细菌则在减少,比如与溃疡性结肠炎有关的普通拟杆菌。

(2)目标

本次比赛的基本目标,是各组基于2000多人的肠道细菌16S数据来预测年龄,基本目标达成以后,还可以试着一下其它临床指标,比如BMI等指标,作为发散性思考。详情见数据。

(3)关于数据

报名成功后由工作人员单独发给各组组长。特别请同学们注意数据不要传播给小组以外的任何人,且不作它用,仅限本次比赛分析使用。

(4)参赛形式

建议2-4人组队参赛,每队人数上限为4人。

(5)评选标准

最终呈现的案例分析报告,包括思路(清晰),方法(合理),结果(预测效果,可解释性),图表的使用以及写作是否规范等。

竞赛委员会中的几位老师会对每份报告统一评判并赋分,最后比较综合成绩评选出Finalist。

进入决赛答辩环节的同学们收到通知后,准备PPT或其他形式的答辩展示,按时参加答辩。答辩时的PPT及临场表现均作为考核内容。

(6)如何报名

有意愿参加比赛的同学,请自行商量组队。自行组好队后,由队长将小组信息以Excel表格格式发送至官方邮箱,格式请参考下例:

队伍名称 超越队
姓名 专业 年级 学号
组长 张三 应用统计 研一 2120180001
组员 李四 统计学 研二 2120180002
组员 王五 应用数学 博一 2120180003
组员 赵六 计算数学 大四 2120180004

(7)官方邮箱

官方邮箱:nk_datajobs@163.com

报名表格、中期报告和最终报告需要发到此邮箱中,同时,也请大家及时关注此邮箱的回信,比如进入最终答辩等环节的通知。

(8)参考文献

1、The bacteria in your gut may reveal your true age.

2、Human microbiome aging clocks based on deep learning and tandem of permutation feature importance and accumulated local effects.

(9)参考链接

1、https://new.qq.com/omn/20190115/20190115A0AA7N.html

2、https://www.biorxiv.org/content/early/2018/12/28/507780

第一季 基因突变

展开查看详细信息

(1)目标(寻找 Biomarker/建立分类模型)

  1. 找到一些位点(Biomarker)能够很好的区分 R 和 S 组;
  2. 建立一个分类模型,能够得到较好的分类准确率。 (涉及到高维变量选择/降维和分类的问题)。

(2)参赛形式

建议 2-4 人组队参参赛,每队人数上限为 4 人。

(3)评选标准

最终呈现的案例分析报告,包括思路(清晰),方法(合理),结果(预测效果,可解释性),图表的使用等。