我院举行统计与机器学习系列学术报告-嘉应学院数学学院

为了活跃我院的科研学术氛围，拓展视野，学习先进的机器学习方法，我院邀请了来自中山大学、暨南大学、深圳大学和广州大学的4位学者在1月6日举行了4场统计与机器学习系列学术报告。他们在机器学习方面的深刻造诣，使得我院师生受益匪浅。

其中，4个讲座的具体内容如下：

讲座1：聚类的算法与应用

报告人：任传贤，中山大学副教授，博士生导师。目前担任中山大学科学计算与计算机应用系主任，广东省工业与应用数学学会秘书长。研究领域是高维数据分析与复杂关系推断，主要包括面向复杂图像数据分类的多尺度分析与机器学习算法。主持国家自然科学基金面上项目，在国际权威期刊如IEEE TIP、IEEE TNNLS、IEEE TCYB、IEEE TKDE等发表论文20余篇，研究成果获2015年度教育部自然科学研究优秀成果二等奖。

摘要：随着对抗式生成模型的快速发展，深度自编码结构方法在数据分析领域得到了更加广泛的关注。生成式对抗自编码（AAE）包含一个基本的三元组结构：一个生成模型G、一个判别模型D和一个自编码结构E. 生成模型G用于拟合数据的真实分布，判别模型D用于有监督的判断G的学习效果，而自编码结构E可以帮助我们对数据重要特征进行灵活而有效建模。本次报告将主要汇报聚类算法的一些发展和应用。

讲座2：基于稀疏逼近的判别投影学习算法

报告人：余玉丰，统计学博士，任教于广州大学经济与统计学院。2016年7月至2017年7月赴美国西佛吉尼亚大学计算机系交流访问，2017年12月至2018年6月在香港城市大学工作。主要研究方向为统计机器学习、模式识别、生物医学图像处理。主持广州大学科研启动项目一项，参与国家自然科学基金重点项目和国家自然科学基金面上项目等多项。在国内外期刊会议发表学术论文10余篇，其中包括IEEE TCYB, Pattern Recognition等期刊。担任的社会兼职包括多个国际学术期刊（IEEE TNNLS, IEEE TCYB等）和国际会议论文审稿人。

摘要：基于子空间学习的降维方法已经广泛用于图像数据的表达和分类。但是这些方法仍然存在一些不足：第一，性能不够稳健，不具有普适性，只能用于某种单一类型的数据，比如人脸图像数据、基因芯片数据或者物体图像数据；第二，普遍仅适用于（表示数据的维数，表示数据样本的个数）的情况，当面对高维小样本问题，即时，会出现奇异问题，性能急剧下降。针对这两点不足，本文提出基于稀疏逼近的判别投影学习算法，构造了一个自适应的特征选择框架，并构造出完全不同于传统Fisher准则的目标函数，提出了有效的优化算法求解目标函数。

讲座3：经济资产配置的学习系统：进取型策略及复合趋势策略

报告人：赖兆荣，统计学博士，现为暨南大学信息科学技术学院数学系副教授、硕士生导师，广东省数量金融大数据工程中心副主任，以第一作者身份在国际顶级或核心期刊JMLR，TNNLS (2篇), TCYB, TIP (2篇), DMKD和TSMC-S上发表论文8篇，担任人工智能领域的国际顶级会议IJCAI 2018、IJCAI2019和AAAI2019的程序委员，担任TNNLS和TKDE的审稿人。主持国家自然科学基金青年项目一项。

摘要：我们提出一种进取的策略，该策略追踪并利用资产的近期最高价格。提出一种新型线性系统，它将各个资产的增长潜力反馈到资产组合上，以最大化下一投资期的财富。设计一个快速的后向传播算法，以求解模型的优化目标，使得它可用于大规模的且有时间限制的应用场景。在上述基础上，我们再提出一种带有自适应输入及复合趋势表示的径向基函数模型，它灵活地融合了关于资产价格的几种不同的趋势表示。实验结果表明这两种方法均取得了先进的投资效果和良好的风险控制能力，运行快速并能承受一定的交易费损耗。

讲座4：统计学习在医学大数据分析中的应用

简介：欧阳乐，统计学博士，深圳大学副研究员，硕士研究生导师，IEEE会员。2013年10月至2014年4月，赴新加坡南洋理工大学计算机科学系交流访问。2015年-2016年在香港城市大学电子工程系从事博士后研究。主要从事数据挖掘、机器学习和生物信息学等领域的科研和教学工作。深圳市海外高层次人才（孔雀计划）C类，南山区“领航人才”C类获得者。目前已在IEEE TCYB，Bioinformatics，BMC Bioinformatics，BMC Genomics, IEEE/ACM TCBB, Methods, Scientific Reports，Molecular BioSystems等国际权威期刊发表SCI论文24篇。获授权专利1项。担任Bioinformatics、Methods、IEEE/ACM TCBB等重要刊物审稿人。主持国家自然科学基金青年项目一项，参与广东省自然科学基金重点项目一项。

摘要：随着高通量测序技术的快速发展，我们进入了生物医学的“大数据”时代。医学大数据既为数据科学领域提供了巨大的研究机遇，也带来了许多新的挑战。我们需要设计新的方法从大规模基因组数据中探索新的遗传模式。在本次报告中，我将首先介绍大数据分析中的重要概念，例如统计学习、监督学习和无监督学习等，并且对大数据分析在精准医疗领域的最新研究进展进行简要的介绍。其次，我将介绍我们在这个领域的一些近期研究工作，包括集成学习、多视角学习和差异分析等。

撰稿人：黄可坤审稿人：陈德华