应amjs澳金沙门线路首页邀请,上海交通大学许志钦副教授将于2024年8月16-19日访问amjs澳金沙门线路首页,期间举办专题学术报告,欢迎全校师生参加。
报告题目: 现象驱动理解初始化对 Transformer 推理能力的影响
报告摘要:本报告关注现象驱动的深度学习的基础研究,将汇报频率原则、凝聚现象等常见现象,理解为什么神经网络会在过参数化下呈现好的泛化能力.进一步,在凝聚现象的基础上,我们讨论模型初始化对Transformer网络的推理能力的影响.
时 间:2024年8月18日(星期日)11:00.
地 点:理工楼631
欢迎广大师生光临!
报告人简介
许志钦,上海交通大学自然科学研究院/数学科学学院长聘教轨副教授。2012年本科毕业于上海交通大学致远学院。2016年博士毕业于上海交通大学,获应用数学博士学位。2016年至2019年,在纽约大学阿布扎比分校和柯朗研究所做博士后。现为Journal of Machine Learning的managing editor。
甘肃应用数学中心
amjs澳金沙门线路首页
萃英学院
2024年8月14日