面向大规模数据驱动模型的随机素描方法

  • CHEN, Yifan (PI)
  • Zhang, Qiaosheng (Collaborator)
  • Xu, Yifan (Collaborator)

Project: Research project

Project Details

Description

随着数据量的增加和计算能力的提升,大规模数据驱动模型被广泛应用于不同领域,包括自然语言处理,计算机视觉,语音,多模态数据,及自然科学。为了从海量数据中有效提取模式与规律,现代的大规模数据驱动模型不可避免地有着巨大的尺寸,而其代表大语言模型,更有着二次时空复杂度。大规模数据驱动模型的发展使得高效矩阵乘法成了不可忽视的现实需求,而本项目据此拟发展随机素描方法与相关统计保障,并最终基于不同模型各自的结构特点设计新的高效算法。具体地,本项目将开发一种基于重要性采样的新型随机素描算法;在样本重要性估计精度受限的情况下提升随机素描算法的计算效率并给出统计保障。
StatusActive
Effective start/end date1/01/2531/12/27