
课程
【课题推荐发表期刊】
【课题背景】
Retrieval-Augmented Generation (RAG)作为大语言模型在线训练和优化的核心算法,能够在收到和反馈用户提问的同时检索外接的大型数据库,以便更新已有的知识结构,从而更准确和有效的回答用户提问。然而,现有的 RAG 算法只是一个通用的实现,存在无法准确理解提问关键信息导致搜索准确性不高,搜索算法无法高效运行,没有考虑多模态数据的差异等问题。
本课题将基于RAG大语言模型,探索解决搜索准确性不高等关键问题,旨在改善大语言模型准确获取数据的能力,从而提高生产力。
*本项目能够提供 GPU 计算资源。
【课题方向参考】
RAG 算法核心模块性能优化(使用 CUDA,OpenMP,MPI 等并行编程模型)
RAG 算法优化:提升搜索算法速率;参考 GraphRAG;提出 HyergraphRAG;或在 GraphRAG 基础上引入排序,最短路径等算法
RAG模型可视化研究(收集模型参数,使用javascript对收集的参数可视化)
【适合人群】
熟悉一门编程语言。
【课题收获】
高质量论文一篇(SCI/CCF定向期刊)
SCI/CCF期刊投递与发表指导
结业证书
【导师介绍】
Dr. Luc,美国Top100高校计算机博士,美国重点实验室计算机科学家
累计发表论文28篇,其中SCI 1区2篇 (包括IEEE Transactions on Visualization and Computer Graphics); SCI 2区1篇(Journal of Parallel and Distributed Computing); CCF-A论文7篇 (PPOPP; SC等),CCF-B论文12篇 (IPDPS, CLUSTER等)
长期担任IEEE Transactions on Parallel and Distributed Systems (TPDS)、并行与分布式计算杂志、IEEE人工智能汇刊、实时图像处理学报、多媒体信息系统学报等高水平期刊审稿人;IEEE会员、ACM会员、SIAM会员、SIGHPC会员;美国能源部/国家科学基金会审查委员会委员
过去 5 年辅导过 30 多名国内外本科,硕士,博士生,从普通二本四级没过的学生,转专业的学生,到世界名校比如华盛顿大学,加州大学的博士生。其中二本转专业学生去年发表CCF-A 会议,现赴日本名校全奖读博。善于鼓励学生从基础学起,不骄不躁的稳步前进。鼓励学生之间相互学习
可提供课题基金申报指导、保研指导、申博指导、海外高校申请指导;可提供开源代码并指导复现;可提供一定的算力资源;可撰写推荐信;大厂实习机会推荐、全英文面试培训
【课题安排】
研究周期预估12个月左右,具体视学员情况调整。
【推荐阅读】