随着人工智能技术的飞速发展,AIGC已成为推动社会创新的关键力量。为了紧跟科技前沿,激发学生的创新潜能,鼓励学生探索大模型在各领域中的创新应用,为解决实际问题贡献智慧,提升学生的实践能力、团队合作精神及解决实际问题的能力,并推动学科交叉融合,培养复合型创新人才,北京理工大学珠海学院联合珠海市软件行业协会、珠海市自动化学会、珠海市新一代信息技术与人工智能协会,拟定于2024年7月-10月举办“‘慧算账杯’大模型应用创新挑战赛”。现将有关事项通知如下:
主办单位
北京理工大学珠海学院
联合主办
珠海市新一代信息技术与人工智能协会
珠海市软件行业协会
珠海市自动化学会
承办单位
北京理工大学珠海学院会计与金融学院
冠名企业
北京公瑾科技有限公司
由本校本科生、研究生牵头,鼓励跨学校、跨学科、跨专业组队参赛,每个参赛队伍3人以上。
报名时间
启动报名:2024年7月,发布比赛公告,开放在线报名通道。
培训工作坊:2024年8月,举办系列线上/线下讲座,介绍大模型技术、应用案例及开发工具。
方案提交:2024年9月中旬,各团队提交项目提案及初步设计方案(PPT形式提交)。
初选评审:2024年9月底,专家评审团筛选进入决赛的项目。
决赛准备:2024年10月初至中旬,入围团队进行项目完善与准备最终展示。
总决赛与颁奖:2024年10月下旬,现场展示、答辩,揭晓获奖名单并颁奖。
赛道设置
大赛设置自主赛道和命题赛道 2 个赛道。每个团队只能选择 1 个赛道、针对 1 个具体问题参赛。具体说明如下:
1、自主赛道:
自主赛道旨在鼓励参赛者在大模型应用开发领域中自主创新,挑战更广泛的应用场景。参赛者可以根据自身兴趣和专长,选择并定义研究课题,通过各种技术和方法提升大语言模型(LLM)的性能和应用效果。参赛者需提交详细的项目展示PPT和验证代码(py文件),展示其在大模型应用开发中的技术深度和创新思维。评审将依据准确率、创新性、技术难度和实际应用效果进行综合评分。自主赛道期待见到参赛者们在大模型领域的新颖探索和卓越表现。
题目名称:提高中国注册会计师考试(CPA)题目大模型计算的准确率
有200道CPA会计科目的公开题目training set,供参赛者参考,参赛者可以通过一切方法,如提示词工程、Agent、函数调用等等,提高大语言模型(LLM)的做题准确度。
参赛团队需制作一份时长为5分钟的PPT演示文稿,详细阐述团队设计和实现的研究项目。PPT应包含但不限于以下内容:
(1)项目的研究背景以及问题的具体描述
(2)使用的技术和方法,例如提示词优化(Prompt Engineering)、注意力机制(Attention Mechanism)、自注意力层(Self-Attention Layer)等
(3)解决方案的详细实现过程,包括模型的架构、训练方法和数据处理流程
(4)项目的创新性和实际应用价值
(5)研究成果和实际效果展示
(6)实例演示,展示大语言模型在项目中的具体应用和效果,例如如何通过调整提示词提高模型输出的准确性
请特别说明所用大模型(如GPT-4)的具体版本和配置,并解释如何通过技术改进提升模型性能。
2.验证代码(py文件)
提交一个Python文件(.py),用于验证团队项目的实际效果。该文件应包括:
(1)项目的核心实现代码,能够自动运行以测试和验证解决方案的效果
(2)如果需要调用外部API,请提前准备并正确配置API token,确保代码在评审时能顺利运行。比赛结束后,团队应自行销毁这些token
(3)验证代码应输出准确率或其他关键性能指标。测试数据格式应与训练数据一致
代码中应体现大语言模型的优化与应用,例如自定义的提示词、适配特定任务的注意力机制调整、微调策略等。
3.评审标准
(1)解决方案的准确率占最终评分的60%(最高得分100分,最低得分60分,按实际表现线性评分)
(2)PPT展示占最终评分的40%(评审专家将根据创新性、技术深度和应用潜力三个维度进行评分)
1.项目展示PPT
参赛者制作5分钟PPT讲述,团队做了哪些工程提高LLM的准确度、并且演示某一道题目的整个处理过程。
2.验证代码(py文件)
提交一个py文件,可以用以验证团队成功的准确率,本比赛有204道testset,是未公开数据,每个参赛团队的最终准确率以这个测试为准,testset 与 training set的格式一致。py文件如果调用API的,请把API的token事先准备好,等比赛结束后自行销毁。(本赛事将只用于测试团队的准确率,不会用于其他任何事项),注意,准确率是答案完全符合testset给出答案才算准确。
3.评审标准
比赛结果准确率成绩占60%(最高准确率100分,最低准确率60分,准确率与分数线性相关),ppt讲演40%(由评判老师根据ppt的创新性、技术性、潜力三个纬度评分)
4.注意事项
(1)提交的验证代码仅用于测试和评估目的,不会被用于其他任何用途
(2)准确率的计算基于项目输出结果与测试集预期答案的完全一致
确保提交的验证代码和PPT能够充分展示团队在大模型开发与应用中的技术深度、创新思维和具体实践。
一等奖
共2队,总奖金10000元,各奖励5000元+证书
二等奖
共4队,总奖金12000元,各奖励3000元+证书
三等奖
共6队,总奖金6000元,各奖励1000元+证书
优秀奖
若干,奖品+证书
单项奖
如最佳创意奖、最佳技术实现奖等,奖品+证书
同时,所有参赛队员均可获得联合主办单位中各企业的就业实习推荐机会。
咨询答疑群
报名链接