关于举办首届“慧算账杯”大模型应用创新挑战赛的通知-会计与金融学院

通知公告

关于举办首届“慧算账杯”大模型应用创新挑战赛的通知

zz：

来源：

发布时间：2024-07-27

分享到：

随着人工智能技术的飞速发展，AIGC已成为推动社会创新的关键力量。为了紧跟科技前沿，激发学生的创新潜能，鼓励学生探索大模型在各领域中的创新应用，为解决实际问题贡献智慧，提升学生的实践能力、团队合作精神及解决实际问题的能力，并推动学科交叉融合，培养复合型创新人才，北京理工大学珠海学院联合珠海市软件行业协会、珠海市自动化学会、珠海市新一代信息技术与人工智能协会，拟定于2024年7月-10月举办“‘慧算账杯’大模型应用创新挑战赛”。现将有关事项通知如下：

组织机构

主办单位

北京理工大学珠海学院

联合主办

珠海市新一代信息技术与人工智能协会

珠海市软件行业协会

珠海市自动化学会

承办单位

北京理工大学珠海学院会计与金融学院

冠名企业

北京公瑾科技有限公司

参赛对象

由本校本科生、研究生牵头，鼓励跨学校、跨学科、跨专业组队参赛，每个参赛队伍3人以上。

报名时间

启动报名：2024年7月，发布比赛公告，开放在线报名通道。

培训工作坊：2024年8月，举办系列线上/线下讲座，介绍大模型技术、应用案例及开发工具。

方案提交：2024年9月中旬，各团队提交项目提案及初步设计方案（PPT形式提交）。

初选评审：2024年9月底，专家评审团筛选进入决赛的项目。

决赛准备：2024年10月初至中旬，入围团队进行项目完善与准备最终展示。

总决赛与颁奖：2024年10月下旬，现场展示、答辩，揭晓获奖名单并颁奖。

赛道设置

大赛设置自主赛道和命题赛道 2 个赛道。每个团队只能选择 1 个赛道、针对 1 个具体问题参赛。具体说明如下：

1、自主赛道：

自主赛道旨在鼓励参赛者在大模型应用开发领域中自主创新，挑战更广泛的应用场景。参赛者可以根据自身兴趣和专长，选择并定义研究课题，通过各种技术和方法提升大语言模型（LLM）的性能和应用效果。参赛者需提交详细的项目展示PPT和验证代码（py文件），展示其在大模型应用开发中的技术深度和创新思维。评审将依据准确率、创新性、技术难度和实际应用效果进行综合评分。自主赛道期待见到参赛者们在大模型领域的新颖探索和卓越表现。

2、命题赛道：

题目名称：提高中国注册会计师考试（CPA）题目大模型计算的准确率

有200道CPA会计科目的公开题目training set，供参赛者参考，参赛者可以通过一切方法，如提示词工程、Agent、函数调用等等，提高大语言模型（LLM）的做题准确度。

提交材料

自主赛道：

1.项目展示PPT

参赛团队需制作一份时长为5分钟的PPT演示文稿，详细阐述团队设计和实现的研究项目。PPT应包含但不限于以下内容：

（1）项目的研究背景以及问题的具体描述

（2）使用的技术和方法，例如提示词优化（Prompt Engineering）、注意力机制（Attention Mechanism）、自注意力层（Self-Attention Layer）等

（3）解决方案的详细实现过程，包括模型的架构、训练方法和数据处理流程

（4）项目的创新性和实际应用价值

（5）研究成果和实际效果展示

（6）实例演示，展示大语言模型在项目中的具体应用和效果，例如如何通过调整提示词提高模型输出的准确性

请特别说明所用大模型（如GPT-4）的具体版本和配置，并解释如何通过技术改进提升模型性能。

2.验证代码（py文件）

提交一个Python文件（.py），用于验证团队项目的实际效果。该文件应包括：

（1）项目的核心实现代码，能够自动运行以测试和验证解决方案的效果

（2）如果需要调用外部API，请提前准备并正确配置API token，确保代码在评审时能顺利运行。比赛结束后，团队应自行销毁这些token

（3）验证代码应输出准确率或其他关键性能指标。测试数据格式应与训练数据一致

代码中应体现大语言模型的优化与应用，例如自定义的提示词、适配特定任务的注意力机制调整、微调策略等。

3.评审标准

（1）解决方案的准确率占最终评分的60%（最高得分100分，最低得分60分，按实际表现线性评分）

（2）PPT展示占最终评分的40%（评审专家将根据创新性、技术深度和应用潜力三个维度进行评分）

命题赛道:

1.项目展示PPT

参赛者制作5分钟PPT讲述，团队做了哪些工程提高LLM的准确度、并且演示某一道题目的整个处理过程。

2.验证代码（py文件）

提交一个py文件，可以用以验证团队成功的准确率，本比赛有204道testset，是未公开数据，每个参赛团队的最终准确率以这个测试为准，testset 与 training set的格式一致。py文件如果调用API的，请把API的token事先准备好，等比赛结束后自行销毁。（本赛事将只用于测试团队的准确率，不会用于其他任何事项）,注意，准确率是答案完全符合testset给出答案才算准确。

3.评审标准

比赛结果准确率成绩占60%（最高准确率100分，最低准确率60分，准确率与分数线性相关），ppt讲演40%（由评判老师根据ppt的创新性、技术性、潜力三个纬度评分）

4.注意事项

（1）提交的验证代码仅用于测试和评估目的，不会被用于其他任何用途

（2）准确率的计算基于项目输出结果与测试集预期答案的完全一致

确保提交的验证代码和PPT能够充分展示团队在大模型开发与应用中的技术深度、创新思维和具体实践。

奖项设置（各赛道均设）

一等奖

共2队，总奖金10000元，各奖励5000元+证书

二等奖

共4队，总奖金12000元，各奖励3000元+证书

三等奖

共6队，总奖金6000元，各奖励1000元+证书

优秀奖

若干，奖品+证书

单项奖

如最佳创意奖、最佳技术实现奖等，奖品+证书

同时，所有参赛队员均可获得联合主办单位中各企业的就业实习推荐机会。

1D18B?e=.jpeg

咨询答疑群

5AB0?e=.jpeg

报名链接

上一篇：会金团发〔2024〕14号关于开展 2024-2025 学年（第13届）团委、学生会公开竞选的通知下一篇：（公示）会计与金融学院2023年暑期社会实践团队拟立项院级团队名单