千帆AI原生应用大赛个人记录(非官方)

对于第一期的赛题的理解和建议

以下是我第一期赛题提交的答案提示词,供大家参考批评

想根据我的个人有限的经验和对于大模型浅薄的理解,给大家提几点建议:

  • 明确角色定义和任务定性:预设明晰的场景可以让接下来的token更加按照你设想的方向生成
  • 帮模型分解子任务:可以明确要求模型应该提取哪些信息,明确什么遇到什么情况应该执行什么任务
  • 采用Markdown格式:数据集中很多高质量规范化的训练数据都是markdown格式
  • 给出结构化数据:我的理解,让模型复述比提炼更加容易,因此直接给出python结构列表元组会大大避免大家提到的“丢数据”的问题 (至少我用这个方法没有遇到这个问题)
  • 给出样例(few-shot):GPT3的原始论文就是提出了在prompt要进行few-shot可以大大提升模型的新任务解决能力
  • 提示词注意泛化能力:不要把任务说的太死太细,比如官方说评测数据集中有1.2小时、3000s这样的非示例数据,我感觉我就是在这里丢了分,可以充分利用模型自身的泛化能力,而不是教给它细节做法
  • 保持好的心态:从GPT的原理来看,模型本身就是基于概率采样生成token的,因此确实会有一定的“运气问题”,但是好的提示词可以大大降低运气的影响

为大家写了一个实时的非官方排行榜,基于大家的最后提交时间排名,当然也希望官方能够给出一个官方的排行榜。

第一期游乐园规划助手提交时间情况排行榜
第二期

等待第二期的赛题评审结束后我会在这里和大家分享我的理解和建议。

最后更新时间:2024年3月2日