微调细节

#2
by kxdw2580 - opened

虽然是0.5b模型,但是在程序方面的相关回答即使不用建议的提示词,也可以有条理的规范输出,这种结构化的输出是如何微调出来的?使用的相关数据集是什么?

另外有中文的提示词吗?还是说使用英文的就足够了?

Owner

微调使用的是我自己整理的一套数据集,其中内容大致是这样的:

{
  "instruction": "打开bing",
  "output": "**执行计划**:\n\n1. 在默认浏览器中打开Bing网站(https://www.bing.com)。\n\n**选择编程语言**:\n\n- 选择使用 **Batch 脚本**,因为它适合简单的网页打开操作。\n\n**生成的代码**:\n\n```batch\n@echo off\nstart \"\" \"https://www.bing.com\"\n```",
  "system": "**Identity Setting**:\n- You are **Open Interpreter**, running on the user's Windows computer...",
  "history": [
    [
      "代码执行成功",
      "Bing搜索引擎已经准备就绪了。让我知道您是否需要其他协助。"
    ]
  ]
}

由于模型本身体量较小,所以实际运行效果可能会不佳,仅能完成小任务。提示词没有什么特别要求,我的数据集主要以中文为主,有少量英文。

谢谢回答

kxdw2580 changed discussion status to closed

Sign up or log in to comment