AIBetas消息,2023年8月22日,OpenAI发布公告,宣布GPT-3.5 Turbo模型已支持微调(Fine-tuning),同时将于秋季继续支持GPT-4模型微调。
此更新使开发人员能够自定义更适合其用例的模型,并大规模运行这些自定义模型。 早期测试表明,GPT-3.5 Turbo 的微调版本在某些特定任务上可以匹配甚至超越基本 GPT-4 级别的功能。传入和传出微调 API 的数据归客户所有,OpenAI 或任何其他组织不会使用该数据来训练其他模型。
- 提高可操纵性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以给定语言进行响应。 例如,开发人员可以使用微调来确保模型在提示使用德语时始终以德语进行响应。
- 可靠的输出格式:微调提高了模型一致地格式化响应的能力——对于需要特定响应格式的应用程序(例如代码完成或编写 API 调用)来说,这是一个至关重要的方面。 开发人员可以使用微调来更可靠地将用户提示转换为可在自己的系统中使用的高质量 JSON 片段。
- 自定义基调:微调是磨练模型输出质量感觉(例如基调)的好方法,因此它更适合企业品牌的声音。 拥有知名品牌声音的企业可以对模型进行微调,使其与其基调更加一致。
除了提高性能之外,微调还使企业能够缩短提示时间,同时确保类似的性能。 使用 GPT-3.5-Turbo 进行微调还可以处理 4k tokens。 早期测试人员通过对模型本身的指令进行微调,将提示大小减少了高达 90%,从而加快了每个 API 调用的速度并降低了成本。
微调模型价格
Model | Training | Input usage | Output usage |
babbage-002 | $0.0004 / 1K tokens | $0.0016 / 1K tokens | $0.0016 / 1K tokens |
davinci-002 | $0.0060 / 1K tokens | $0.0120 / 1K tokens | $0.0120 / 1K tokens |
GPT-3.5 Turbo | $0.0080 / 1K tokens | $0.0120 / 1K tokens | $0.0160 / 1K tokens |
微调步骤 Fine-tuning steps
- 准备数据
{
"messages": [
{ "role": "system", "content": "You are an assistant that occasionally misspells words" },
{ "role": "user", "content": "Tell me a story." },
{ "role": "assistant", "content": "One day a student went to schoool." }
]
}
- 上传文件
curl -https://api.openai.com/v1/files \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F "purpose=fine-tune" \
-F "file=@path_to_your_file"
- 创建微调任务:
curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"training_file": "TRAINING_FILE_ID",
"model": "gpt-3.5-turbo-0613",
}'
- 调用微调模型
curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "ft:gpt-3.5-turbo:org_id",
"messages": [
{
"role": "system",
"content": "You are an assistant that occasionally misspells words"
},
{
"role": "user",
"content": "Hello! What is fine-tuning?"
}
]
}'
[参考文章]
https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容