GPT-5.5 模型评估工作流

Data AnalysisCoze更新于 2026-04-24

使用 GPT-5.5 对指定数据集进行评估，自动生成性能报告，帮助团队快速了解模型表现。

System Prompt

Run model evaluation for {model_name} on {dataset_path} using {metrics} and output a report in {report_format}.

变量清单（在目标 AI 工具中填写）

此处仅展示模板里的占位变量，不是在本站输入。请复制 Prompt 后，在 Coze / Dify / ChatGPT 中替换这些变量。

{model_name}

要评估的模型名称，例如 GPT-5.5

填写建议：替换为你的真实业务内容。

{dataset_path}

本地或云端数据集路径，包含待评估的数据

填写建议：替换为你的真实业务内容。

{metrics}

评估指标列表，例如 accuracy, precision, recall, f1

填写建议：替换为你的真实业务内容。

{report_format}

报告输出格式，例如 markdown, json, html

填写建议：替换为你的真实业务内容。

快捷变量填充器（可选）

可在浏览器本地填写变量，自动生成可直接运行的 Prompt。

{model_name}

要评估的模型名称，例如 GPT-5.5

{dataset_path}

本地或云端数据集路径，包含待评估的数据

{metrics}

评估指标列表，例如 accuracy, precision, recall, f1

{report_format}

报告输出格式，例如 markdown, json, html

生成结果预览

未填: 4

Run model evaluation for {model_name} on {dataset_path} using {metrics} and output a report in {report_format}.

通用使用说明

适用场景

需要快速产出 Data Analysis 相关内容，并希望用结构化 Prompt 提升稳定性。

解决问题

减少从零写 Prompt 的时间，降低输出质量不稳定、漏条件、漏格式的问题。

使用步骤

点击“复制模板 Prompt”。
将 Prompt 粘贴到你的 AI 工具（如 Coze / Dify / ChatGPT）。
按上方变量清单替换 {变量名}。
运行并根据结果微调约束条件。

不适用场景

需要实时联网数据、外部数据库写入或多工具自动编排时，应使用完整工作流（Agent/Automation）版本。

成功案例

输入:

dataset_path: /data/test_set.csv

输出:

accuracy: 92.3%, precision: 90.1%, recall: 88.7%, f1: 89.4%

边界情况

输入:

dataset_path: /data/nonexistent.csv

修复建议:

确保 dataset_path 指向有效文件并具有读取权限

下一步推荐

继续浏览同类模板，并搭配相关工具提升效果。

继续使用 / 最近浏览

还没有最近浏览记录。

工作流步骤

1. 加载 {dataset_path} 并进行预处理
2. 初始化 {model_name} 并设置推理参数
3. 对数据集进行批量推理，收集预测结果
4. 计算 {metrics} 并生成统计表
5. 按 {report_format} 格式输出评估报告

约束条件

数据集行数 > 10,000 时需使用分批推理
模型参数 > 10B 时需使用 GPU 加速

GPT-5.5 模型评估工作流

变量清单（在目标 AI 工具中填写）

快捷变量填充器（可选）

通用使用说明

适用场景

解决问题

使用步骤

不适用场景

成功案例

边界情况

下一步推荐

同类模板

相关工具

继续使用 / 最近浏览

工作流步骤

约束条件

同类内容继续浏览

同类模板

相关免费工具

推荐配套工具

Coze

OpenAI