Tool Platform
Workspace

LLM 评测用例生成器

动态工具路由来自自动生成的 Tool Registry。

AI工具

LLM 评测用例生成器

根据模型行为规格生成指令遵循、RAG、事实性、安全和工具使用 eval 用例。

本地简单运行
运行方式
本地简单运行
标签
llm evaltest casesrubricsafetyrag
工具标识
llm-eval-case-generator
Worker
无需启用
权限
无需额外权限

使用指南

开始使用

输入模型行为规格,自动生成覆盖多维度测试的评测用例。

使用步骤

  1. 填写模型行为规格或使用场景。
  2. 选择评测维度(指令遵循、RAG、安全性等)。
  3. 复制生成的 eval 用例列表。

使用例子

  • 为 RAG 应用生成事实性测试用例。
  • 生成指令遵循的安全边界测试。

Loading

LLM 评测用例生成器

工具组件加载中。