什么是System_Prompts_Leaks?
System_Prompts_Leaks是一个收集了主流AI模型和Agent系统提示词的开源项目。它收录的内容包括:
Anthropic系列:Claude Fable 5、Opus 4.8、Claude Code、Claude Design
OpenAI系列:ChatGPT 5.5 Thinking、GPT 5.5 Instant、Codex
Google系列:Gemini 3.5 Flash、3.1 Pro、Antigravity
其他:xAI Grok、Cursor、Copilot、VS Code、Perplexity等
项目采用CC0-1.0许可证,使用JavaScript编写,持续更新。截至目前,已获得44.2k Star,是AI社区最受关注的开源数据集之一。
系统提示词为何重要?
系统提示词(System Prompt)就像是大模型的“家规”。它是一套内置的规则,在用户输入之前被注入,用于定义模型的角色、行为边界、输出格式等核心参数。它告诉模型:你是谁、该怎么说话、能做什么、不能做什么。这不是用户输入的具体问题,而是模型从“出生”就带在身上的“剧本”。不同AI公司采用了截然不同的设计哲学,分析这些提示词可以窥见各家的产品策略和技术路线。
泄露的系统提示词深度分析
Anthropic系列:极致的安全与合规
Anthropic的提示词以全面、细致著称,往往长达数千字。以Claude 3 Opus的提示词为例,包含以下核心模块:
身份声明:明确自己是“Claude,由Anthropic开发的AI助手”,语气温暖但专业。
核心价值观:强调“有帮助、无害、诚实”(HHH原则),要求在所有回答中平衡这三个目标。
儿童安全指令:禁止任何可能伤害儿童的内容,即使是在虚构故事中。
网络安全警告:提醒Claude不要辅助网络攻击、恶意软件开发或社会工程。
注入检测系统:内嵌一套复杂的规则,帮助Claude区分系统消息和用户可能构造的欺骗性输入。例如,提示词会指示Claude忽略用户指令中试图覆盖系统设定的部分,并标记可疑模式。
输出格式约束:要求回答保持结构化,对于编程问题优先给出可运行代码,对于解释性问题优先给出简明摘要。
Claude Code的提示词则更侧重于编程场景,增加了“代码质量检查”、“测试覆盖建议”、“性能分析”等模块,要求Claude在生成代码时主动考虑可维护性和安全性。
OpenAI系列:灵活与通用化
ChatGPT的系统提示词相对简洁,更注重通用性和对话流畅性。其特点是:
角色设定较模糊,允许模型根据用户输入动态调整风格。
对安全限制的表述较为通用(如“不要生成有害内容”),未像Anthropic那样列举具体场景。
强调“有用的助手”形象,鼓励模型在不确定时主动提问澄清。
GPT-5.5 Thinking的提示词则增加了“思考步骤”模块,要求模型在回答问题前先输出内部推理过程(但不对用户可见),这有助于提升复杂问题的解决精度。
Google系列:强调搜索与事实性
Gemini的提示词特别注重“事实准确性”,要求模型在提供信息时注明来源或置信度。此外,由于Gemini深度集成Google搜索,提示词包含了对搜索引擎调用的指令,指导模型何时以及如何使用搜索增强回答。这与其他纯生成式模型形成鲜明对比。
其他模型:xAI Grok的幽默风格
xAI的Grok被赋予了“幽默、不拘一格”的性格,提示词中明确允许模型在适当时候“开玩笑”和“讽刺”,这与Elon Musk的个人风格一致。这种差异化定位在提示词层面就得到了体现。
提示词注入攻击与防御
System_Prompts_Leaks项目也间接暴露了提示词注入(Prompt Injection)的风险。攻击者可能利用泄露的系统提示词来设计越狱(jailbreak)语句,试图覆盖或绕过安全限制。项目维护者在README中提醒使用者:本数据仅用于研究和教育,不得用于恶意目的。同时,多家人工智能公司已经采用了更强大的对抗性训练,即使提示词公开,攻击成功率也大幅降低。
从防御角度看,这些泄露的提示词也为工程师提供了宝贵参考:
如何设计健壮的“边界检查”逻辑
如何格式化系统提示使其难以被覆盖
如何嵌入“水印”或“指纹”以追踪泄露源头
工程化启示:如何利用这些提示词
对于AI应用开发者,System_Prompts_Leaks提供了直接的学习素材:
角色塑造:参考各家风格,为自己的AI应用设计更生动的角色。
安全防护:学习Anthropic的注入检测机制,增强自身系统的鲁棒性。
输出约束:借鉴格式指令,让模型返回更结构化的数据,便于下游解析。
多轮对话管理:分析如何维护对话状态和上下文,优化用户体验。
已有多个开源项目基于这些提示词构建了“提示词模板库”,供开发者快速复用。
伦理与法律争议
System_Prompts_Leaks项目也引发了激烈的伦理讨论。一方面,系统提示词是AI公司的核心知识产权,泄露可能违反服务条款;另一方面,其公开有助于提高透明度和促进研究。部分AI公司曾向项目维护者发出下架请求,但维护者以“公共知识”为由保留,并强调所有提示词均来自公开渠道或社区共享,不涉及黑客行为。
法律专家指出,提示词是否受版权保护仍存争议(通常被视为功能性文本),但无论如何,该项目推动了行业对“AI透明度”的思考。一些公司已开始主动公开部分提示词(如OpenAI的Moderation提示词),作为合规努力的一部分。
社区贡献与持续更新
项目采用JavaScript编写,维护了一个提示词列表,并定期更新。贡献者可以通过提交Pull Request添加新发现的提示词或更新已有内容。为了确保真实性,每个提示词都附有来源链接(如截图、官方文档或已知社区发现)。截至目前,已收录超过30个不同模型/产品的提示词,并且数量仍在增长。
未来方向
项目计划增加提示词的“对比分析”功能,例如高亮不同模型之间的相似点和差异点,以及可视化提示词的长度、复杂度等指标。此外,还考虑提供“提示词演化”时间线,展示同一模型在不同版本中提示词的变化,从而反映公司策略的调整。
总结
System_Prompts_Leaks虽然是一个争议性的数据集,但无可否认地成为了AI透明度运动的重要一环。它让开发者、研究者和普通用户得以一窥AI产品的“潜意识”,推动了更开放的技术讨论。对于任何从事AI产品开发、提示词工程或AI安全的人来说,这个项目都是一份不可多得的参考手册,但其使用必须严格遵守伦理规范。