研究

Gravenos 是一家产品公司，而非研究实验室。然而，我们仍就所赖以开展工作的研究问题表达立场；本页即作此陈述。

关于人工智能安全

我们不构建基础模型。我们使用基础模型——在 Institution 层级主要使用 Anthropic Claude Sonnet——并辅以大量系统提示词工程及将模型约束至已核验数据的核验层。对处于我们这一位置的公司而言，最主要的人工智能安全问题，并非前沿模型的对齐——那是实验室的工作；而是在失败模式具有特定后果的领域中，如何安全部署这些模型。

两种失败模式令我们格外关注。第一是幻觉：模型在缺乏已核验数据依据的情况下，自信地作出断言。我们的核验层是主要防线；指示模型对其所不知者加以标记的系统提示词，则是次要防线。第二是监管漂移：在模型能力足够强的情况下，存在使其滑入产出投资建议而非分析的诱因。我们的系统提示词包含明确的拒答指令；我们的内部复核检查模型输出是否出现此类漂移的征兆。

我们严肃关注 Anthropic、OpenAI、DeepMind 以及语言模型安全方面学术文献的已发表工作。我们并非该领域的贡献者，但我们是其用心的读者。

关于定量建模的局限

我们的情景建模与风险计算建立于若干假设之上：未来收益分布、相关性的持续性，以及历史记录的代表性。这些假设中的每一项都可能失效。2008 年金融危机、2020 年由疫情引发的波动以及 2022 年利率周期的断裂，均暴露出按先前体制校准模型的局限。

我们的立场是：这不构成反对定量建模的论据，反而是要求明确陈述其局限的论据。方法论文档列出各项计算所依据的假设；用户被请求据此衡量输出。一个局限可见的模型，比一个虚高自信的模型更具实用价值。

关于人工智能生成内容的问题

Drusus Daily 的相当一部分内容由语言模型生成。我们曾考虑，是否应以比方法论文档更突出的方式向读者披露此事；结论是：从结构层面应当如此——每一期皆声明其文本由模型生成。然而，我们并不区分指出具体哪些句子由模型生成、哪些经人工编辑——因为这一界限在实践中已模糊（编辑复核会对模型输出作出实质性修改），并且二元的披露所带来的误导多于其所传达的信息。

真正的问题不在于文本是否由模型生成，而在于其中所含的数字是否正确。核验层处理后者。编辑复核则负责分析判断。

我们发布的研究

我们的长篇研究刊于 Drusus Insights。该处发表的文章面向在岗投资者与分析专业人士，而非学术文献；我们不声称在开展同行评议的研究。当我们的方法论对平台用户所开展的学术工作有所贡献时，引用指引列于方法论页。

查阅 Insights 文章库 →