研究

Gravenos 是一家产品公司,而非研究实验室。然而,我们仍就所赖以开展工作的研究问题表达立场;本页即作此陈述。

关于人工智能安全

我们不构建基础模型。我们使用基础模型——在 Institution 层级主要使用 Anthropic Claude Sonnet——并辅以大量系统提示词工程及将模型约束至已核验数据的核验层。对处于我们这一位置的公司而言,最主要的人工智能安全问题,并非前沿模型的对齐——那是实验室的工作;而是在失败模式具有特定后果的领域中,如何安全部署这些模型。

两种失败模式令我们格外关注。第一是幻觉:模型在缺乏已核验数据依据的情况下,自信地作出断言。我们的核验层是主要防线;指示模型对其所不知者加以标记的系统提示词,则是次要防线。第二是监管漂移:在模型能力足够强的情况下,存在使其滑入产出投资建议而非分析的诱因。我们的系统提示词包含明确的拒答指令;我们的内部复核检查模型输出是否出现此类漂移的征兆。

我们严肃关注 Anthropic、OpenAI、DeepMind 以及语言模型安全方面学术文献的已发表工作。我们并非该领域的贡献者,但我们是其用心的读者。

关于定量建模的局限

我们的情景建模与风险计算建立于若干假设之上:未来收益分布、相关性的持续性,以及历史记录的代表性。这些假设中的每一项都可能失效。2008 年金融危机、2020 年由疫情引发的波动以及 2022 年利率周期的断裂,均暴露出按先前体制校准模型的局限。

我们的立场是:这不构成反对定量建模的论据,反而是要求明确陈述其局限的论据。方法论文档列出各项计算所依据的假设;用户被请求据此衡量输出。一个局限可见的模型,比一个虚高自信的模型更具实用价值。

关于人工智能生成内容的问题

Drusus Daily 的相当一部分内容由语言模型生成。我们曾考虑,是否应以比方法论文档更突出的方式向读者披露此事;结论是:从结构层面应当如此——每一期皆声明其文本由模型生成。然而,我们并不区分指出具体哪些句子由模型生成、哪些经人工编辑——因为这一界限在实践中已模糊(编辑复核会对模型输出作出实质性修改),并且二元的披露所带来的误导多于其所传达的信息。

真正的问题不在于文本是否由模型生成,而在于其中所含的数字是否正确。核验层处理后者。编辑复核则负责分析判断。

我们发布的研究

我们的长篇研究刊于 Drusus Insights。该处发表的文章面向在岗投资者与分析专业人士,而非学术文献;我们不声称在开展同行评议的研究。当我们的方法论对平台用户所开展的学术工作有所贡献时,引用指引列于方法论页。