研究

Gravenos 是一家產品公司,而非研究實驗室。儘管如此,我們對於我們的工作所仰賴的研究議題仍持有立場;本頁面將其列陳於下。

關於 AI 安全

我們不建構基礎模型。我們使用它們,主要為 Institution 方案中之 Anthropic Claude Sonnet,輔以可觀之系統提示工程,並以一驗證層將模型限制於已驗證之資料。因此,居於我們之位置之公司所應關注之主要 AI 安全議題,並非前沿模型之對齊(此為各實驗室之工作);而是於失誤模式具特定後果之領域中,安全地部署該等模型。

兩種失誤模式為我們所專注。第一為幻覺:模型產出未基於已驗證資料之自信主張。我們的驗證層為主要防線;指示模型標示其未知者之系統提示為次要防線。第二為法規偏移:當模型能力足夠高時,誘使其滑入產出投資建議而非分析之傾向。我們的系統提示包含明確之拒絕指示;我們的內部審核則檢視模型輸出是否有此類偏移之跡象。

我們以嚴肅之態度關注 Anthropic、OpenAI、DeepMind 之已發表著作,以及語言模型安全之學術文獻。我們並非該文獻之貢獻者,但我們是其用心的閱讀者。

關於量化建模之限制

我們的情境建模與風險計算,建立於對未來報酬分布、相關性持續性、及歷史紀錄代表性之假設之上。其中每一項假設皆有可能失效。2008 年金融危機、2020 年疫情誘發之波動,以及 2022 年利率週期斷裂,皆暴露了以先前狀態校準之模型的限制。

我們的立場是:此並非反對量化建模之論證,而是支持明白陳述其限制之論證。研究方法文件詳列各項計算所依據之假設;使用者宜據此衡量輸出之份量。一個其限制清楚可見之模型,比一個其信心被人為拉高之模型更有用。

關於 AI 生成內容之議題

Drusus Daily 之相當部分由語言模型產出。我們已考量是否應以較研究方法文件已揭示者更顯著之方式向讀者揭露此一事實,並已得出結論:結構上之答案為肯定的——文句之模型生成性質已於每一期予以聲明。然而我們不指出哪些特定句子由模型生成、哪些經人工編輯,蓋此分界於實務上已模糊化(編輯審查實質修改了模型輸出),且二元揭露所造成之誤導甚於所提供之資訊。

真正相關的問題並非文句是否由模型生成,而是其所含數字是否正確。驗證層即處理此一問題;編輯審查則承擔分析判斷之責任。

我們所發表之研究

我們的長篇研究刊載於 Drusus Insights。於該處發表之文章面向實務投資者與分析專業人員,而非面向學術文獻;我們無意宣稱在進行同儕審查之研究。當我們的研究方法為平台使用者所進行之學術工作有所貢獻時,引用指引列於研究方法頁面。