研究

Gravenos 為一間產品公司，而非研究實驗室。儘管如此，我們對工作所倚賴之研究問題持有立場；本頁將之逐一陳述。

關於人工智能安全

我們不開發基礎模型。我們使用模型，主要為 Institution 層級下之 Anthropic Claude Sonnet，並輔以大量系統提示工程，以及將模型約束於經核實數據之驗證層。對於本公司所處位置之企業而言，主要之人工智能安全問題，並非前沿模型之對齊問題 — 此為各實驗室之工作 — 而是在失敗模式具有特定後果之領域中安全部署該等模型。

有兩種失敗模式為我們所關注。其一為幻覺：模型自信地陳述某項並無經核實數據支持之斷言。我們之驗證層為主要防線；指示模型須標示其不知道之事項之系統提示，則為次要防線。其二為監管漂移：當模型具備足夠能力時，可能會被誘導去發出投資建議而非分析。我們之系統提示包含明確之拒絕指示；內部審查則檢視模型輸出是否有此類漂移之跡象。

我們認真追蹤 Anthropic、OpenAI、DeepMind 之公開研究，以及學界關於語言模型安全之文獻。我們並非該等文獻之貢獻者，但為其用心之讀者。

關於量化建模之局限

我們之情境模擬與風險計算建基於對未來回報分佈、相關性持續性以及歷史紀錄代表性之假設。每項假設皆有可能失效。2008 年金融海嘯、2020 年疫情引發之波動，以及 2022 年利率週期斷裂，均揭示了以往制度所校準之模型之局限。

我們之立場為：此並非反對量化建模之論據，而是支持明確說明其局限之論據。研究方法說明列出各項計算所依據之假設；使用者獲邀據此衡量輸出。一個局限清晰可見之模型，比一個信心被人為拉高之模型更具參考價值。

關於人工智能生成內容之問題

Drusus Daily 之相當部份內容由語言模型生成。我們曾考慮是否須以較研究方法說明更顯眼之方式向讀者披露此事，結論為：結構上之答案為「是」 — 故每期均聲明其文字屬模型生成。然而我們不會逐句指明哪些句子由模型生成、哪些經人類編輯，因為在實踐中此一界線已模糊(編輯審查實質地修改了模型輸出)，而且二元披露所造成之誤導，將多於其所傳遞之資訊。

真正重要之問題，並非文字是否由模型生成，而是其所載數字是否正確。驗證層處理此一問題。編輯審查則負責分析判斷。

我們所發表之研究

我們之長篇研究見於 Drusus Insights。所載文章定位為服務在職投資者及分析專業人士，而非學術文獻；我們不聲稱進行同儕審閱之研究。若本公司之研究方法對平台使用者所進行之學術工作有所貢獻，引用指引可見於研究方法頁。

瀏覽 Insights 文章庫 →