研究

Gravenos 為一間產品公司,而非研究實驗室。儘管如此,我們對工作所倚賴之研究問題持有立場;本頁將之逐一陳述。

關於人工智能安全

我們不開發基礎模型。我們使用模型,主要為 Institution 層級下之 Anthropic Claude Sonnet,並輔以大量系統提示工程,以及將模型約束於經核實數據之驗證層。對於本公司所處位置之企業而言,主要之人工智能安全問題,並非前沿模型之對齊問題 — 此為各實驗室之工作 — 而是在失敗模式具有特定後果之領域中安全部署該等模型。

有兩種失敗模式為我們所關注。其一為幻覺:模型自信地陳述某項並無經核實數據支持之斷言。我們之驗證層為主要防線;指示模型須標示其不知道之事項之系統提示,則為次要防線。其二為監管漂移:當模型具備足夠能力時,可能會被誘導去發出投資建議而非分析。我們之系統提示包含明確之拒絕指示;內部審查則檢視模型輸出是否有此類漂移之跡象。

我們認真追蹤 Anthropic、OpenAI、DeepMind 之公開研究,以及學界關於語言模型安全之文獻。我們並非該等文獻之貢獻者,但為其用心之讀者。

關於量化建模之局限

我們之情境模擬與風險計算建基於對未來回報分佈、相關性持續性以及歷史紀錄代表性之假設。每項假設皆有可能失效。2008 年金融海嘯、2020 年疫情引發之波動,以及 2022 年利率週期斷裂,均揭示了以往制度所校準之模型之局限。

我們之立場為:此並非反對量化建模之論據,而是支持明確說明其局限之論據。研究方法說明列出各項計算所依據之假設;使用者獲邀據此衡量輸出。一個局限清晰可見之模型,比一個信心被人為拉高之模型更具參考價值。

關於人工智能生成內容之問題

Drusus Daily 之相當部份內容由語言模型生成。我們曾考慮是否須以較研究方法說明更顯眼之方式向讀者披露此事,結論為:結構上之答案為「是」 — 故每期均聲明其文字屬模型生成。然而我們不會逐句指明哪些句子由模型生成、哪些經人類編輯,因為在實踐中此一界線已模糊(編輯審查實質地修改了模型輸出),而且二元披露所造成之誤導,將多於其所傳遞之資訊。

真正重要之問題,並非文字是否由模型生成,而是其所載數字是否正確。驗證層處理此一問題。編輯審查則負責分析判斷。

我們所發表之研究

我們之長篇研究見於 Drusus Insights。所載文章定位為服務在職投資者及分析專業人士,而非學術文獻;我們不聲稱進行同儕審閱之研究。若本公司之研究方法對平台使用者所進行之學術工作有所貢獻,引用指引可見於研究方法頁。