리서치

Gravenos는 제품 회사이지 연구소가 아닙니다. 그럼에도 우리의 작업이 의존하는 연구 질문에 대해 입장을 취하고 있으며, 본 페이지는 그것을 정리합니다.

AI 안전에 관하여

당사는 파운데이션 모델을 구축하지 않습니다. 우리는 그것을 사용합니다. 주로 Institution 등급에서 Anthropic Claude Sonnet을 활용하며, 실질적인 시스템 프롬프트 엔지니어링과 검증된 데이터로 모델을 제약하는 검증 계층을 적용합니다. 따라서 당사 위치의 회사에 있어 주된 AI 안전 질문은 연구소의 일에 속하는 프런티어 모델의 정렬이 아니라, 실패 양태가 구체적인 결과를 낳는 영역에서 그러한 모델을 안전하게 배포하는 일입니다.

두 가지 실패 양태가 우리에게 가장 큰 관심사입니다. 첫째는 환각입니다. 검증된 데이터에 근거하지 않은 단정적 진술을 모델이 산출하는 것입니다. 검증 계층이 1차 방어선이며, 모르는 것을 플래그하도록 모델에게 지시하는 시스템 프롬프트가 2차 방어선입니다. 둘째는 규제 표류입니다. 충분히 유능한 모델이 주어졌을 때 분석이 아닌 투자 자문 산출로 흘러가도록 허용하고 싶은 유혹입니다. 당사 시스템 프롬프트에는 명시적 거부 지시가 포함되어 있으며, 내부 검토는 그러한 표류의 징후를 모델 출력에서 점검합니다.

당사는 Anthropic, OpenAI, DeepMind 및 언어 모델 안전에 관한 학술 문헌의 발표 성과를 진지하게 추적합니다. 우리가 그 문헌의 기여자는 아니지만, 주의 깊은 소비자입니다.

정량 모델링의 한계에 관하여

당사의 시나리오 모델링과 위험 계산은 미래 수익률의 분포, 상관관계의 지속성, 그리고 역사적 기록의 대표성에 관한 가정 위에 서 있습니다. 이러한 가정 각각은 어긋날 수 있습니다. 2008년 금융 위기, 2020년 팬데믹 유발 변동성, 그리고 2022년 금리 사이클의 단절은 각기 이전 국면에 보정된 모델의 한계를 드러냈습니다.

당사의 입장은 이것이 정량 모델링에 반대하는 논거가 아니라 그 한계를 명시적으로 진술해야 한다는 논거라는 것입니다. 방법론 문서는 각 계산이 의존하는 가정을 정리하며, 사용자는 그에 따라 산출물을 가늠하도록 권유됩니다. 한계가 보이는 모델이 자신감이 인위적으로 높은 모델보다 더 유용합니다.

AI 생성 콘텐츠 문제에 관하여

Drusus Daily의 상당 부분은 언어 모델에 의해 생성됩니다. 우리는 이를 방법론 문서가 이미 하고 있는 것보다 더 두드러진 방식으로 독자에게 공개해야 하는지를 검토한 끝에 구조적으로 그래야 한다는 결론에 이르렀습니다. 산문이 모델 생성임은 모든 호에 명시됩니다. 그러나 어떤 특정 문장이 모델 생성이고 어떤 것이 사람이 편집한 것인지는 식별하지 않습니다. 실제로 그 경계는 흐릿하며(편집 검토가 모델 출력을 실질적으로 수정합니다), 이항적 공개는 정보를 주기보다 오도하기 쉽기 때문입니다.

관련된 질문은 산문이 모델에 의해 생성되는지가 아니라 그것이 담는 수치가 옳은지입니다. 검증 계층이 이를 다룹니다. 편집 검토는 분석적 판단에 대해 책임집니다.

우리가 발행하는 리서치

당사의 장문 리서치는 Drusus Insights에 게재됩니다. 그곳에 발행되는 글들은 실무 투자자와 분석 전문가를 위한 것이지 학술 문헌을 위한 것은 아닙니다. 우리는 동료 심사 연구를 수행한다고 주장하지 않습니다. 플랫폼 사용자의 학술 작업에 당사 방법론이 기여하는 경우, 인용 안내는 방법론 페이지에 정리되어 있습니다.