Исследования

Gravenos — продуктовая компания, а не исследовательская лаборатория. Тем не менее мы занимаем позиции по тем исследовательским вопросам, от которых зависит наша работа; эта страница их излагает.

О безопасности ИИ

Мы не строим базовых моделей. Мы их используем, главным образом Anthropic Claude Sonnet на уровне Institution, с существенной инженерией системных подсказок и уровнем верификации, ограничивающим модель проверенными данными. Основным вопросом безопасности ИИ для фирмы в нашем положении является, следовательно, не выравнивание передовых моделей, что является работой лабораторий; это безопасное развёртывание этих моделей в области, где их режимы отказа имеют конкретные последствия.

Нас занимают два режима отказа. Первый — галлюцинация: производство моделью уверенно сформулированного утверждения, не основанного на проверенных данных. Уровень верификации — наша основная защита; системная подсказка, предписывающая модели отмечать то, чего она не знает, — вспомогательная. Второй — регуляторный дрейф: искушение, при достаточно способной модели, позволить ей соскользнуть к производству инвестиционных рекомендаций вместо анализа. Наши системные подсказки содержат явные инструкции к отказу; наш внутренний обзор исследует вывод модели на признаки такого дрейфа.

Мы серьёзно следим за публикуемой работой Anthropic, OpenAI, DeepMind и академической литературы по безопасности языковых моделей. Мы не являемся соавторами этой литературы, но являемся её внимательными читателями.

О пределах количественного моделирования

Наше сценарное моделирование и расчёт риска покоятся на допущениях о распределении будущих доходностей, устойчивости корреляций и репрезентативности исторического массива. Каждое из этих допущений может оказаться несостоятельным. Финансовый кризис 2008 года, вызванная пандемией волатильность 2020 года и слом цикла ставок 2022 года каждый по-своему обнажили пределы моделей, откалиброванных по прежним режимам.

Наша позиция состоит в том, что это не аргумент против количественного моделирования, а аргумент в пользу явного изложения его пределов. Методологическая документация излагает допущения, на которых покоится каждый расчёт; пользователю предлагается соответственно взвесить вывод. Модель, чьи пределы видны, полезнее модели, чья уверенность искусственно завышена.

О вопросе содержания, созданного ИИ

Существенные части Drusus Daily производятся языковой моделью. Мы рассматривали, следует ли раскрывать это читателю более заметно, чем это уже делает методологическая документация, и пришли к заключению, что структурный ответ — да: природа прозы, созданной моделью, декларируется в каждом выпуске. Мы, однако, не указываем, какие именно предложения сгенерированы моделью, а какие отредактированы человеком, поскольку на практике эта граница размыта (редакционная проверка существенно дорабатывает вывод модели) и поскольку бинарное раскрытие скорее ввело бы в заблуждение, чем информировало.

Релевантный вопрос состоит не в том, написан ли текст моделью, а в том, верны ли содержащиеся в нём цифры. Уровень верификации решает этот вопрос. Редакционная проверка отвечает за аналитическое суждение.

Исследования, которые мы публикуем

Наши длинные аналитические материалы выходят в Drusus Insights. Публикуемые там работы ориентированы на действующего инвестора и аналитического профессионала, а не на академическую литературу; мы не претендуем на проведение рецензируемых исследований. Там, где наша методология вносит вклад в академическую работу пользователей платформы, правила цитирования изложены на странице методологии.