Дослідження

Gravenos є продуктовою компанією, а не дослідницькою лабораторією. Проте ми займаємо позиції з дослідницьких питань, від яких залежить наша робота; ця сторінка їх викладає.

Про безпеку ШІ

Ми не створюємо фундаментальні моделі. Ми їх використовуємо, переважно Anthropic Claude Sonnet на рівні Institution, із суттєвим інженерним опрацюванням системного підказа та верифікаційним рівнем, який обмежує модель верифікованими даними. Тому головне питання безпеки ШІ для компанії в нашій позиції — це не вирівнювання моделей фронтиру, що є роботою лабораторій; це безпечне розгортання цих моделей у сфері, де їхні режими відмови мають конкретні наслідки.

Нас турбують два режими відмови. Перший — галюцинація: вироблення моделлю впевнено сформульованого твердження, не заземленого у верифікованих даних. Наш верифікаційний рівень є основним захистом; системний підказ, що зобов'язує модель позначати те, чого вона не знає, — допоміжним. Другий — регуляторний дрейф: спокуса, маючи достатньо здібну модель, дозволити їй сповзти до видавання інвестиційних порад замість аналізу. Наші системні підкази містять чіткі вказівки про відмову; наш внутрішній огляд перевіряє вихід моделі на ознаки такого дрейфу.

Ми серйозно стежимо за опублікованими роботами Anthropic, OpenAI, DeepMind та академічною літературою з безпеки мовних моделей. Ми не є дописувачами до цієї літератури, але ми її уважні читачі.

Про межі кількісного моделювання

Наше сценарне моделювання та розрахунок ризику ґрунтуються на припущеннях про розподіл майбутньої прибутковості, стійкість кореляцій і репрезентативність історичного запису. Кожне з цих припущень може не справдитися. Фінансова криза 2008 року, спричинена пандемією волатильність 2020 року та злом ставкового циклу 2022 року — кожна з цих подій оголила межі моделей, відкаліброваних на попередніх режимах.

Наша позиція полягає в тому, що це не аргумент проти кількісного моделювання, а аргумент за те, щоб явно зазначати його межі. Документація з методології викладає припущення, на яких ґрунтується кожен розрахунок; користувача запрошують зважувати результат відповідно. Модель, чиї межі видимі, корисніша за модель, чия впевненість штучно завищена.

Про питання контенту, згенерованого ШІ

Істотні частини Drusus Daily створюються мовною моделлю. Ми розглянули, чи слід це розкривати читачам у виразніший спосіб, ніж це вже робить документація з методології, і дійшли висновку, що структурна відповідь — так: породжена моделлю природа тексту декларується у кожному випуску. Однак ми не вказуємо, які саме речення згенеровані моделлю, а які відредаговані людиною, бо на практиці межа є розмитою (редакційний огляд істотно править вихід моделі), і бо бінарне розкриття радше вводило б в оману, ніж інформувало.

Релевантне питання — не в тому, чи текст породжений моделлю, а в тому, чи правильні цифри, які він містить. Верифікаційний рівень розв'язує саме це. Редакційний огляд відповідає за аналітичне судження.

Дослідження, які ми публікуємо

Наші великоформатні дослідження з'являються в Drusus Insights. Опубліковані там матеріали позиціоновані для працюючого інвестора та аналітичного професіонала, а не для академічної літератури; ми не претендуємо на проведення досліджень із рецензуванням колег. Якщо наша методологія робить внесок в академічну роботу користувачів платформи, настанови щодо цитування викладено на сторінці методології.

Перегляньте архів Аналітики →