Harvey и OpenAI: как кастомная ИИ-модель меняет юридическую практику
Всего за год Harvey превратился в ключевого игрока на рынке ИИ-решений для юристов, бухгалтеров и финансистов. Показатели роста:
Команда: 100+ специалистов
Выручка: рост в 10 раз за 2023 год
Инвестиции: $80 млн на раунде финансирования серии B, получив оценку в $715 млн.
Недавно Harvey объединилась с OpenAI для создания специализированной модели искусственного интеллекта, обученной на юридических данных. Это позволило разработать ИИ-систему, способную решать задачи, требующие сложных логических выводов, глубокого знания отрасли и многоуровневого анализа. Теперь система может помогать юристам в составлении документов, ответах на сложные вопросы по судебным разбирательствам и выявлении критически важных расхождений в сотнях контрактов.
Почему юристам нужен особый ИИ?
Harvey была основана юристом Уинстоном Вайнбергом, имеющим опыт в антимонопольных и финансовых спорах, и Гейбом Перейрой, исследователем ИИ, ранее работавшим с крупными языковыми моделями (LLMs) в Google Brain и Meta. Они увидели потенциал использования ИИ для структурирования юридической информации и упрощения работы адвокатов.
«Как транзакционные, так и судебные дела становятся все сложнее. Например, при международном слиянии может понадобиться анализировать сотни тысяч контрактов, а в рамках судебного разбирательства — миллионы электронных писем», — объясняет Вайнберг. Автоматизация обработки документов позволяет юристам тратить меньше времени на анализ и составление текстов и больше — на принятие решений и работу с клиентами.
Переломный момент наступил, когда Вайнберг и Перейра протестировали GPT-3, использовав его для анализа вопросов из Reddit-сообщества r/legaladvice о спорах между арендаторами и арендодателями. Полученные ответы они передали адвокатам на проверку. В 86 случаях из 100 юристы отметили, что могли бы отправить клиентам эти ответы без изменений. «Это был момент осознания возможностей технологии», — говорит Вайнберг.
Создание уникальной модели для анализа прецедентов
В команде Harvey задумались о том, как можно автоматизировать поиск прецедентного права: достаточно ли было бы просто скопировать клиентский запрос в модель, чтобы она дала точный ответ со ссылками на источники? Однако стандартные методы, такие как настройка базовых моделей через публичные API и применение retrieval-augmented generation (RAG), оказались недостаточны для такой сложной задачи.
«Обычные методы извлечения информации подходят для решения простых вопросов, но для серьезных юридических исследований этого мало», — объясняет Вайнберг. «Поиск прецедентного права — это поиск аргументов для защиты позиции, и это намного сложнее».
Базовые языковые модели хорошо справлялись с логическим анализом, но им не хватало специализированных юридических знаний. Поэтому Harvey решила сотрудничать с OpenAI для создания модели, способной интегрировать новые знания и логику работы с ними.
«Ни одна из этих задач не имеет однозначного решения», — говорит Перейра. «Мы проводили совместные сессии с юристами, которые объясняли, как работает поиск прецедентного права, а исследователи OpenAI помогали нам найти лучшие способы внедрения этой информации в модель».
Сначала команда сосредоточилась на судебных решениях штата Делавэр, а затем расширила охват на всю систему прецедентного права США. В результате в модель было добавлено эквивалентное 10 миллиардам токенов количество данных.
Точность, актуальность и ссылки на источники
Для тестирования новой модели Harvey привлекла 10 крупнейших юридических фирм. Юристы сравнивали результаты специализированной модели с ответами GPT-4. Реакция была однозначной: 97% опрошенных адвокатов предпочли новую модель.
«Обычно это происходило потому, что ответы были более полными, учитывали нюансы вопросов и содержали ссылки на соответствующие судебные решения», — рассказывает Вайнберг.
Одной из главных целей проекта было снижение риска ошибок (так называемых «галлюцинаций» ИИ). Этот аспект удалось проработать: «Наша модель не просто не придумывает судебные решения — каждый её вывод подтверждается конкретным делом, на которое она ссылается», — подчеркивает Вайнберг.
Сейчас Harvey исследует дальнейшие применения технологии: автоматизированное составление юридических заключений, помощь в подготовке ходатайств и разъяснение различий в прецедентном праве разных юрисдикций.
Следующее поколение языковых моделей
Перейра делится советом для основателей стартапов в сфере ИИ: «Не стоит разрабатывать решения, исходя из текущих возможностей моделей. Думайте о том, что они смогут делать в будущем. Беритесь за более сложные задачи сейчас, чтобы потом быть готовыми к их решению, когда модели станут мощнее».
Одним из новых направлений Harvey являются «агенты» — технологии, позволяющие объединять несколько вызовов модели в единый рабочий процесс. Это позволит упростить работу пользователей и минимизировать необходимость сложного запроса данных.
Видение Harvey — создание системы, которая станет полноценным помощником для юристов. «Объем юридической работы растёт, а сотрудники тратят бесконечные часы на сложные, но рутинные задачи», — говорит Вайнберг. «Мы видим огромную возможность для оптимизации не только в юриспруденции, но и во многих других профессиональных сферах. Освободив людей от рутины, мы позволим им сосредоточиться на действительно значимых задачах».
«Этот проект стал для нас настоящим вызовом», — добавляет Перейра. «Мы искали партнера, готового к инновациям, и среди всех вариантов мы доверили создание специализированной модели только OpenAI».
Гейб Перейра, исследователь ИИ и сооснователь Harvey:
«Это была передовая исследовательская работа. Мы рассмотрели все возможные варианты, но доверили создание кастомизированной модели только OpenAI».