The SecLab Blog | Ru

Relwarc: третья часть рассказа про алгоритм анализа клиентского JS для майнинга HTTP-запросов

2024-08-31T00:00:00+03:00

В этом посте (продолжающем эти: 1, 2) расскажу про поддержку библиотек, трансформацию вызовов в HTTP-запросы, о том, что в итоге получилось, какие выводы мы сделали, и кое-что ещё.

Но обо всём по порядку.

Как он работает — ещё про алгоритм

Алгоритм ищет в коде вызовы функций, отправляющие запросы на сервер. Но как, глядя на вызов, понять, что он отправляет на сервер запрос? И как понять, какой именно запрос отправляется? По идее, если вызываемая функция определена где-то в коде, можно было бы проанализировать её код, и всё понять. Но в реальности это может быть не так-то просто — многие современные JS-библиотеки устроены довольно сложно, а JavaScript-код тяжело анализировать статически. Как упоминалось в первом посте, даже с библиотекой jQuery, самой популярной в интернете, у существующих статических анализаторов есть проблемы. Поэтому мы используем сигнатуры библиотечных вызовов и модели библиотек, встроенные в анализатор.

Сигнатуры библиотечных вызовов

В анализатор встроен набор сигнатур, по которым он понимает, что вызов в коде — это вызов отправляющей запрос на сервер функции. Самые простые сигнатуры — те, которые мы добавили изначально, и которые активно используем до сих пор — работают просто по названиям функций. То есть, в анализатор просто встроено знание о том, что, если вызывается метод $.ajax, с именем объекта $ и именем метода ajax, то он отправляет запрос на сервер. Точно так же, как анализатор знает, что отправкой запросов занимается функция fetch и методы экземпляров класса XMLHttpRequest. Мы добавили такие сигнатуры для ряда популярных библиотек: jQuery, Angular, Axios. Благодаря ним анализатор, увидев $http.post(...), axios(...) или jQuery.post(...), поймёт, что это места отправки запросов на сервер. В него заложен список имён. Могут ли эти сигнатуры не сработать? Конечно. Достаточно было бы переименовать библиотечный объект или функцию, и вызов не найдётся. И всё же, нередко их достаточно. Разработчики навряд ли сами будут переименовывать библиотечные объекты: для читаемости кода лучше, чтобы вызов имел привычный вид. Тем не менее, функции и объекты библиотек могут быть переименованы при упаковке бандлерами, особенно в сочетании с минификацией. А некоторые библиотеки вообще не рассчитаны на то, чтобы ими пользовались через какой-то глобальный объект или функцию со стандартным названием. Поэтому в анализатор встроены и более сложные виды сигнатур — например, такие, которые распознают функцию по виду её кода (AST-сигнатуре на тело функции), и дальше, в местах использования, матчат её по значению, а не по имени.

Модели библиотек

Хорошо, вот мы нашли вызовы, постарались вычислить их аргументы. Но имя функции вместе с аргументами это, хоть и уже полезно, ещё не достаточно для сканера, чтобы искать уязвимости. Всё-таки ему нужны готовые HTTP-запросы. Сейчас мы решаем эту задачу довольно-таки «в лоб»: для всех функций, для которых у нас есть сигнатуры, мы написали руками код, который примерно моделирует их работу, то есть выданный анализатором набор аргументов преобразует в HTTP-запрос, который был бы отправлен таким вызовом с такими аргументами. Тут есть такая особенность, что эти аргументы не всегда полностью конкретные — какие-то значения могут быть неизвестными. При таких неполных данных мы хотели бы не падать с исключением (что вполне имеет право делать реальная библиотека), а всё таки выдать какой то результат, сохранив настолько много информации, насколько это возможно. В самом плохом случае URL-адрес может быть полностью неизвестным (или всё тело запроса целиком) — в этом случае анализатор такой запрос не выдаёт. Подробнее эту часть описывать тут не хочется, она довольно скучная: каждая «модель» библиотеки пытается учитывать разные нюансы работы библиотеки, а также разные случаи когда данные получились неконкретными. Лучше гляньте код.

Потому что мы его выложили.

Relwarc

Мы выложили код нашего анализатора в open source. А также сделали публично-доступный сервис relwarc.solidpoint.net, позволяющий запустить анализатор на JS-коде. Мы решили назвать анализатор Relwarc — то есть «сrawler» наоборот. Потому что он решает ту же задачу, что и краулер, но наоборот: пытается определить, какие запросы клиентский код посылает на сервер, но при этом не имитирует действия пользователя на странице, а смотрит на сам код. Работает не динамически, а статически.

Версию кода, которая примерно соответствует тому, что описано в этом и предыдущих постах, можно найти на GitHub, вот по такой ссылке:

https://github.com/seclab-msu/relwarc/tree/vanilla-algorithm

Она же соответствует описанию алгоритма из нашей научной статьи 2021 года.

Сервис relwarc.solidpoint.net умеет анализировать как отдельные JS-файлы, так и веб-страницы. Он предоставляет API и веб-UI, позволяющий вручную позапускать анализатор на чём-нибудь, поиграться с ним. Попробуйте им воспользоваться! Может быть он найдёт для вас новые серверные ручки в каком-то коде, который нет времени или сил разбирать вручную. Если найдёте баг или будет идея что улучшить — смело создавайте issue в репозитории на GitHub (или сразу pull-реквест)!

Что в итоге

Итак, в этом и двух предыдущих постах описан наш алгоритм анализа JS. Это и есть полный алгоритм, который мы разработали? Ну, на самом деле не совсем. Можно заметить, что ссылка на GitHub выше ведёт на тег, который соответствует не самому новому коммиту в репозитории. С тех пор, как мы разработали эту, базовую версию, мы доработали в алгоритме немало всего — определение возвращаемых значений функций, поддержку классов, бандлеров, ещё ряд улучшений. Чтобы описать их все и трёх постов маловато и, к тому же, алгоритм, описанный в статье, уже вполне себе работал, и мы применяли его на практике.

Метрика качества

Ну хорошо, вот мы делали этот алгоритм, реализовали там анализ цепочек вызвовов, добавляли такие улучшения и эдакие — и что же в итоге? Что мы получили? Этот анализатор работает вообще? Он нормально работает? Находит что-то? Чтобы ответить на этот вопрос, нам хорошо было бы иметь какой-то бенчмарк, позволяющий мерить качество работы алгоритма. Скажем, набор приложений или хотя бы веб-страниц, реальных или похожих на современные реальные, где из клиентского JS отправлялись бы запросы, и для которых был бы известен правильный ответ — какие именно запросы отправляются. Тогда мы могли бы сравнивать набор правильных запросов с тем, что выдал наш анализатор, и считать метрику качества. Мы не нашли такого бенчмарка (из похожего нашёлся WIVET, но он всё-таки немного про другое). Поэтому мы решили сделать свой! Мы создали датасет из страниц реальных приложений, для которых мы вручную разметили, к каким серверным эндпоинтам отправляет запросы их JS-код (точнее, там есть страница тестового приложения, но только одна — это главная страница Juice Shop). Почти все страницы датасета это страницы случайных сайтов из интернета — с сайтов из списка Alexa Top 1 Million или из публичных Bug Bounty программ. Этот датасет мы тоже решили опубликовать, вот он:

https://github.com/seclab-msu/ajax-page-dataset

Кроме самих страниц и разметки (наборов «правильных» запросов, которые должны найтись) в этом репо есть скрипты для прогона по нему анализатора и подсчёта метрик. Главная метрика качества, которую мы используем — это среднее покрытие. То есть считаем для каждой страницы процент найденных запросов и берём среднее значение этих процентов между всеми страницами. Сейчас для последней версии анализатора среднее покрытие около 40%.

В заключение

Задача статического анализа в общем случае неразрешима, а анализировать JavaScript-код особенно тяжело. Так что сделать анализатор, который работал бы идеально, полно и точно, в 100% случаев, невозможно. Но мы можем постараться сделать алгоритм, который будет работать в большинстве реальных случаев. Стараться дотянуть процент реальных приложений, на которых он работает, до 80% или 90%. Всегда можно будет сделать хитрый пример кода, на котором алгоритм сломается — ну и что с того, если такой код не будет встречаться почти никогда в реальной жизни? Чтобы понять, как сделать такой анализатор, который будет работать в реальности, нам пришлось не только программировать, но и заниматься исследованием реального кода. Куча времени ушла на изучение того, как устроена отправка запросов и потоки данных, от которых отправляемые запросы зависят.

Сейчас среднее покрытие на нашем датасете составляет 40% — это много или мало? Конечно, было бы классно иметь скор в те самые 80% или 90%. Но всё-таки JavaScript анализировать статически непросто, а мы старались сделать наш датасет более-менее представительным — то есть, чтобы, глядя на скор на нём, можно было составлять какое-то представление о качестве на случайно взятом случайном сайте из интернета. Ни один из существующих академических статических анализаторов JS не справляется с реальными современными веб-страницами. Следуя принципу, упомянутому в первом посте, мы решили начать с чего-то простого, чтобы не сделать сложную махину, которая так никогда и не сработает на чём-то реальном (или которую мы даже не допишем до конца). Начать с чего-то простого, и затем итеративно это улучшать, повышая скор и повышая сложность. Поддерживая новые фичи, новые особенности кода. В результате такой, более простой и учитывающий особенности реального кода анализатор (заточенный под решаемую задачу) способен справляться с реальными страницами, и часто у него получается обработать их довольно быстро — меньше чем за минуту, иногда за несколько минут.

Значит ли это, что этот анализатор всегда теперь надо развивать только итеративно, понемногу добавляя или меняя что-то? На самом деле нет — иногда надо всё-таки переписывать софт заново, передылывая его существенно. Быть может, построив алгоритм на немного других принципах. Но ценными останутся показатели на датасете, то, какие запросы находил прошлый алгоритм, и за какое время. То, какие тесты он проходил. То есть полученные знания. Если при разработке нового алгоритма он в чём-то будет уступать старому, всегда можно будет глянуть — а почему старому это удавалось? За счёт каких принципов работы он справлялся с какой-то конструкцией кода.

И, наконец, этот статический анализатор не заменяет, а дополняет динамические краулеры. Когда мы начали его разрабатывать, у нас была идея о том, что есть запросы, которые трудно стриггерить действиями в интерфейсе. Но всегда остаются и такие запросы, которые динамически найти легче. Потребовать 99% покрытия значило бы потребовать, чтобы статический анализатор везде полностью справлялся сам. Может такой алгоритм и можно сделать, но сейчас явно видно, что где-то разумнее применить его, а где-то проще будет воспользоваться динамическим анализом. Ни один из этих методов не является панацеей, и наибольшее покрытие получится, если применить и то и другое.

Майнинг HTTP-запросов из клиентского JS с помощью статического анализа — часть 2

2024-05-08T00:00:00+03:00

В предыдущем посте (гляньте его, если ещё не) мы посмотрели на базовую идею работы алгоритма и даже построили небольшой анализатор, основанный на ней. В этом посте расскажу ещё часть принципов устройства нашего алгоритма, включая поиск значений аргументов функций и хендлинг объектов типа инстансов XMLHttpRequest, а ещё кое-что про поддерживаемые операции.

И всё таки, как?

Как уже говорил, идейно алгоритм работает так же, как то, что было описано в прошлом посте. Но есть ряд отличий.

Поддерживаемые типы данных и операции

Анализатор поддерживает ряд типов данных, помимо строк и UNKNOWN. Среди них объекты, массивы, числа, boolean, ну и undefined тоже (да-да, напомню, что для undefined в JavaScript есть отдельный тип). То есть для этих типов анализатор превращает в значения их литералы (в том числе всякие [1, 2, 3] и {foo: "bar", abc: [true]}) и вычисляет результаты некоторых операций с ними. В том числе чтение поля объекта/массива (a[x], ob.prop) и запись поля (a[x] = 123, ob.prop = v).

Также поддерживаются функциональные значения — для объявлений функций и функциональных выражений (литералов, если угодно) анализатор тоже вырабатывает специальные значения, которые могут храниться в его memory.

То есть для вот такого кода

function f() {
    return 123;
}
var g = function(x) {
    return x * 25;
}
var k = f;
var l = g;

Анализатор поймёт, что переменные f и k указывают на первую функцию (которая возвращает 123), а g и l — на вторую (которая возвращает свой аргумент, умноженный на 25).

Эти функциональные значения содержат в себе ссылку на код соответствующей функции (точнее, на её AST). Это пригодится для межпроцедурного анализа, про него расскажу дальше.

Кстати, можно заметить, что значения, про которые знает анализатор, могут не только непосредственно в memory быть записаны — поскольку поддерживаются объекты и массивы, значения могут «сидеть» в полях объектов/массивов. Возможно, на какой-то глубине (с несколькими уровнями вложенности).

Ещё анализатор умеет вычислять результаты вызовов некоторых встроенных в язык функций, включая методы работы со строками (.concat(...), .substr(...) и т. д.). Кроме того, поддерживаются template strings. Это вот такие штуки:

`the value is ${x}`

И, как и раньше, если результат какой-то операции вычислить не удаётся, то результатом будет UNKNOWN. Такое может быть, если операция не поддерживается анализатором, или если неизвестно участвующее в операции значение. К примеру, если надо вычислить x = a[3], а у a значение UNKNOWN, то и x станет UNKNOWN.

Многопроходный анализ

Алгоритм анализа, который был описан в предыдущем посте, делает один обход AST-дерева в глубину — это более-менее соответствует проходу по коду в прямом порядке «от начала до конца». Но в реальности инструкции программы не всегда выполняются в том же порядке, в котором они написаны в коде. Функции, например, не обязаны вызываться в том порядке, в котором они в коде написаны. Что если нам попадётся какой-то такой код:

function f() {
    fetch(baseURL + '/users/list');
}

baseURL = '/blog/api';
f();

Здесь без объявления используется глобальная переменная baseURL. Или такой:

function createRequestService() {
    var apiVer, section;
    function getSettings() {
        fetch('/api/' + apiVer + '/' + section + '/settings');
    }
    function notifyOnline() {
        fetch(
            '/api/' + apiVer + '/' + section + '/status?online=true',
            { method: 'POST' }
        );
    }
    function initialize() {
        apiVer = '2.1';
        section = 'shop';
    }
    return { getSettings, notifyOnline, initialize };
}

В обоих случаях переменные задаются по коду дальше, чем используются. Можно сказать, что потоки данных «текут» не всегда от начала программы к концу, иногда они «текут обратно». Для того чтобы с таким справляться, анализаторы делают несколько проходов анализа по коду. Чтобы алгоритм был легковесным, мы решили начать с двух проходов — предварительного, на котором анализатор постарается пособирать заданные значения везде где найдутся, и, следующего, основного. Причём обрабатывает AJAX-вызовы анализатор только на основном проходе, а предварительный используется только для сбора значений в программе. Для случаев в двух сниппетах кода выше этого уже хватит. Для каких-то более сложных случаев уже нет.

Вообще, классические статические анализаторы, построенные на стандартных принципах, делают так — они итерируются по коду, собирая на каждом проходе всё больше информации о его работе, и делают это до тех пор, пока процесс не сойдётся — точнее, пока очередной проход по коду не добавит никакой новой информации. Чтобы это всегда срабатывало, надо чтобы алгоритм анализа был построен особым образом — чтобы процесс гарантированно сходился. Даже когда он сходится, бывает такое, что сходится слишком долго. Кстати, напомню, что узнать больше про классические алгоритмы анализа можно по ссылкам из прошлого поста.

По тому, как сделан наш алгоритм, можно увидеть, что идейно он заточен под нахождение значений, которые на самом деле «константные» — которые задаются один раз, причём задаётся какое-то конкретное значение (зафиксированное в коде, а не пришедшее извне). Делаем расчёт на то, что «фиксированные» части запроса, которые и определяют, какая серверная ручка задействуется, будут заданы таким образом. Переменные же части, параметры запросов (юзернеймы, поисковые запросы, количества товаров и т. д.) в коде не найдутся, ну может они нам и не нужны.

Межпроцедурный анализ

Процесс отправки запроса часто вовлекает в себя работу нескольких функций. Надо понимать, как данные передаются между ними. При разборе разных сэмплов реального кода, у нас это чаще всего выливалось в вопрос «какие данные приходят из аргументов функции?». Мы решили не делать полноценный межпроцедурный анализ для всех функций программы, так как решили, что это слишком тяжеловесно, а вместо этого решили сделать таргетированный анализ только для интересующих точек программы (позже мы, кстати, несколько пересмотрели это решение, но об этом в другой раз). Возвращаемые значения обычных, объявленных пользователем, функций мы решили для начала не искать — будем считать что они возвращают UNKNOWN. Сосредоточимся на аргументах.

Чтобы анализ получился таргетированным и искал аргументы только там, где нужно, надо как-то понять: а где же нужно. Для этого добавлено ещё одно специальное значение FROM_ARG. Оно в целом аналогично UNKNOWN, то есть это такое уникальное значение, которое обозначает что-то, для нас неизвестное. Но оно дополнительно несёт информацию о том, что значение пришло именно из формальных аргументов функции. При анализе тел функций анализ будет считать, что значения формальных аргументов это FROM_ARG.

Если далее это значение дойдёт до места вызова AJAX-функции ($.ajax например), то есть среди её аргументов будет FROM_ARG, будет сделан вывод, что отправляемый запрос зависит от формальных аргументов функции, сделавшей AJAX-вызов. А значит, надо поискать вызовы этой функции и то, какие там в неё передаются аргументы.

Как же будем искать? У нас есть наша мапа memory, в которой записаны значения переменных. При этом, как говорилось выше, анализатор поддерживает функциональные значения. Возьмём функцию, чьи вызовы мы хотим найти (функцию f в данном случае), пройдёмся по memory, взяв оттуда все переменные, указывающие на функциональное значение этой функции f. Ну то есть в простейшем случае это будет просто переменная f, но в теории могут быть и другие переменные, если, например, было присваивание типа other_func = f. Для каждой такой переменной пройдёмся снова по коду, ища места вызова, где на месте вызываемой функции стоит эта переменная — их будем считать местами вызова этой искомой функции f. Вот для них нам хорошо бы понять, какие аргументы в вызов передаются. Предположим, что найденное место вызова находится в какой-то другой функции, фукнции g.

Проделаем анализ тела этой функции g — то есть обход её тела в глубину таким же образом, как и раньше, но, когда дойдём до искомого места вызова f, то вычислим аргументы вызова и перейдём на начало кода f. В качестве значений формальных аргументов f на этот раз возьмём не FROM_ARG, а фактические значения, которые только что вычислили — и дальше будем выполнять анализ, обходя AST-дерево f от его корня. Таким образом мы «проэмулируем» вызов f с вычисленными аргументами. Теперь, когда, обходя код f, мы дойдём до AJAX-вызова, то имеем шанс найти уже более точные аргументы этого вызова.

Такой анализ повторим для всех найденных мест вызова.

Ещё может быть, что вызов нашёлся вне какой-либо функции, на top level. Тогда проделаем анализ всего глобального контекста, ещё один обход всего кода — то есть обработаем этот случай так, как будто весь код находится внутри одной гигантской всеобъемлющей функции. Это довольно неоптимально, но для простоты используем сейчас такой вариант.

Майнинг HTTP-запросов из клиентского JS с помощью статического анализа

2024-03-12T00:00:00+03:00

Привет! Мы в лаборатории компьютерной безопасности на факультете ВМК МГУ уже какое-то время занимаемся анализом клиентского JavaScript-кода для обнаружения HTTP-запросов, которые из него могут отправляться на сервер (AJAX-запросов). Цель — передать эту информацию сканеру, который ищет веб-уязвимости на стороне сервера в «black-box» режиме (когда нет доступа к серверным исходникам). Чтобы сканер знал, какие запросы принимает сервер, а значит, в какие запросы можно подставлять атакующие вектора. И мы сами делаем сканер веб-уязвимостей SolidPoint, в котором этот анализ используется. В этом посте и нескольких следующих расскажу про этот анализ: почему мы стали его делать, как он работает, что получается в результате.

Кстати, мы писали про это научные статьи (вот первая и основная из них), ещё я делал про это доклад в 2022 году (видео, слайды и другие материалы). Здесь будет примерно то же самое что и там, но написанное в блог-постовом формате.

Почему

Почему мы решили этим заняться? Ещё давным-давно во время пентестов мы периодически находили в клиентском JS отправку запросов к серверным ручкам, которые из интерфейса не задействовались. Бывало, что среди JS-кода на странице был код, соответствующий страницам админки, бывало такое, что вообще весь клиентский код сайта бандлился вместе и присутствовал на странице. Иногда в проверке аутентификации на сервере бывали ошибки (её могли просто забыть сделать) и тогда, найдя запрос в JS, мы могли совершить действие, которое текущему пользователю не должно было быть доступно (в том числе такое бывало и с админкой). Мы читали клиентский код и понимали, что за запрос отправляется. Так может быть, подумали мы, это можно делать как-то автоматически?

Запросы, отправляемые элементами HTML-разметки, найти несложно, а вот с JS труднее. Чтобы находить, какие запросы отправляет клиентский JS, сканеры обычно используют динамический краулинг — взаимодействие со страницами сайта с помощью управляемого браузера (headless браузера, например Headless Chrome). Это неплохо работает, но этот метод точно не найдёт такие запросы, как хотели находить мы — ведь для них нет элементов интерфейса, есть только JS-код, который был оставлен ненамеренно. Кроме того, даже с действиями, которые из интерфейса вызвать можно, у динамического краулера бывают проблемы — бывает что интерфейс страницы сложный, такой, в котором возможно много действий. А какие комбинации из этих действий приведут к отправке запроса краулер не знает. Чтобы найти запрос, который отправится после длинной цепочки действий, краулеру может потребоваться перепробовать слишком много всего, это может занять вечность. Поэтому мы решили попробовать сделать штуку, которая бы извлекала отправляемые запросы, не взаимодействуя с интерфейсом, а непосредственно из самого кода. То есть анализатор JavaScript-кода. Мы решили, что начать надо со статического анализа — ведь статический анализ умеет покрывать весь код вообще, независимо от того, насколько сложно его достичь при реальном выполнении.

Мы видим глазами, какой запрос отправляет функция в этом коде — должно же быть можно как-то автоматически это найти?

Ну и мы подумали: ведь куча сайтов отправляет с помощью клиентского JS запросы, при этом клиентский JS любого сайта доступен — значит, наш анализ можно применить к очень многим сайтам, потенциально найдя запросы к новым серверным ручкам — а значит, повысив вероятность найти уязвимость. Звучит прикольно!

Существующие анализаторы

JavaScript очень распространён, он уже давно главный и де-факто единственный язык для клиентской части сайтов — наверняка уже существуют какие-то статические анализаторы JS, верно? Может, можно использовать какой-то из них?

Выяснилось, что не совсем. Да, статические анализаторы JS вроде бы и есть, даже немало, но они мало что могут. Потому что JS вообще-то очень тяжело анализировать статически. Существуют несколько известных в научных статьях статических анализаторов (например TAJS, SAFE, WALA) — но все они неспособны анализировать реальные страницы современных сайтов, на любой странице с хоть сколько-нибудь нетривиальным кодом они либо зависают навсегда, либо падают с ошибкой. Либо и то и то (зависают на очень долго и потом падают с ошибкой). Такое происходит даже на простейшей страничке, где есть только библиотека jQuery (при этом jQuery сейчас есть на 77% сайтов). С тулзами не из научных статей ситуация похожая: они либо ломаются на реальном коде, либо дают о нём слишком мало информации.