C++17 STL Стандартная библиотека шаблонов - Яцек Галовиц
Обычно это значит, что нужно выполнить вызов std::transform для структуры данных, которая содержит случайные значения, а также вызвать простую функцию масштабирования. Но если мы не знаем, насколько большими или маленькими являются значения, то нужно сначала пройти по данным, чтобы найти правильные измерения для функции масштабирования.
Библиотека STL содержит полезные функции, которые можно применить для решения данной задачи: std::minmax_element и std::clamp. Эти функции можно использовать в совокупности с некоторыми лямбда-выражениями.
Как это делается
В этом примере мы нормализуем значения вектора из примера диапазона чисел двумя способами, использовав методы std::minmax_element и std::clamp.
1. Как и всегда, сначала включим следующие заголовочные файлы и объявим об использовании пространства имен std:
#include <iostream>
#include <vector>
#include <algorithm>
#include <iterator>
using namespace std;
2. Реализуем функцию, принимающую минимальное и максимальное значения диапазона, а также новый максимум, что позволит проецировать значения из старого диапазона в более мелкий. Объект функции принимает подобные значения и возвращает другой объект функции, который выполняет именно такое преобразование. Для простоты этим значением будет 0, поэтому независимо от того, какое смещение имели старые данные, нормализованные значения всегда будут соответствовать порядку нуля. Для повышения читабельности проигнорируем такой факт: значения max и min могут быть одинаковыми, что приведет к делению на ноль.
static auto norm (int min, int max, int new_max)
{
const double diff (max - min);
return [=] (int val) {
return int((val - min) / diff * new_max);
};
}
3. Еще один конструктор объектов функций с именем clampval возвращает объект функции, который захватывает значения max и min и вызывает функцию std::clamp, чтобы поместить получаемые значения в заданный диапазон:
static auto clampval (int min, int max)
{
return [=] (int val) -> int {
return clamp(val, min, max);
};
}
4. Данные, которые мы будем нормализовывать, представляют собой вектор, содержащий разнообразные значения. Они могут быть, например, данными о температуре, высоте ландшафта или стоимости акций, изменяющимися с течением времени:
int main()
{
vector<int> v {0, 1000, 5, 250, 300, 800, 900, 321};
5. Чтобы нормализовать эти данные, нужно иметь наивысшее и наименьшее значения. Здесь поможет функция std::minmax_element. Она возвращает пару итераторов, указывающих именно на эти два значения:
const auto [min_it, max_it] (
minmax_element(begin(v), end(v)));
6. Скопируем все значения из первого вектора во второй. Создадим экземпляр второго вектора и подготовим его к тому, чтобы он принял столько новых элементов, сколько содержится в первом векторе:
vector<int> v_norm;
v_norm.reserve(v.size());
7. С помощью функции std::transform скопируем значения из первого вектора во второй. При копировании элементов преобразуем их благодаря вспомогательной функции нормализации. Минимальное и максимальное значения старого вектора равны 0 и 1000. Минимальное и максимальное значения после нормализации равны 0 и 255:
transform(begin(v), end(v), back_inserter(v_norm),
norm(*min_it, *max_it, 255));
8. Прежде чем реализовать вторую стратегию по нормализации, выведем полученный результат:
copy(begin(v_norm), end(v_norm),
ostream_iterator<int>{cout, ", "});
cout << 'n';
9. Снова используем тот же нормализованный вектор, чтобы продемонстрировать работу другой вспомогательной функции clampval, которая сжимает старый диапазон к диапазону, в котором минимальное значение равно 0, а максимальное — 255:
transform(begin(v), end(v), begin(v_norm),
clampval(0, 255));
10. После вывода этих значений на экран пример будет закончен:
copy(begin(v_norm), end(v_norm),
ostream_iterator<int>{cout, ", "});
cout << 'n';
}
11. Скомпилируем и запустим программу. Поскольку значения элементов диапазона теперь попадают в диапазон от 0 до 255, можно использовать их, например, как показатели яркости для цветовых кодов RGB:
$ ./reducing_range_in_vector
0, 255, 1, 63, 76, 204, 229, 81,
0, 255, 5, 250, 255, 255, 255, 255,
12. На основе полученных данных можно построить следующие графики (рис. 5.2). Как видите, подход, когда мы делим значения на разность между максимальным и минимальным значениями, является линейным преобразованием оригинальных данных. Сжатый график теряет некоторый объем информации. Обе вариации могут оказаться полезными в разных ситуациях.
Как это работает
Помимо std::transform мы использовали два алгоритма.
std::minmax_element принимает начальный и конечный итераторы входного диапазона. Он проходит в цикле по диапазону данных и записывает в процессе максимальное и минимальное значения. Эти значения возвращаются в виде пары, которую мы затем применяем для функции масштабирования.
Функция std::clamp, напротив, не работает с диапазоном данных. Она принимает три значения: входное, минимальное и максимальное. Результатом работы этой функции явится входное значение, обрезанное так, что будет находиться между указанными минимумом и максимумом. Кроме того, можно воспользоваться конструкцией max(min_val, min(max_val, x)) вместо std::clamp(x, min_val, max_val).
Находим шаблоны в строках с помощью функции std::search и выбираем оптимальную реализацию
Поиск строки — несколько иная задача, нежели поиск одного объекта в указанном диапазоне данных. С одной стороны, строка, конечно же, представляет собой итерабельный диапазон данных (состоящий из символов). С другой — поиск строки в строке означает поиск одного диапазона данных в другом. Для этого нам понадобится выполнить несколько сравнений для потенциальной позиции, содержащей совпадение, так что нужен какой-то другой алгоритм.
std::string уже содержит функцию find, которая решает именно эту задачу; тем не менее в этом разделе мы сконцентрируемся на функции std::search. Несмотря на то, что она применяется по большей части для строк, ее можно использовать для контейнеров всех видов. Самая интересная особенность std::search заключается в том, что, начиная с C++17, у нее есть дополнительный интерфейс, позволяющий легко заменять алгоритм поиска. Эти алгоритмы оптимизированы, и пользователь может выбрать любой из них в зависимости от варианта применения. Вдобавок мы могли бы реализовать собственные алгоритмы поиска и подключить их в функцию std::search.
Как это делается
В этом примере мы воспользуемся новой функцией