Надежные распределенные вычислительные системы и приложения стали краеугольным камнем предприятий, особенно в автоматизации и управлении критически важными бизнес-процессами и предоставлении услуг клиентам.
От вас, как разработчиков и системных администраторов этих систем и приложений, ожидают всевозможных решений в области информационных технологий (ИТ), которые обеспечат наличие наиболее эффективных систем.
Сюда входят такие задачи, как разработка, тестирование и реализация стратегий для обеспечения производительности, надежности, доступности и масштабируемости системы/приложения, чтобы предоставить конечным пользователям удовлетворительный уровень обслуживания.
Кэширование – это одна из многих, очень простых, но эффективных технологий доставки приложений, на которые вы можете положиться.
Прежде чем двигаться дальше, давайте кратко рассмотрим, что такое кэширование, где и/или как оно может применяться, а также его преимущества.
Что такое кэширование или кэширование контента?
Кэширование (или кэширование контента) – это широко используемая техника хранения копий данных во временном хранилище (также известном как кэш), чтобы к данным можно было легко и быстро получить доступ при их извлечении из исходного хранилища.
Данные, хранящиеся в кэше, могут включать файлы или фрагменты файлов (например, HTML-файлы, скрипты, изображения, документы и т.д.), операции или записи базы данных, вызовы API, записи DNS и т.д. в зависимости от типа и цели кэширования.
Кэш может быть в виде аппаратного или программного обеспечения.
Очистка кэша браузера — как сделать и когда это необходимо?
Программный кэш (о котором пойдет речь в этой статье) может быть реализован на разных уровнях стека приложений.
Кэширование может применяться на стороне клиента (или на уровне представления приложения), например, кэширование браузера или кэширование приложения (или автономный режим). Большинство, если не все современные браузеры поставляются с реализацией HTTP-кэша.
Возможно, вы слышали популярную фразу “очистить кэш” при доступе к веб-приложению, чтобы вы могли видеть последние данные или содержимое сайта или приложения, вместо того чтобы браузер использовал старую копию содержимого, хранящуюся локально.
Другим примером кэширования на стороне клиента является кэширование DNS, которое происходит на уровне операционной системы (ОС).
Это временное хранение информации о предыдущих поисках DNS в ОС или веб-браузере.
Кэширование также может быть реализовано на сетевом уровне, в локальной или глобальной сети с помощью прокси-серверов. Распространенным примером такого типа кэширования являются CDN (Content Delivery Networks), которые представляют собой глобально распределенные сети веб-прокси-серверов.
В-третьих, вы также можете реализовать кэширование на исходном или внутреннем сервере (серверах).
Существуют различные формы кэширования на уровне сервера, к ним относятся:
- кэширование веб-сервера (для кэширования изображений, документов, скриптов и так далее).
- кэширование или запоминание приложений (используется при чтении файлов с диска, данных от других служб или процессов, запросе данных из API и т.д.).
- кэширование базы данных (для обеспечения доступа в памяти к часто используемым данным, таким как запрошенные строки базы данных, результаты запросов и других операций).
Обратите внимание, что данные кэша могут храниться в любой системе хранения, включая базу данных, файл, системную память и т.д., но они должны быть более быстрым носителем, чем первичный источник. В этом отношении кэширование в памяти является наиболее эффективной и часто используемой формой кэширования.
Зачем использовать кэширование?
Кэширование дает множество преимуществ, включая следующие:
- На уровне базы данных оно повышает производительность чтения до микросекунд для кэшированных данных. Для повышения производительности записи можно также использовать кэш с обратной записью, когда данные записываются в память, а затем через определенные промежутки времени записываются на диск или в основное хранилище. Однако аспект целостности данных может иметь потенциально катастрофические последствия. Например, при сбое системы непосредственно перед фиксацией данных в основном хранилище.
- На уровне приложений кэш может хранить часто читаемые данные в самом процессе приложения, сокращая время поиска данных с секунд до микросекунд, особенно по сети.
- Если рассматривать общую производительность приложения и сервера, то кэширование помогает снизить нагрузку на сервер, задержку и пропускную способность сети, поскольку кэшированные данные передаются клиентам, что улучшает время отклика и скорость доставки данных клиентам.
- Кэширование также позволяет обеспечить доступность контента, особенно через CDN, и имеет множество других преимуществ.
В этой статье мы рассмотрим некоторые из лучших инструментов с открытым исходным кодом (кэширование приложений/баз данных и кэширующие прокси-серверы) для реализации кэширования на стороне сервера в Linux.
1. Redis
Redis (полное название REmote DIctionary Server) – это бесплатная система распределенных вычислений in-memory с открытым исходным кодом, быстрая, высокопроизводительная и гибкая, которую можно использовать из большинства, если не из всех языков программирования.
Это хранилище структур данных in-memory, которое работает как механизм кэширования, постоянная база данных in-memory на диске и брокер сообщений.
Хотя Redis разработан и протестирован на Linux (рекомендуемая платформа для развертывания) и OS X, он также работает в других POSIX системах, таких как *BSD, без каких-либо внешних зависимостей.
Redis поддерживает множество структур данных, таких как строки, хэши, списки, множества, отсортированные множества, растровые изображения, потоки и многое другое.
Это позволяет программистам использовать определенную структуру данных для решения конкретной задачи.
Поддерживаются автоматические операции над структурой данных, такие как добавление к строке, добавление элементов в список, увеличение значения хэша, вычисление пересечения множеств и другие.
Среди ключевых особенностей Redis – репликация между ведущим и ведомым звеном (по умолчанию асинхронная), высокая доступность и автоматическое восстановление после сбоев с помощью Redis Sentinel, кластер Redis (можно масштабировать горизонтально, добавляя новые узлы кластера) и разделение данных (распределение данных между несколькими экземплярами Redis)
В нем также есть поддержка транзакций, скриптов Lua, ряд опций персистентности и шифрование обмена данными между клиентом и сервером.
Будучи базой данных в памяти, но постоянной на диске, Redis обеспечивает наилучшую производительность при работе с набором данных в памяти.
Однако его можно использовать и с базами данных на диске, такими как MySQL, PostgreSQL и многими другими.
Например, вы можете хранить в Redis очень тяжелые для записи небольшие данные, а другие фрагменты данных оставить в базе данных на диске.
2. Memcached
Memcached – это бесплатная, простая, но мощная система кэширования объектов распределенной памяти с открытым исходным кодом.
Это хранилище ключей-значений в памяти для небольших фрагментов данных, таких как результаты обращений к базе данных, вызовы API или рендеринг страниц.
Она работает на Unix-подобных операционных системах, включая Linux и OS X, а также на Microsoft Windows.
Являясь инструментом разработчика, он предназначен для повышения скорости работы динамических веб-приложений за счет кэширования содержимого (по умолчанию – кэш с наименьшим количеством последних использований (LRU)), снижая тем самым нагрузку на дисковую базу данных – он действует как кратковременная память для приложений.
Он предлагает API для самых популярных языков программирования.
Memcached поддерживает строки как единственный тип данных.
Имеет клиент-серверную архитектуру, где половина логики происходит на стороне клиента, а другая половина – на стороне сервера.
Важно, что клиенты понимают, как выбрать, на какой сервер записывать или с какого сервера читать тот или иной элемент.
Кроме того, клиент хорошо знает, что делать в случае, если он не может подключиться к серверу.
Хотя Memcached является распределенной системой кэширования и, следовательно, поддерживает кластеризацию, серверы Memcached не связаны друг с другом (т.е. они не знают друг о друге). Это означает, что нет поддержки репликации, как в Redis.
Они также понимают, как хранить и извлекать элементы, и управляют, когда выселять или повторно использовать память.
Вы можете увеличить доступную память, добавив больше серверов.
Memcached 1.5.13 поддерживает аутентификацию и шифрование через TLS, но эта функция все еще находится на экспериментальной стадии.
3. Apache Ignite
Apache Ignite – opensource решение, горизонтально масштабируемое распределенное in-memory хранилище ключей-значений, кэш и многомодельная система баз данных, которая предоставляет мощные API для обработки распределенных данных.
Она также является сеткой данных in-memory, которая может использоваться как в памяти, так и с собственной персистентностью Ignite.
Она работает на UNIX-подобных системах, таких как Linux, а также Windows.
Она имеет многоуровневое хранение данных, полную поддержку SQL и транзакций ACID (Atomicity, Consistency, Isolation, Durability) (поддерживается только на уровне API для ключей-значений) на нескольких узлах кластера, совместную обработку и машинное обучение.
Поддерживается автоматическая интеграция с любыми сторонними базами данных, включая любые РСУБД (такие как MySQL, PostgreSQL, Oracle Database и так далее) или NoSQL-хранилища.
Важно отметить, что хотя Ignite работает как хранилище данных SQL, это не совсем база данных SQL.
По сравнению с традиционными базами данных, он по-другому обрабатывает ограничения и индексы; он поддерживает первичные и вторичные индексы, но только первичные индексы используются для обеспечения уникальности. Кроме того, в ней нет поддержки ограничений по внешнему ключу.
Ignite также поддерживает безопасность, позволяя включить аутентификацию на сервере и предоставляя учетные данные пользователей клиентам.
Также поддерживается передача данных по сокетам SSL для обеспечения безопасного соединения между всеми узлами Ignite.
Ignite имеет множество вариантов использования, включая системы кэширования, ускорение рабочей нагрузки системы, обработку данных в реальном времени и аналитику. Он также может использоваться в качестве графоцентрической платформы.
4. Couchbase Server
Couchbase Server – это распределенная база данных NoSQL с открытым исходным кодом, ориентированная на работу с документами, которая хранит данные в виде элементов в формате ключ-значение. Он работает на Linux и других операционных системах, таких как Windows и Mac OS X.
Он использует многофункциональный, ориентированный на документы язык запросов N1QL, который обеспечивает мощные сервисы запросов и индексирования для поддержки субмиллисекундных операций с данными.
Его отличительными особенностями являются быстрое хранилище ключевых значений с управляемым кэшем, встроенные индексаторы, мощный механизм запросов, масштабируемая архитектура (многомерное масштабирование), интеграция больших данных и SQL, полнофункциональная безопасность и высокая доступность.
Couchbase Server поставляется с встроенной поддержкой кластера из нескольких экземпляров, где инструмент менеджера кластера координирует всю деятельность узлов и предоставляет клиентам просто интерфейс для всего кластера. Важно отметить, что вы можете добавлять, удалять или заменять узлы по мере необходимости, без простоев.
Также поддерживается репликация данных между узлами кластера и выборочная репликация данных между центрами обработки данных.
Он реализует безопасность через TLS с использованием выделенных портов Couchbase Server, различные механизмы аутентификации (с использованием учетных данных или сертификатов), контроль доступа на основе ролей (для проверки каждого аутентифицированного пользователя на соответствие определенным системой ролям, которые ему назначены), аудит, журналы и сессии.
Она специально разработана для обеспечения управления данными с низкой задержкой для крупномасштабных интерактивных веб-, мобильных и IoT-приложений.
🖴 Самые опасные угрозы для баз данных и способы их предотвращения
5. Hazelcast IMDG
Hazelcast IMDG (In-Memory Data Grid) – это легкое, быстрое и расширяемое промежуточное программное обеспечение с открытым исходным кодом, обеспечивающее эластично масштабируемые распределенные вычисления In-Memory.
Hazelcast IMDG также работает на Linux, Windows, Mac OS X и любой другой платформе с установленной Java.
Он поддерживает широкий спектр гибких и языковых структур данных, таких как Map, Set, List, MultiMap, RingBuffer и HyperLogLog.
Hazelcast является одноранговым и поддерживает простую масштабируемость, настройку кластера (с возможностью сбора статистики, мониторинга по протоколу JMX и управления кластером с помощью полезных утилит), распределенные структуры данных и события, порционирование данных и транзакции.
Он также является избыточным, поскольку хранит резервную копию каждой записи данных на нескольких членах.
Для масштабирования кластера достаточно запустить еще один экземпляр, данные и резервные копии будут автоматически и равномерно сбалансированы.
Он предоставляет набор полезных API для доступа к центральным процессорам в вашем кластере для достижения максимальной скорости обработки данных.
Он также предлагает распределенные реализации большого количества удобных для разработчиков интерфейсов Java, таких как Map, Queue, ExecutorService, Lock и JCache.
Его функции безопасности включают аутентификацию членов кластера и клиентов и проверку контроля доступа к клиентским операциям с помощью функций безопасности на базе JAAS.
Она также позволяет перехватывать сокетные соединения и удаленные операции, выполняемые клиентами, шифровать связь между членами кластера на уровне сокетов и включать сокетную связь SSL/TLS. Однако, согласно официальной документации, большинство этих функций безопасности предлагаются в версии Enterprise.
Наиболее популярным вариантом использования является распределенное кэширование и хранение данных в памяти. Но его также можно развернуть для кластеризации веб-сессий, замены NoSQL, параллельной обработки, простого обмена сообщениями и многого другого.
6. Mcrouter
Mcrouter – это бесплатный маршрутизатор протокола Memcached с открытым исходным кодом для масштабирования развертывания Memcached, разработанный и поддерживаемый Facebook.
Он поддерживает протокол Memcached ASCII, гибкую маршрутизацию, многокластерную поддержку, многоуровневые кэши, объединение соединений, несколько схем хэширования, префиксную маршрутизацию, реплицированные пулы, теневое копирование производственного трафика, онлайн-реконфигурацию и мониторинг состояния назначения/автоматическое восстановление после отказа.
Кроме того, поддерживается холодный прогрев кэша, богатая статистика и команды отладки, надежное качество обслуживания удаленного потока, большие значения и широковещательные операции, а также поддержка IPv6 и SSL.
Он используется в Facebook и Instagram в качестве основного компонента инфраструктуры кэширования, обрабатывая почти 5 миллиардов запросов в секунду в пике.
7. Varnish Cache
Varnish Cache – это гибкий, современный и многоцелевой ускоритель веб-приложений с открытым исходным кодом, который находится между веб-клиентами и исходным сервером.
Он работает на всех современных платформах Linux, FreeBSD и Solaris (только x86).
Это отличный механизм кэширования и ускоритель контента, который можно установить перед веб-сервером, таким как NGINX, Apache и многими другими, для прослушивания HTTP-порта по умолчанию для получения и перенаправления клиентских запросов на веб-сервер и доставки ответа веб-сервера клиенту.
Выступая в роли посредника между клиентами и исходными серверами, Varnish Cache предлагает несколько преимуществ, главным из которых является кэширование веб-контента в памяти для снижения нагрузки на веб-сервер и повышения скорости доставки клиентам.
После получения HTTP-запроса от клиента он пересылает его на внутренний веб-сервер. Как только веб-сервер отвечает, Varnish кэширует содержимое в памяти и доставляет ответ клиенту. Когда клиент запрашивает тот же контент, Varnish будет обслуживать его из кэша, увеличивая ответ приложения.
Если он не может обслужить содержимое из кэша, запрос перенаправляется на бэкэнд, а ответ кэшируется и доставляется клиенту.
8. Кэширующий прокси-сервер Squid
Еще одним бесплатным с открытым исходным кодом, выдающимся и широко используемым прокси и кэширующим решением для Linux является Squid.
Это многофункциональный веб-прокси кэш-сервер, который предоставляет услуги прокси и кэширования для популярных сетевых протоколов, включая HTTP, HTTPS и FTP.
Он также работает на других платформах UNIX и Windows.
Как и Varnish Cache, он получает запросы от клиентов и передает их на указанные внутренние серверы.
Когда внутренний сервер отвечает, он сохраняет копию содержимого в кэше и передает ее клиенту.
Будущие запросы на тот же контент будут обслуживаться из кэша, что приведет к более быстрой доставке контента клиенту.
Таким образом, он оптимизирует поток данных между клиентом и сервером для повышения производительности и кэширует часто используемый контент для снижения сетевого трафика и экономии пропускной способности.
Squid обладает такими возможностями, как распределение нагрузки по взаимосвязанным иерархиям прокси-серверов, получение данных о моделях использования Интернета (например, статистика наиболее посещаемых сайтов), позволяет анализировать, перехватывать, блокировать, заменять или изменять проксируемые сообщения.
Он также поддерживает функции безопасности, такие как богатый контроль доступа, авторизация и аутентификация, поддержка SSL/TLS и ведение журнала активности.
см. также:
- 🦑 Установка и настройка Squid прокси на Rocky Linux
- 🦑 Установка и настройка прокси Squid на CentOS 8 / RHEL 8
9. NGINX
NGINX (произносится как Engine-X) – это высокопроизводительное, полнофункциональное и очень популярное консолидированное решение с открытым исходным кодом для создания веб-инфраструктуры.
Это HTTP-сервер, обратный прокси-сервер, почтовый прокси-сервер и общий TCP/UDP-прокси-сервер.
NGINX предлагает базовые возможности кэширования, при которых кэшированный контент хранится в постоянном кэше на диске.
Самое интересное в кэшировании контента в NGINX то, что он может быть настроен на доставку устаревшего контента из своего кэша, когда он не может получить свежий контент с исходных серверов.
NGINX предлагает множество функций безопасности для защиты ваших веб-систем, включая завершение SSL, ограничение доступа с помощью базовой аутентификации HTTP, аутентификацию на основе результата подзапроса, аутентификацию JWT, ограничение доступа к проксированным HTTP-ресурсам, ограничение доступа по географическому положению и многое другое.
Обычно он используется в качестве обратного прокси, балансировщика нагрузки, SSL-терминатора/шлюза безопасности, ускорителя приложений/кэша контента и API-шлюза в стеке приложений. Он также используется для потоковой передачи мультимедиа.
см. также:
- 🛡️ Как ограничить пропускную способность сети на веб-сервере NGINX
- 🌐 Настройка заголовков безопасности HTTP на сервере Nginx / Apache
- 🌐 Блокирование вредоносных ботов, спама, юзер-агентов, Ransomware на Nginx
- 🌐 Заголовки безопасности HTTP – полное руководство
- 🌐 Nginx WAF с ModSecurity и OWASP CRS
- 🛡️ Как отобразить удаленный адрес с помощью Nginx
- 🌐 Как исправить распространенные ошибки веб-сервера Nginx
- 🌐 Как контролировать доступ на основе IP-адреса клиента в NGINX
- 🐉 Настройка http-сервера Kali Linux
10. Apache Traffic Server
И, наконец, Apache Traffic Server, быстрый, масштабируемый и расширяемый кэширующий прокси-сервер с открытым исходным кодом и поддержкой HTTP/1.1 и HTTP/2.0. Он предназначен для повышения эффективности и производительности сети путем кэширования часто используемого контента на границе сети, для предприятий, ISP (Internet Server Providers), магистральных провайдеров и др.
Он поддерживает прямое и обратное проксирование трафика HTTP/HTTPS. Он также может быть настроен на работу в одном или обоих режимах одновременно. Он имеет постоянное кэширование, API плагинов, поддержку ICP (Internet Cache Protocol), ESI (Edge Side Includes), Keep-ALive и многое другое.
Что касается безопасности, Traffic Server поддерживает контроль доступа клиентов, позволяя вам настраивать клиентов, которым разрешено использовать прокси-кэш, SSL завершение соединений как между клиентами и собой, так и между собой и сервером происхождения.
Он также поддерживает аутентификацию и базовую авторизацию через плагин, протоколирование (каждого полученного запроса и каждой обнаруженной ошибки) и мониторинг.