Государственным и частным организациям пришлось развернуть собственные цифровые системы, что привело к экспоненциальному росту внедрения технологий и сетей передачи данных.
От автоматизированных цепочек поставок и систем по поддержанию социального дистанцирования до более ресурсоэффективных и удобных «умных» городов и транспортных средств — пространство «Интернета вещей» (IoT) росло огромными темпами, и параллельно увеличивался объем создаваемых данных. По прогнозам, к 2025 году IoT-устройствами будет сгенерировано 73,1 зеттабайта данных.
Все эти данные надо не просто получать, но и хранить, обеспечивать к ним доступ и анализировать для получения ценной аналитической информации. Процесс, позволяющий выполнять такие задачи, должен опираться на комплексную информационную архитектуру, способную на протяжении всего жизненного цикла данных обрабатывать запросы на их использование, поступающие от самых разных приложений.
Как выглядит жизненный цикл IoT-данных?
Львиная доля IoT-данных хранится в облаке на больших накопителях – объемом до 20 Тбайт. Этот огромный массив информации используется для выполнения завязанных на большие данные (big data) и быстрые данные (fast data) рабочих задач, таких как исследование генома, аналитика пакетных данных, прогнозное моделирование и оптимизация цепочки поставок.
В некоторых сценариях на следующем этапе данные отправляются на периферию сети, часто для кэширования на распределенные периферийные серверы (edge servers) и последующего использования в таких приложениях и устройствах, работающих в реальном времени, как автономные автомобили, облачные игры, промышленные роботы и потоковая передача видео в 4K/8K.
После этого мы, наконец, добираемся до конечных точек (endpoints), в которых данные генерируются оборудованием, «умными» устройствами и носимыми гаджетами, подсоединенными к сети. В данном случае для вариантов использования, сопряженных с большими потоками данных, основной задачей становятся сокращение времени отклика сети (сетевой задержки) и увеличение пропускной способности между слоями (как от конечных точек в облако, так и в обратном направлении). Одним из возможных решений здесь может стать технология 5G, в которой «информационные сверхскоростные магистрали» под нужды инновационных решений, наиболее чувствительных к времени задержки и величине пропускного канала, строились бы на миллиметровых волнах (mmWave) длиной от 20 до 100 ГГц.
В чем ценность ваших IoT-данных?
В нашем цифровом мире инфраструктура данных играет ключевую роль, поскольку их хранение и анализ должны выполняться быстро, эффективно и безопасно. Таким образом, в рамках ценностного подхода роль архитектуры выходит за пределы простой регистрации и хранения и включает в себя преобразование информации и создание ценности для бизнеса. Приведем несколько примеров.
Автономные автомобили буквально напичканы всевозможными датчиками, камерами, лидарами, радарами и другими устройствами, генерирующими огромное количество данных (ожидается, что их ежедневный объем для одного транспортного средства достигнет 2 Тбайт). Эти данные ложатся в основу принятия в реальном времени решений, связанных с управлением транспортным средством, с опорой на такие технологии, как трехмерные карты, продвинутые системы помощи водителю (ADAS), обновления по беспроводной сети (over-the-air или OTA) и связь автомобиля со всеми объектами (Vehicle-to-Everything или V2X). Кроме того, IoT-данные повышают ценность персонализированного контента информационно-развлекательных систем и бортовых служб, улучшая впечатления пассажиров от взаимодействия с автомобилем. Принятие решений в реальном времени является важнейшей составляющей обеспечения безопасности пассажиров. В этой связи критически важной характеристикой информационной архитектуры, поддерживающей такие решения, выступают низкая задержка и высокая пропускная способность для облегчения прогнозного технического обслуживания.
Носимые устройства медицинского назначения. По некоторым прогнозам, в 2021 году конечные пользователи потратят на носимые девайсы в общей сложности $81,5 млн. Такие устройства генерируют важные данные, используемые для контроля за фазами сна, измерения пройденного за сутки расстояния и определения уровня питательных веществ и кислорода в крови. По ним можно выявить дневную, месячную и годовую динамику, которая может лечь в основу рекомендаций по выработке полезных для здоровья привычек. Кроме того, эти данные помогут подобрать схему лечения и профилактики, наиболее подходящую конкретному человеку, в особенности учитывая позитивную динамику в области телемедицины и оказания услуг здравоохранения в дистанционном режиме, которая сохранится и после пандемии. В таком случае приоритетной задачей архитектуры СХД будет долгосрочное хранение критически важных данных о пациенте.
Помимо этого, упомянутые далее сценарии использования IoT подтверждают важный тезис о том, почему подход к архитектуре СХД следует адаптировать под каждый конкретный случай и как можно удовлетворить соответствующие каждому сценарию требования.
Поисково-спасательные беспилотные летательные аппараты (БПЛА) — отличный пример сценария использования «Интернета вещей», который прекрасно иллюстрирует необходимость узкоспециального решения для хранения данных, повышающего ценность использования БПЛА. Такие дроны часто эксплуатируются в суровых природных условиях (под воздействием экстремальных температур и плохой погоды). Поэтому решения для хранения данных, примененные в них, должны обладать повышенной надежностью. В качестве примеров можно привести промышленные e.MMC-накопители и встроенные универсальные флеш-накопители UFS.
Кроме того, нередки случаи использования поисково-спасательных БПЛА в качестве одного из компонентов более разветвленной сети систем и устройств, что дает дронам возможность оптимизировать траектории полета и выполнять общие задания в автоматическом режиме. Это означает, что информационная архитектура должна быть масштабируемой и поддерживать одновременное использование нескольких технологий с высочайшей эффективностью, производительностью и надежностью.
«Умные города». Чтобы такие города могли правильно функционировать, следует обеспечить хранение как архивных данных, так и данных в реальном времени. При анализе данных в реальном времени IoT-технологии опираются на хранилища, расположенные на периферии сети и в конечных точках. Так, для правильной работы «умных» систем общественного транспорта нужны оперативные данные о дорожном движении, ведь без них невозможно быстро и точно подстроиться под пиковый спрос (в частности, в часы пик). В этом плане подобный сценарий чем-то напоминает «умные» автомобили, потому что важнейшей характеристикой СХД также будет минимальное время отклика.
В качестве обратного примера: при хранении архивной информации скорость передачи данных в реальном времени не так важна, поскольку на передний план выходит гарантия их целостности в долгосрочной перспективе. В этом случае следует обратить внимание на облачные решения. «Умные» инструменты картографирования углерода служат еще одним примером использования IoT, построенным вокруг данных об углеродных выбросах за прошедшие периоды и сделанных на их основе прогнозах о динамике изменений и приоритетных направлениях принятия мер по снижению таких выбросов.
От общей архитектуры – к специализированной
Выбор способа хранения данных и наиболее подходящих методов извлечения из них ценной аналитической информации будет зависеть от технологии и сети передачи данных. СХД с поддержкой NVMe, например, идеально подходят для сценариев, в которых на передний план на протяжении всего цикла обработки данных выходят высокая производительность и низкая задержка. Поэтому для оптимального использования ценных IoT-данных требуется специализированное хранилище, и это следует учитывать уже на этапе проектирования всего комплекса информационной инфраструктуры.
Впрочем, для управления корпоративными IoT-данными многие компании до сих пор используют серийную или неспециализированную архитектуру, хотя она не полностью закрывает постоянно меняющиеся потребности IoT-приложений как у частных, так и у корпоративных клиентов. Для поисково-спасательных БПЛА, например, приоритетами являются надежность и прочность, в то время как в цифровой медицине решения для хранения данных должны гарантировать целостность и безопасность критичной информации о пациентах в долгосрочной перспективе. Именно поэтому представляется необходимым перейти от типовых хранилищ к специализированным СХД и предлагать индивидуальные решения для конкретных проблем и сценариев использования.
Для любой информационной инфраструктуры приоритетом является повышение ценности данных. В случае если IoT-данные предполагается использовать в реальном времени, стратегия организации СХД должна быть выстроена специально под IoT и учитывать следующие соображения:
Доступность: как обеспечиваются поддержка, сетевое соединение и обслуживание?
Устойчивость к износу: преобладающая операция – ЗАПИСЬ или ЧТЕНИЕ?
Требования к хранилищу: какие данные и в каком объеме необходимо обрабатывать, анализировать и сохранять в конечных точках, на периферии сети и в облаке?
В каких условиях предстоит принимать и хранить данные (высота над уровнем моря, температура, влажность, вибрации)?
Специализация как ключ к оптимизации
Залог оптимального использования всего потенциала меняющегося ландшафта IoT-данных – выбор специализированных и дающих уникальные бизнес-преимущества решений для хранения данных. В условиях, когда требования к различным IoT-приложениям кардинальным образом отличаются, не представляется возможным, как прежде, полагаться на какой-то один стандарт, на «универсальные» решения для хранения данных.
Внедрение инновационных и специализированных решений для хранения данных поможет компаниям и организациям не заблудиться в быстро меняющемся IoT-пространстве и избежать необоснованных потерь ценных данных в процессе их обработки.