Уильям Мартин
Дезагрегация - это процесс взятия совокупного сигнала, такого как данные о электроэнергии, измеряемой через регулярный интервал, и разложения его на отдельные компоненты, такие как использование чайника или тостера. Дезагрегация энергопотребления - сложная задача, поскольку в одном доме могут одновременно работать десятки приборов, каждое из которых работает на определенном уровне мощности; или, более сложные, нечеткие уровни мощности. Чтобы упростить задачу, многие бытовые приборы имеют отличительные рабочие компоненты, такие как двигатели, нагревательные элементы и компрессоры, и для них можно обучить классификаторы обнаруживать их рабочие сигналы.
На рисунке 1 показано, как совокупная электрическая нагрузка может выглядеть в течение 40 минут при одновременной работе холодильника и духовки. Это также показывает, что сигнал часто бывает сложным, и устройства всегда работают поверх основной фоновой сигнатуры, вызванной освещением и приборами в режиме ожидания.
В этой статье я рассмотрю некоторые из наиболее популярных подходов к решению проблемы отслеживания состояния дома. В данной статье это определяется как: средство моделирования вкладов отдельных приборов в совокупный сигнал электроэнергии с течением времени.
Конечные автоматы
Популярный подход, предложенный Хартом '92, заключался в разделении разбивки по энергии на этапы обнаружения событий и последующего согласования фронтов и отслеживания состояния. Подход Харта заключался в обнаружении включения-выключения устройства (начала или смещения) и отслеживании домашнего хозяйства с помощью конечного автомата (FSM), пытаясь минимизировать разницу между энергией FSM и совокупной нагрузкой дома.
При таком подходе мы пытаемся минимизировать разницу в любой момент времени между совокупной мощностью и суммой состояний наших устройств. Например, включение чайника мощностью 3 кВт одновременно с тостером мощностью 1 кВт ближе к объяснению совокупной нагрузки в 4 кВт, чем просто чайник. Изменение совокупной нагрузки с 4 кВт до 1 кВт лучше всего объяснить отключением чайника, и это заключено в модели FSM.
Скрытые марковские модели
Скрытая марковская модель (HMM) основывается на конечном автомате, вводя концепцию, согласно которой состояние переменной в модели зависит от ее предыдущего состояния, а также потенциально состояний других переменных в модели. Это означает, что изменение состояния чайника с выключенного на включенное зависит от того, был ли он ранее включен или выключен (это кажется довольно очевидным, но можно делать прогнозы, не инкапсулируя эту информацию в модели), в дополнение к зависимости от того, включен ли тостер. включен или выключен, например.
В общем, скрытая структура HMM может быть сколь угодно сложной и поэтому трудноразрешимой, однако можно сделать некоторые разумные предположения для упрощения вещей. Распространено предположение, что приборы используются независимо друг от друга. Это предположение противоречит интуиции (мы обычно используем сушилку после стиральных машин), но делает вычисления удобными. Это называется Факториальным HMM (FHMM). Эта модель ограничивает HMM набором известных состояний, что является приближением, позволяющим проводить эффективные вычисления.
Фактически, большинство подходов NILM используют факторную скрытую полумарковскую модель (FSHMM), которая также включает время в граф зависимостей (частично, потому что состояния не только зависят от предыдущего временного шага, но могут иметь зависимости более дальнего действия), что позволяет продолжительность нахождения в состоянии влияет на вероятность перехода. Это приводит к использованию распределений мощности и продолжительности состояний для описания вероятности включения или выключения устройств при любом заданном уровне мощности и в течение любой продолжительности. Такие подходы к отслеживанию могут «изменить свое мнение», например: начало 3 кВт, скорее всего, будет описано как чайник, но по истечении определенного времени без изменения совокупной нагрузки, то есть 5 минут, его шансы на то, что Чайник быстро иссякает, и теперь это можно лучше всего объяснить как духовку или маломощный электрический душ.
Кластеризация
Подходы к кластеризации используют подход, связанный с объединением групп переходов начала или смещения одинакового размера с последующим их маркированием. Преимущество этого подхода состоит в том, что он эффективен с точки зрения вычислений и может быть обучен без метки на лету. Например, для чайника могут быть помечены узкие группы начальных значений мощностью 3 кВт и отклонений мощностью 3 кВт. Теперь предположим, что мы видим набор из 2-киловаттных включений и смещений в быстрой последовательности: для этого нет помеченного кластера, поэтому один создается и называется «Неизвестное устройство 1». Будущие переходы такого размера теперь помечаются как таковые до тех пор, пока человек не сможет изменить ярлык этого кластера.
Zhao et al. использовал подход разложения совокупного сигнала (P) на дельта-края (дельта P). Эти края затем группируются по величине, начальные кластеры связаны с кластерами смещения аналогичного размера, и пара помечается как устройство.
Барсим и др. использовал подход, предполагающий, что использование устройства окружено так называемым основным состоянием. Это основное состояние (уровень мощности одинакового размера до и после использования устройства) позволяет нам обнаруживать отдельное устройство по одной метке использования и легко сочетать начало со смещениями.
Нейронные сети
Подходы сверточной нейронной сети принимают в качестве входных данных последовательность входной мощности / тока / напряжения с временными рамками и используют направленный граф слоев нейронов для выполнения сверток (преобразования), объединения (агрегации) и нелинейных активаций для последующей классификации. Рекуррентные подходы, такие как LSTM, сохраняют некоторую память о прошлых входных данных, чтобы лучше информировать классификацию.
Келли и др. ’15 экспериментировали с подходами свертки и рекуррентными подходами, обнаружив, что LSTM (общий подход рекуррентной нейронной сети, который сохраняет некоторую память о прошлых входных данных) могут сравняться по производительности с HMM с целью дезагрегации энергии. Эти подходы были разработаны рядом авторов. Для краткости мы не будем перечислять их все здесь, а укажем заинтересованным читателям на «Обзор методологий и методов бесконтактного мониторинга нагрузки для решения проблемы дезагрегации энергии», Faustine et al. 2017 г.
Ансамбли
Ланге и др. '16 и Барсим и др. '16 используют двоичные ансамбли нейронных сетей, чтобы обеспечить современную производительность дезагрегации.
Мартинес и др. '18 используют архитектуру нейронной сети, которая обеспечивает объединенное (агрегированное) встраивание CNN непосредственно в несколько уровней LSTM для выполнения дезагрегации. Это похоже на несколько других подходов, которые используют это встраивание в HMM, упрощая обучение в один этап.
Разреженное кодирование
Этот подход пытается представить входные данные с помощью разреженного вектора из (многомерного) набора сверхполных классов. Этот подход смоделирован на основе нейронной активности мозга и может рассматриваться как аналог деконволюционных фильтров CNN (Learning Deconvolution Network for Semantic Segmentation, Noh et al, 2015).
Вывод
Этот тщательный обзор - лишь одно из многих исследований, проводимых в области NILM, некоторые из которых можно найти здесь http://wiki.nilm.eu/. Каждый год исследователи в этой области собираются для совместной работы на семинаре NILM. Цель этого семинара - собрать вместе исследователей, работающих над темой дезагрегирования энергии как в академических кругах, так и в промышленности. Если вы хотите узнать больше об этом мероприятии, посетите http://www.nilm.eu/.