Стохастические модели прогнозирования скорости ветра тема автореферата и диссертации по физике, 01.04.03 ВАК РФ

Гуррера Давиде АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Нижний Новгород МЕСТО ЗАЩИТЫ
2012 ГОД ЗАЩИТЫ
   
01.04.03 КОД ВАК РФ
Диссертация по физике на тему «Стохастические модели прогнозирования скорости ветра»
 
Автореферат диссертации на тему "Стохастические модели прогнозирования скорости ветра"

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Нижегородский государственный университет им. Н.И. Лобачевского"

На правах рукописи

005052566

Гуррера Давиде

СТОХАСТИЧЕСКИЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ СКОРОСТИ ВЕТРА

01.04.03 - радиофизика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

О 4 ОКТ 2012

Нижний Новгород — 2012

005052566

Работа выполнена на кафедре математики Нижегородского государственного университета им. Н.И. Лобачевского и на кафедре физики и физических технологий университета г. Палермо (Италия)

Научные руководители: профессор Р.Бурлон (Италия),

д.ф.-м.н., профессор А.И. Саичев

Официальные оппоненты: д.ф.-м.н., профессор A.A. Мальцев, к.ф.-м.н., доцент О.В. Польдин

Ведущая организация: Научно-исследовательский радиофизический институт

Защита состоится "17" октября 2012 г. в 15:J0 часов на заседании диссертационного совета Д 212.166.07 при Нижегородском государственном университете им. Н.И. Лобачевского, по адресу: 603950. г. Нижний Новгород, ГСП-20, пр. Гагарина, д. 23, корп. I, радиофизический факультет, ауд. 420.

С диссертацией можно ознакомиться в библиотеке Нижегородского государственного университета.

Автореферат разослан "17" сентября 2012 г.

Отзывы и замечания по автореферату в двух экземплярах, заверенные печатью, просьба высылать по вышеуказанному адресу на имя ученого секретаря диссертационного совета.

диссертационного совета.

Ученый секретарь

к.ф.-м.н., доцент В.В. Черепенников

Общая характеристика работы

Актуальность темы

Важной проблемой современной науки является прогнозирование, т.е. предсказание будущего течения случайного процесса исходя из экспериментальных данных его наблюдений в прошлом. Типовой подход заключается в построении модели на основе базовых принципов и ее дальнейшей корректировки с помощью имеющихся экспериментальных данных. К сожалению, подобное не всегда возможно, особенно при рассмотрении сложных физических систем. Нередко бывает, что даже при отсутствии базовых принципов требуется построить хорошие модели, а экспериментальные или исходные данные отсутствуют, либо их трудно получить, как, например, в гидродинамике. В этой ситуации необходимо иметь огромную базу данных, что делает процедуру прогнозирования очень сложной и малоэффективной.

Во всех этих случаях, когда нет адекватной физической модели или отсутствуют надлежащие исходные экспериментальные данные, либо присутствуют, но с потерями, должны серьезно рассматриваться альтернативные подходы. Такие подходы основаны на анализе временных рядов, который состоит в прогнозировании следующего значения ряда, используя известные предыдущие значения ряда. Временные ряды, являющиеся дискретной реализацией случайного процесса, представляют собой наборы данных, полученных в результате измерения значений процесса через равные временные интервалы. Обработка временных рядов встречается в любой области науки, например, в эконофизике, и особенно при описании сложных систем. Примеры из области физики — моделирование активности солнечных вспышек, потока излучения (например, лучей космических мюонов или нейтронных потоков, излучения звезд), обработка сигналов и прогнозирование хаотических процессов, моделирование оптической турбулентности, физических процессов в комплексных биологических системах, экологии и метеорологии. Отличительной особенностью моделирования наборов данных является то, что физические явления, наблюдаемые с помощью датчиков, демонстрируют долгосрочные и краткосрочные корреляции, и предшествующие значения могут быть использованы для предсказания будущего. Более того, понимание скрытой периодичности и тенденций временного ряда позволяет прогнозировать его поведение в ближайшем будущем.

Простой и общий подход к описанию эффектов памяти реализуют интегрируемые модели авторегрессии скользящего среднего (ARIMA).

Эти модели используют временные ряды как для анализа самих данных, так и для прогнозирования. Они часто применяются, когда присутствует нестационарность, которая обуславливается внешним нестационарным окружением.

Модель временного ряда получается путем отыскания функциональной формы наблюдаемых физических величин (вход модели), в которые добавляется некоторый шум. Затем через некоторое время получаются прогнозные значения (выход модели). Расширения модели ARIMA - это дробная и сезонная авторегрессия интегрированного скользящего среднего (FARIMA и SARIMA). Все эти модели являются аналогами уравнения Ланжевена в дискретном времени.

В последнее время большое число работ посвящено анализу такого атмосферного явления как скорость ветра, поскольку это важно не только для эффективной генерации электрической энергии, но и для лучшего понимания динамики природных процессов. С этой точки зрения представляется важной задача исследования внутренней динамической структуры временных рядов скорости ветра. Чем эффективнее будет осуществляться прогнозирование изменяющихся потребностей балансировки сети, тем легче будет планировать работу предприятий по корректировке мощности, и тем дешевле будет сам процесс. С другой стороны, ветер представляет собой результат комплексного взаимодействия многих факторов, поэтому данное атмосферное явление очень трудно прогнозировать. С появлением спутниковых технологий, предоставляющих огромное количество необработанных данных, а также благодаря усовершенствованию компьютерных методов решения уравнений, гидро- и газодинамические модели достигли высокого уровня точности. Однако на данный момент из-за сложности данного атмосферного явления они не справляются с задачей корректировки мощности полностью, и их точность снижается, если принимается во внимание частный масштаб и происходящие время от времени изменения. В связи с этим, в настоящее время растет интерес к методам прогнозирования, основанным на вероятностных моделях и искусственных нейронных сетях (ANN), которые могли бы помочь решить проблемы колебания скорости ветра при генерации электроэнергии.

Начальный статистический анализ скорости ветра появился в 40-е гг. прошлого века, когда в США выполнялась исследовательская программа, целью которой было изучить потенциальные площадки для строительства систем преобразования энергии ветра. Первые попытки определить среднечасовую скорость ветра были основаны на имитационном моделировании методом Монте-Карло, в котором было задано 2

предполагаемое распределение скорости ветра. Однако оно не учитывало взаимосвязь между последовательными наблюдениями за скоростью ветра, поэтому полученное данным путем прогнозирование было неточным. Следовательно, большие периоды высокой и низкой скорости ветра появлялись недостаточно часто. В дальнейших исследованиях предпринимались попытки использовать автокорреляцию в модели скорости ветра (см., например, Chou и Corotis, 1981; Goh и Nathan, 1979). Однако подходы, использовавшиеся в этих исследованиях, были основаны на специфических предположениях о статистических характеристиках, свойственных данным о скорости ветра. Некоторые исследователи также пренебрегли такими важными особенностями, как суточные и сезонные колебания и негауссовость формы распределения скорости ветра. В 1984 г. Браун и др. предложили метод, который включал в себя все основные характеристики среднечасовой скорости ветра, но он был применен к изучению только одного случая. Чтобы применить подлинную авторегрессионную модель, потребовалось использовать преобразование мощности. Таким образом, негауссово распределение скорости ветра было учтено. После выхода данной основополагающей работы, были предложены и другие виды преобразования мощности, моделирование данных осуществлялось уже с помощью одной из авторегрессионных моделей скользящего среднего (Daniel и Chen, 1991; Nfaoui и др., 1996; Poggi и др., 2003; Torres и др., 2005). Следует заметить, что в данных работах описывались краткосрочные прогнозы в то время, как Kavassari и Seetharaman, применив в 2009 г. модели с долговременной памятью, смогли получить надежные прогнозы на ближайшие 24^8 часа. Однако анализ был ограничен лишь четырьмя временными рядами.

В связи с тем, что проблема, затронутая в данной диссертации, недостаточно изучена, были сформулированы основные направления исследования.

Целью диссертационной работы является определение общего класса вероятностных моделей для среднесрочных прогнозов скорости ветра, которые бы учитывали все основные характерные черты данных о скорости ветра, а именно автокорреляцию, негауссовость распределения, а также сезонную и суточную нестационарность.

Методы исследования и достоверность результатов. Достоверность результатов, представленных в данной работе, подтверждается использованием хорошо известных методов анализа вероятностных процессов и их достаточным соответствием результатам, полученным при использовании других подходов.

Научная новизна работы. По сравнению с предыдущими работами на данную тему первый результат касается рассмотрения однодневной нестационарности. В

3

частности, способ прогнозирования среднечасовой скорости ветра, предложенный в данной диссертации, достигает стационарности благодаря использованию алгоритма вычисления разностей и сезонных моделей, которые допускают случайность в дневном цикле и ежедневную корреляцию. В результате, большинство полученных прогнозов не теряют точности на протяжении всего анализируемого интервала прогнозирования, длина которого составляет 24 часа (среднесрочный прогноз).

Второй результат касается предложения применять нелинейное преобразование к временным рядам для использования моделей Бокса-Дженкинса, которые требуют нормального распределения данных.

Третий — это предварительный анализ, рассматривающий систематику корреляции скорости ветра, используя весь набор данных.

Важно отметить, что анализ временных рядов из различных географических областей для различных периодов времени, возможно, позволит сделать большой шаг вперед в изучении ветра, как физического явления.

Научно-практическая ценность работы. Вероятностные модели, применяемые для анализа временных рядов среднечасовой скорости ветра и рассмотренные в данной работе, способствуют лучшему пониманию исследуемой проблемы и могут быть использованы для моделирования и дальнейшего прогнозирования.

Основные положения, выносимые на защиту.

1. Разработка автоматической процедуры моделирования и прогнозирования временного ряда, описывающего динамику сложных систем.

2. Применение процедуры моделирования и прогнозирования ряда для прогнозирования среднечасовой скорости ветра с помощью линейных вероятностных моделей.

3. Сравнение предложенных моделей с результатами, предоставляемыми подходящей искусственной нейронной сетью (нелинейный подход).

Апробация работы. Результаты данного исследования были представлены на четырех конференциях: «10-th World Renewable Energy Conference», Великобритания (2008); «22-nd Marian Smoluchowski Symposium», Польша (2009), «XCV Conference of the Italian Physical Society», Италия (2009), «EMUNI Research Souk», Италия (2010).

Публикации. Материалы данной диссертации были изложены в 5 работах и 2 Трудах конференций.

Личный вклад автора. Все представленные результаты были получены самим автором, который, в частности, самостоятельно формулировал цели работы и выбирал методы исследования. 4

Структура и объем работы. Диссертационная работа состоит из 4 глав, приложения и списка литературы. Общий объем работы составляет 107 страниц, включая 92 страницы основного текста, списка литературы, состоящего из 54 наименований, 37 рисунков и 8 таблиц.

Содержание работы.

В первой главе анализируются ранее проведенные исследования проблемы, поднятой в данной диссертационной работе. Помимо этого обосновывается необходимость ее дальнейшего исследования. Здесь также автор описывает элементы новизны своей диссертации. В частности, в разделе 1.1 характеризуется растущая потребность в возобновляемых источниках энергии, в особенности в Европе. В разделе 1.2 представлены статистические данные об использовании энергии ветра во всем мире. К примеру, в конце 2008 г. в Европе было внедрено оборудование по преобразованию энергии ветра общей мощностью 65 гигаватг, производившее 142 миллиарда киловатт-часов и обеспечивавшее 4,2% потребности Европейского Союза в электроэнергии. Разделы 1.3-1.5 посвящены основной проблеме, возникающей при преобразовании энергии ветра в электроэнергию, а именно колебаниям выходной мощности, вызванным случайными колебаниями скорости ветра, и выявляют необходимость достоверного среднесрочного прогнозирования. В разделе 1.6 приводится анализ всех вероятностных моделей скорости ветра, когда-либо предложенных в литературе. Они включают распределение Пирсона третьего типа; гауссовское распределение, функции плотности вероятности Вейбулла и Рэлея, логнормальное распределение, трехпараметрический вариант функции плотности вероятности Вейбулла, обратное гауссово распределение. В разделе 1.7 делается заключение о современном состоянии научных исследований в области вероятностных моделей, используемых для прогнозирования скорости ветра.

Во второй главе представлено введение в теоретическую часть данной работы. В частности, в разделе 2.1 описаны вероятностные модели временных рядов, включая основные средства анализа их свойств: график временной зависимости, выборочная автокорреляционная функция и/или выборочный спектр (раздел 2.1.1). Раздел 2.1.2 посвящен некоторым стационарным процессам: авторегрессионному (AR), процессу скользящего среднего (MA) и авторегрессионному скользящего среднего (ARMA), а также процессам, связанным с долговременной памятью (ARFIMA). Их свойства охарактеризованы детально. В разделе 2.1.3 рассматриваются такие нестационарные модели, как авторегрессионное интегрированное скользящее среднее (ARIMA) и сезонное авторегрессионное интегрированное скользящее среднее (SARIMA). Метод Бокса-Дженкинса (после главного вклада Бокса и Дженкинса (Box et. al., 2008) в создание

5

основного подхода к прогнозированию временных рядов) изложен в разделе 2.1.4. Данный метод включает идентификацию, оценку и проверку модели. В случае успешной идентификации возможной модели и оценки ее характеристик, формируется метод, благодаря которому возможно прогнозировать будущие значения исследуемого вероятностного процесса. Данный метод, а также способы достижения точности прогноза, а именно средняя абсолютная ошибка (МАЕ), среднеквадратическая ошибка (RMSE), средняя абсолютная ошибка в процентах (МАРЕ), средняя абсолютная масштабированная ошибка (MASE) исследуются в разделе 2.1.5. В разделе 2.2 приводится другой способ прогнозирования погоды, основанный на искусственных нейронных сетях. Этот подход считается стандартом прогнозирования, поэтому в настоящей работе он использовался для сопоставления с результатами прогнозирования, полученными с помощью разработанной модели.

В третьей главе диссертации представлены основные оригинальные результаты исследований автора. Целью данных исследований было выявление общего класса вероятностных моделей, подобных моделям временных рядов среднечасовой скорости ветра, описанных в главе 2, которые бы учитывали все основные характеристики данных о скорости ветра. Подход, предложенный в разделе 3.2, был применен ко временным рядам, экспериментально полученным в двух регионах Сицилии (Италия) за 4 года (раздел 3.1). Полученные результаты (раздел 3.4) являются ценными, как с точки зрения моделирования, так и прогнозирования. В частности, прогнозирование на ближайшие 24 часа было основано на временных рядах с периодом всего лишь один месяц. Но его результаты во многом совпадают с результатами прогнозирования, выполненными искусственной нейронной сетью прямого распространения, обученной с помощью двухлетнего временного ряда (раздел 3.3). Прежде всего, для изучения основных характеристик исследуемых временных рядов среднечасовой скорости ветра, был проведен предварительный описательный анализ данных, который включал графики временной зависимости, спектральный анализ и анализ частотного распределения. Практически в каждом временном ряду был выявлен дневной цикл, и с помощью функции плотности вероятности Вейбулла была подтверждена возможность создания адекватной вероятностной модели. Благодаря этому был получен очень экономичный класс моделей. В разделе 3.2.1 была проведена предварительная обработка данных, позволившая получить временной ряд, который может быть рассмотрен как реализация стационарного, нормального процесса. Однако исследуемый процесс является далеко не стационарным: его суточный компонент проявляется достаточно сильно, и он также подвержен сезонным изменениям. Поэтому, до начала процесса моделирования потребовалось исключить 6

данную нестационарность. Более того, вероятностные модели, рассматривавшиеся в данной диссертационной работе, были тщательно усовершенствованы для случайных величин, подчиняющихся гауссову распределению. Помимо этого, были исследованы значительные отклонения от (одномерной) нормальности. Ко всем временным рядам в данной работе было применено преобразование Бокса-Кокса, каждый из описанных в разделе 1.7 способов оценки мощности и метод максимального правдоподобия, выведенный Боксом и Коксом, но ни один из преобразованных рядов не прошел проверку нормальности критерием Шапиро-Уилка. В связи с этим, был использован новый вид преобразования, который включает в себя функцию ошибок.

С учетом вышесказанного в разделе 3.2.2 был предложен класс моделей сезонного авторегрессионного интегрированного скользящего среднего (БАЮМА) с периодом 24 часа. Взятые сезонная и несезонная разности первого порядка способствовали устранению суточной нестационарности и тренда соответственно. Из всего класса предложенных моделей наиболее подходящая обратимая модель БАИМА была выбрана на основе такого критерия отбора, как информационный критерий Акаике с поправкой на систематическую ошибку (А1Сс):

БЛЮМА (р,1,я)х(Р,1,С2)24, при р, Ч> Р, < 3. (1)

Для оценки точности выбранных с помощью А1Сс моделей, оставшиеся были проанализированы и проверены на случайность с помощью статистики Бокса-Пирса-Льюнга. В данной работе модель считается адекватной лишь в том случае, если значение р, необходимое для отвержения нулевой гипотезы случайности, превысило контрольный уровень, а именно р=0,05, для каждого лага Ь= 1,2,. ..,48 (часов). Количество выбранных лагов произвольно, но должно включать два полных цикла.

Полученные с помощью моделей, предложенных в разделе 3.2, суточные прогнозы сопоставляются в разделе 3.3 с моделями, предложенными искусственной нейронной сетью прямого распространения. Благодаря присущей им способности решать очень сложные и даже нелинейные задачи, искусственные нейронные сети широко использовались и используются для прогноза погоды. Их работа напоминает «черный ящик». С одной стороны, для их обучения необходимо значительное количество данных. Но с другой - для них не требуется какой-либо особой предварительной обработки данных, подобной предложенному преобразованию или разности данных. Что касается моделей, усовершенствованных в данной работе, то одно из их достоинств заключается в том, что они способствуют лучшему пониманию исследуемой проблемы. В частности, осмысление некоторых выбранных параметров отбора моделей ЭАШМА способствовало

выбору структуры искусственной нейронной сети, хотя это достаточно длительный процесс. Дано, что прогнозы моделей БЛГиМЛ основаны только на наблюдениях, зафиксированных за прошлые двое суток, и случайном (шумовом) процессе за 4 дня. Была разработана искусственная нейронная сеть прямого распространения, которой требовались 3-дневные наблюдения для создания прогноза на ближайшие сутки. Наблюдения, зафиксированные в каждом из выбранных мест, были разделены на «обучающую последовательность», включающую данные, собранные за 2003 и 2004 гг., «последовательность проверки достоверности», состоящую из данных за 2005 г. и «тестовую последовательность», в которую входят наблюдения за 2006 г. Как видно, сопоставление результатов прогнозирования двух разных подходов осуществляется только на базе данных за 2006 г.

Результаты исследования представлены в разделе 3.4. Во-первых, что касается точности моделирования, то предложенный класс вероятностных моделей оказался адекватным в 96% исследуемых рядов. Следовательно, после нелинейного преобразования возможно моделирование изучаемого вероятностного процесса с помощью подходящей линейной модели, при этом в некоторых случаях достаточно 3-х параметров. Во-вторых, в отобранных моделях количество сезонных параметров авторегрессии (Р) не превосходит 1, за исключением одного случая, где Р=2. Таким образом, впоследствии можно улучшить предложенный класс и использовать 10 характеристик вместо 12. Однако, пока не было достоверно подтверждено то, что модели данного типа, разработанные для других территорий, будут так же эффективны. И наконец, как и предполагалось, в отдельных случаях одна и та же модель (или с незначительными изменениями) может описывать один тот же месяц, независимо от года.

Что касается точности прогнозирования (раздел 3.4.2), то прогнозы, созданные с помощью разработанного автоматизированного подхода, оказались удовлетворительными как для района Каммарата (73%), так и для района Маццарроне (63%). Неудовлетворительные результаты были получены лишь в том случае, когда в прогнозируемом промежутке возникало отклонение от прошлых условий. Дело в том, что исследуемые модели опираются лишь на последние зафиксированные наблюдения, поэтому они не могут спрогнозировать такие изменения. Стоит отметить, что описанный метод подходит, прежде всего, для внутренних районов Италии, подобных Каммарате, и для самых теплых месяцев, когда атмосферные возмущения наименее вероятны.

В разделе 3.3 изложено представляющее интерес сравнение прогнозов, базирующихся на моделях ЭАШМА и искусственных нейронных сетях. Хотя данные подходы и сильно различаются, их результаты практически идентичны. В частности, в 8

условиях стационарности использованные модели, основанные на временных рядах с периодом один месяц, могут превзойти искусственные нейронные сети, обученные на наблюдениях за два года. Однако, очевидно, последние показывают лучшие результаты в обработке нестандартных ситуаций. Для сравнения и оценки представлены четыре суточных прогноза, выполненные в рамках каждого из подходов. Рисунки I - 3 отображают три удовлетворительных прогноза моделей SARIMA (где MASE равна 0,58, 1,07 и 1,43 соответственно) и искусственных нейронных сетей (где MASE равна 0,61, 1,34 и 0,95 соответственно). В первых двух случаях точность прогнозирования практически совпадает, но она отличается в 3-м, как показано на рисунке 3. Это связано с нестандартной ситуацией, произошедшей на 28-ой день. Наконец, на рисунке 4 изображена худшая ситуация 2006-го года. Здесь явно просматривается описанное выше преимущество в способности искусственных нейронных сетей в обработке непредвиденных явлений.

Рисунок 1. Days - дни, Hourly Average Wind Speed (m/s) - среднечасовая скорость ветра (м/с). Суточный прогноз среднечасовой скорости ветра, выполненный разработанной

моделью SARIMA и искусственной нейронной сетью ANN. Временной ряд был зафиксирован в районе Маццарроне в марте 2006 г. Реальные данные о скорости ветра (Actual) приведены в интервале прогнозирования для оценки точности прогноза, они не были использованы для оценки характеристик модели или для обучения сети (исключены из выборки).

Days

Рисунок 2. To же, что и на рисунке 1, но для района Каммараты в июле 2006 г.

Days

Рисунок 3. То же, что и на рисунке 1, но для района Маццарроне в феврале 2006 г.

о

(Л со

Е.

тз ф

©

CL

(Л СО ТЗ

с. g

ф

О) ф

Z £

о

X ГМ о

Рисунок 4. То же, что и на рисунке 1, но для района Маццарроне в январе 2006 г.

Наконец, с целью прояснения трудностей, возникших при выявлении общего класса моделей для изучаемого процесса, в разделе 3.4.3 описан частный случай. Данный временной ряд был выбран по двум причинам: казалось, что для него не существует подходящей производящей модели и подобные ряды регулярно встречаются в исследуемой выборке. Полученные результаты иллюстрируют ключевой момент анализа временных рядов. Чем более взаимозависимы зафиксированные результаты, тем более достоверным будет прогноз, при условии, что существующая структура зависимости была тщательно исследована. В рассматриваемом случае все четыре показателя свидетельствовали о правильном ранжировании отобранных моделей. Лучшей была признана модель SARIMA, за ней следовала ARFIMA, затем - ARMA, и, наконец -ARIMA. Если принять во внимание полученные результаты (рисунок 5), то становится очевидно, что исследуемый процесс может описать должным образом лишь модель SARIMA. Стоит отметить, что выбору данной модели способствовали знания физических характеристик анализируемого явления.

Days

Days

Рисунок 5. Суточный прогноз среднечасовой скорости ветра (м/с), выполненный различными моделями. Временной ряд был зафиксирован в районе Каммарата в феврале 2006 г. Реальные данные о скорости ветра (Actual) приведены в интервале прогнозирования для оценки точности прогноза, они не были использованы для оценки характеристик модели или для обучения сети (исключены из выборки).

В главе 4 приведены основные результаты работы. Итак, целью данной диссертационной работы являются разработка и анализ автоматизированного процесса моделирования и прогнозирования временных рядов среднечасовой скорости ветра с помощью линейной вероятностной модели. Основные результаты работы, основанной на тщательном анализе 96 временных рядов, зафиксированных в двух разных местах за 4 года, следующие:

1. Был выработан новый класс вероятностных моделей, оказавшийся адекватным для 96% рассмотренных рядов при количестве характеристик, не превышавшем 10.

2. Для применения метода Бокса-Дженкинса, который требует нормального распределения данных, был использован новый способ преобразования, который в 70% случаев приводил данные к надежному гауссову распределению.

3. Точность прогнозирования разработанных моделей является в большинстве случаев удовлетворительной. Неудовлетворительные прогнозы чаще появлялись зимой и были следствием внезапных возмущений.

4. С точки зрения прогнозирования, усовершенствованные модели показали себя, по крайней мере, не хуже искусственных нейронных сетей, исследованных в данной работе, за исключением очень нестандартных ситуаций и условий.

5. В данной работе был рассмотрен 24-часовой временной интервал, в то время как объектом многих предыдущих исследований были краткосрочные прогнозы.

6. Наконец, еще одним элементом новизны предложенного метода является рассмотрение суточной нестационарности. Традиционный подход заключается в стандартизации данных и применении впоследствии одной из разновидностей модели ARMA. Отличительной чертой предложенного подхода является то, что он достигает стационарности с помощью метода вычисления разностей и, благодаря сезонным моделям, учитывает как случайность в суточном цикле, так и ежедневную корреляцию. В результате, большинство полученных прогнозов не теряют точности на протяжении всего временного интервала.

В приложении представлен предварительный анализ, связанный с

систематизацией и классификацией взаимосвязей скоростей ветра, выполненных на

материале всей совокупности данных.

Список публикаций по теме диссертации

Al. Saverio Bivona, Giovanni Bonanno, Riccardo Burlon, Davide Gurrera, Claudio Leone, Taxonomy of correlation of wind velocity: an application to the Sicilian area, Physica A, 387,5910-5915,(2008).

A2. Saverio Bivona, Giovanni Bonanno, Riccardo Burlon, Davide Gurrera, Claudio Leone, Univariate and Multivariate properties of wind velocity time series, Journal of Statistical Mechanics: Theory and Experiments, P02026+1-P02026+12, (2009).

A3. Giovanni Bonanno, Riccardo Burlon, Davide Gurrera, Wind Speed Forecasting, Modem Problems of Statistical Physics, 8, 146-160, (2009).

A4. Saverio Bivona, Giovanni Bonanno, Riccardo Burlon, Davide GutTera, Claudio Leone, Stochastic Models for Wind Speed Time Series: A Case Study, Acta Physica Polonica B, 41,1083-1092(2010).

A5. Saverio Bivona, Giovanni Bonanno, Riccardo Burlon, Davide Gurrera, Claudio Leone, Stochastic models for wind speed forecasting, Energy Conversion and Management, 52, 1157-1165,(2011).

А6. Saverio Bivona, Giovanni Bonanno, Riccardo Burion, Davide Gurrera, Claudio Leone, Seasonal ARIMA Models for Wind Speed Time Series, Renewable Energy, Proc. of the "10th World Renewable Energy Conference - WREC X", Ed. by A.A.M. Sayigh, Elsevier, Edinburgh, UK, (2008).

A7. Giovanni Bonanno, Riccardo Burion, Davide Gurrera and Claudio Leone, Wind speed stochastic models, a case study for the Mediterranean area, Proceedings of the 2nd EMUNI Research Souk, ReSouk2010, Palermo - Italy - 14 June 2010.

Цитированная в автореферате литература

1. Box G.E.P., Jenkins G.M., Reinsei G.C., Time Series Analysis, fourth ed., Wiley, USA, 2008.

2. Brown B.G., Katz R.W., Murphy A.H., Time Series Models to Simulate and Forecast Wind Speed and Wind Power, Journal of Climate and Applied Meteorology 23 (1984) 1184-1195.

3. Chou K.C., Corotis R.B., Simulation of hourly wind speed and array wind power, Solar Energy 26 (1981) 199-212.

4. Daniel A.R., Chen A.A., Stochastic simulation and forecasting of hourly average wind speed sequences in Jamaica, Solar Energy 46(1991) 1-11.

5. Goh T.N., Nathan G.K., A statistical methodology for study of wind characteristics from a close array of stations, Wind Engineering 3 (1979) 197-206.

6. Kavasseri R.G., Seetharaman K., Day-ahead wind speed forecasting using/ARIMA models, Renewable Energy 34(2009) 1388-1393.

7. Lindley D., Smart grids: The energy storage problem, Nature 463 (2010) 18-20.

8. Nfaoui H., Buret J., Saygh A.A.M., Stochastic simulation of hourly average wind speed sequences in Tangiers, Solar Energy 56 (1996) 301-314.

9. Poggi P., Muselli M., Notton G., Cristofari C., Louche A., Forecasting and simulating wind speed in Corsica by using an autoregressive model, Energy Conversion and Management 44 (2003)3177-3196.

10. Torres J.L., Garcia A., De Blas M., De Francisco A., Forecast of hourly average wind

speed with ARMA models in Navarre (Spain), Solar Energy 79 (2005) 65-77.

Оглавление диссертации

Аннотация Благодарности Оглавление Список рисунков Список таблиц Принятые сокращения Глава 1. Введение

1.1. Возобновляемые источники энергии: состояние на сегодняшний день

1.2. Статистические данные об энергии ветра

1.3. Ветровой ресурс и выработка электроэнергии

1.4. Регулирование мощности как решение проблемы изменения ветра

1.5. Рынок электроэнергии

1.6. Вероятностные распределения скорости ветра: краткий обзор

1.7. Прогнозирование скорости ветра с помощью вероятностных моделей: современное состояние проблемы

Глава 2. Теоретическая часть

2.1. Вероятностные модели для временных рядов

2.1.1. Анализ свойств временного ряда

2.1.2. Стационарные модели Авторегрессионные процессы Процессы скользящего среднего

Процессы авторегрессионного скользящего среднего Процессы, связанные с долговременной памятью

2.1.3. Нестационарные модели

Процессы авторегрессионного интегрированного скользящего среднего Процессы сезонного авторегрессионного интегрированного скользящего среднего

2.1.4. Метод Бокса-Дженкинса Идентификация модели Оценка модели Проверка модели

2.1.5. Прогнозирование

Способы достижения точности прогнозирования

2.2. Искусственные нейронные сети 2.2.1. Введение

2.2.2. Обучение искусственной нейронной сети прямого распространения

3. Анализ и результаты

3.1. Описание данных

3.2. Предлагаемый подход

3.2.1. Предварительная обработка данных

3.2.2. Предлагаемый класс моделей

3.3. Подход, основанный на искусственных нейронных сетях

3.4. Результаты

3.4.1. Точность моделирования

3.4.2. Точность прогнозирования

3.4.3. Анализ частного случая

4. Заключение Приложение Список литературы Список публикаций автора

Подписано в печать 14.09.2012. Формат 60x84 1/16. Бумага офсетная. Печать цифровая. Усл. печ. л. 1,0. Тираж 100 экз. Заказ № 620.

Отпечатано в РИУ Нижегородского госуниверситета им. Н.И. Лобачевского. 603950, Н. Новгород, пр. Гагарина, 23.

 
Текст научной работы диссертации и автореферата по физике, кандидата физико-математических наук, Гуррера Давиде, Нижний Новгород

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Нижегородский государственный университет им. Н.И.

Лобачевского"

На правах рукописи

04201 353052

ГУРРЕРА Давиде

СТОХАСТИЧЕСКИЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ СКОРОСТИ ВЕТРА

01.04.03 - Радиофизика

ДИССЕРТАЦИЯ на соискание ученой степени кандидата физико-математических наук

Научные руководители: Ph.D., профессор Бурлон Риккардо (Италия), д.ф.-м.н., профессор Саичев Александр Иванович

Нижний Новгород - 2012 1

Federal State Educational Institution of Higher Professional Education "Lobachevsky State University of Nizhni Novgorod"

A manuscript

% J J , ivj C> ***

0

GURRERA Davide

STOCHASTIC MODELS FOR WIND SPEED TIME SERIES

01.04.03 - Radiophysics

DISSERTATION for the degree Candidate of Physical and Mathematical Sciences

Supervisors: Ph.D.. Professor Burlon Riccardo (Italy), Doctor of Physical and Mathematical Sciences, Professor Saichev Alexander Ivanovich

Nizhni Novgorod - 2012 2

Abstract

In the last decades many researchers have focussed their attention on wind energy exploitation. One of the main challenges faced in this field is the variation in power output caused by stochastic wind speed fluctuations. In order to compensate them and to take decisions in the context of the electricity market a reliable weather forecast is necessary. Beside the employment of the well-established fluid-dynamical models, there is a growing attention on those predicting methods based on stochastic models and artificial neural networks. Accordingly, the main purpose of this thesis is to provide a general class of stochastic models for hourly average wind speed prediction taking into account all the main features of wind speed data, namely autocorrelation, non-Gaussian distribution, seasonal and diurnal nonstationarity. The proposed approach, characterized by several novel features respect to previous works, has been applied to the time series recorded during four years in two sites of Sicily, a region of Italy. It comes out that the procedure developed in this study attains valuable results in terms both of modelling and forecasting. Particularly, the 24 hours predictions obtained employing only one-month time series are quite similar to those provided by a feed-forward artificial neural network trained on two years data.

PACS: Interdisciplinary applications of physics; Probability theory, stochastic processes, and statistics; Computational methods in statistical physics and nonlinear dynamics; Time series analysis in nonlinear dynamics; Computational techniques and simulations.

Acknowledgements

First of all, I wish to express my gratitude to Prof Riccardo Burlon and to Prof Alexander I. Saichev.

I am also grateful to Prof Bernardo Spagnolo who gave me the opportunity to attend an International Ph.D. Course in Russia. At the Lobachevsky State University of Nizhni Novgorod, I had an opportunity to gain experience, to meet extraordinary professors like Alexander A. Dubkov, to learn Russian, to enjoy some Russian traditions and finally to meet extraordinary colleagues and friends, especially Dr Yuriy V. Ushakov whose support in Russia has been invaluable.

I also wish to thank my family, for the support they provided me through my entire life.

In conclusion, I recognize that this research would not have been possible without the financial assistance of the Italian Ministry of University and Scientific Research and

without the data provided by the Servizio Informativo Agrometeorologico Siciliano (Assessorato Agricoltura e Foreste - Regione Siciliana).

Table of Contents

Abstract 3

Acknowledgements 5

Table of Contents 7

List of Figures 9

List of Tables 13

Abbreviations 14

1 Introduction 16 11 Renewable Energy The Current State 19 1 2 Wind Energy Current Statistics 20

13 Wind Resource and Power Generation 22

14 Providing Balancing Power to Cope with Wind Variability 23

1 5 The Electricity Markets 23

16 Wind Speed Probability Distributions a Brief Review 24

17 Wind Speed Forecasting by Stochastic Models the State of the Art 26

2 Theory 29

2 1 Stochastic Models for Time Series 30

2 11 Analysing the Properties of a Time Series 33

2 12 Stationary Models 36

Autoregressive Processes 38

Moving Average Processes 38

Autoregressive Moving Average Processes 39

Long-Memory Processes 39

2 13 Non-stationary Models 41

Autoregressive Integrated Moving Average Processes 41

Seasonal Autoregressive Integrated Moving Average Processes..................42

2.1.4 The Box-Jenkins Procedure................................................................43

Model Identification....................................................................................43

Model Estimation........................................................................................44

Model Checking...........................................................................................45

2.1.5 Forecasting........................................................................................46

Measures of Forecasting Accuracy...............................................................49

2.2 Artificial Neural Networks.....'.....................................................................................50

2.2.1 Introduction.......................................................................................51

2.2.2 Training a Feed-Forward ANN............................................................53

3 Analysis and Results.......................................................................................................57

3.1 Data Description.........................................................................................................57

3.2 The Proposed Approach.............................................................................................68

3.2.1 Data Pre-treatment............................................................................68

3.2.2 The Proposed Class of Models............................................................73

3.3 An Artificial Neural Network Approach......................................................................74

3.4 Results...................................'.....................................................................................76

3.4.1 Modelling Accuracy............................................................................76

3.4.2 Forecasting Accuracy.........................................................................82

3.4.3 A Case Study......................................................................................89

4 Conclusions.....................................................................................................................97

Appendix......................................................................................................................................99

References.................................................................................................................................104

List of Author's Publications......................................................................................................107

List of Figures

Figure 1 New power capacity installed in 2008 (source European Wind Energy Association) 21

Figure 2 Wind power capacity installed in Europe at the end of 2008 (source European Wind Energy

Association) 21

Figure 3 Top 10 installed wind power capacity at the end of 2008 (source European Wind Energy

Association) 22

Figure 4 Schematic diagram of a multilayer feed-forward artificial neural network 52

Figure 5 A map of Sicily showing the locations of Cammarata and Mazzarrone 58

Figure 6 The HAWS time series recorded in Cammarata during the four years 2003 (a), 2004 (b), 2005(c),

2006(d) . 59

Figure 7 As in Figure 6, but for Mazzarrone 60

Figure 8 Sample spectrum of the HAWS time series recorded in Cammarata from 2003 to 2006 The brokfn lines are at frequencies 1/24H (THE fundamental), 2/24H, 3/24H, 4/24H (THE successivi harmonics) THL blue bar on the top right is the confidence bar 61

figure 9 autoregressive estimation of the spectrum shown in figure 8 the broken lines are at frequencies

1/24H (the fundamental), 2/24H, 3/24H, 4/24H (the successive harmonics) 61

Figure 10 Autoregressive estimation of the spectrum of the HAWS time series recorded in Mazzarrone from 2003 to 2006 The broken lines are at frequencies 1/24h (the fundamental), 2/24h, 3/24h (the successive harmonics) 62

Figure 11 Fit of the hybrid Weibull cumulative distribution function (red) to the empirical cumulative

probabilities of the HaWS values, calms excluded, recorded in Cammarata from 2003 to 2006 (black)

64

Figure 12 Fit of the Weibull cumulative distribution function (green) to the empirical cumulativf

probabilities of the HAWS values, calms included, recorded in Cammarata from 2003 to 2006 (black)

Figure 13 As in Figure 11, but for Mazzarrone 65

Figure 14 As in Figure 12, but for Mazzarrone 66

Figure 15 Histogram of the HAWS data recorded in Cammarata during the years 2003-2006 with

superimposed the hybrid weibullp d f (red) and the pure weibull p d f (green) which best fit the bins are centred at 0,0 1,0 2, 66

Figure 16 As in Figure 15, but for Mazzarrone 67

Figure 17 Top - HAWS (m/s) at 10 metres above ground in Mazzarrone, March 2006 Bottom -

Autocorrelation function and spectrum (the broken lines are at frequencies 1/24h, 2/24h, 3/24h) of the series shown above 70

Figure 18 Histogram and spectrum (the broken lines are at frequencies 1/24h, 2/24h, 3/24h) of thf time

series shown in figure 17 (top) and of the same series transformed using the error function (bottom)

72

Figure 19 Fit of the Weibull cumulative distribution function (green) to the empirical cumulative

probabilities of the series shown in figure 17 (black) 73

Figure 20 The forecasting accuracy, as assessed by the MASE, of the developed SARIMA models for the two

considered sites, cammarata (a) and mazzarrone (b) the four symbols represent different years (blank square = 2003, blank circle = 2004, filled square = 2005, filled circle = 2006) points below the broken line indicate satisfactory predictions 84

Figure 21 The forecasting accuracy, as assessed by the MAPE, of the developed SARIMA models for the two

considered sites, cammarata (a) and mazzarrone (b) the four symbols represent different yl ars (blank square = 2003, blank circle = 2004, filled square = 2005, filled circle = 2006) points are missing when the MAPE is undefined 84

Figure 22 The forecasting accuracy in 2006, as assessed by the MASE, of the developed SARIMA models (filled circle) and of the developed ANN (blank circle) for the two considered sites, Cammarata (a) and Mazzarrone (b) Points below the broken line indicate satisfactory predictions 85

Figure 23 The forecasting accuracy in 2006, as assessed by the MAPE, of the developed SARIMA models (fillfd circle) and of the developed ANN (blank circle) for the two considered sites, Cammarata (a) and Mazzarrone (b) Points are missing when the MAPE is undefined 85

Figure 24 The forecasting accuracy in 2006, as assessed by the RMSE, of the developed SARIMA models (filled circle) and of the developed ANN (blank circle) for the two considered sites, Cammarata (a) and Mazzarrone (b) 86

Figure 25 The forecasting accuracy in 2006, as assessed by the MAE, of the developed SARIMA models (filled circle) and of the developed ANN (blank circle) for the two considered sites, Cammarata (a) and Mazzarrone (b) 86

Figure 26 24 hours forecast of the time series shown in Figure 17 by the developed SARIMA model (red line) and by the developed ANN (green line) Actual data displayed in the forecast window to assess forecasting accuracy have not been used to estimate the parameters of the model or to train the network (out of sample forecasting) 87

Figure 27 As in Figure 26, but for Cammarata, July 2006 87

Figure 28 As in Figure 26, but for Mazzarrone, February 2006 88

Figure 29 As in figurr 26, but for Mazzarrone, January 2006 88

Figure 30 HAWS (m/s) at 10 metres above ground in Cammarata, February 2005 89

Figure 31 Top -The time series shown in Figure 30 after transformation using (68) Bottom -

Autocorrelation function and smoothed spectrum of the series shown above 90

Figure 32 Sample spectrum of the time series displayed in Figure 31 The blue bar on the top right is the

confidence bar 93

Figure 33 Rescaled range analysis for the time series displayed in Figure 31 The slope of the estimated red line is H = 0 65, while the slope of the reference green line is 1/2 (short-range dependence) 94

Figure 34 24 hours forecast of the time series shown in Figure 30 by the models reported in Table 8 Actual data displayed in the forecast window to assess forecasting accuracy have not been used to estimate the parameters of the models (out of sample forecasting) 96

Figure 35 Map of Sicily, the 29 recording stations are (number indicate location on thl map) acatf (l), Agrigento (2), Alia (3), Cammarata (4), Canicatti (5), Castelvetrano (6), Catania (7), Cesaro (8), Corleone (9), Gela (10), Lascari (11), Leni (12), Lentini (13), Licata (14), Maletto (15), Mazara (16), Mazzarrone (17), Monreale (18), Pachino (19), Palazzolo Acreide(20), Palermo (21), Patti (22), Pettineo (23), Piazza Armerina (24), Ragusa (25), Riesi (26), Sciacca (27), Scicu (28), Trapani (29) 101 Figure 36 Dendrogram obtained for the whole analysed period 2003-2006 101

Figure 37 MST obtained for the whole analysed period 2003-2006 102

List of Tables

Table 1 Anemometer specifications 58

Table 2 Number of missing HAWS observations 67

Table 3 For each analysed time series, the p-valueofthe S Wtest, thf selfcted SARIMAmodfl (models marked by two asterisks have not passed the L-B-P test) and its out of sample forecasting accuracy, as assfssed by the MASE, are reported in 2006, the right values indicate the forecasting accuracy of thf developed ANN 79

Table 4 For each analysed time series, the out of sample forecasting accuracy of the selected SARIMA model, as assessed by the MAPE, is reported In 2006 the right values indicate the forecasting accuracy or thf developed ANN values are missing when the MAPE is undefined 80

Table 5 The out of sample forecasting accuracy in 2006 of the selected SARIMA models (left) and of the

developed ANN (right), as assessed by the rmseandbythe mae 81

Table 6 Comparison between the proposed transformation and the Box Cox transformation in attaining a

normal distribution, as assessed by the p-value of the S-W test applied to five representative examples

81

TABLE 7 ADJUSTED MODELS, DEVELOPED BY A NON-AUTOMATIC ANALYSIS, FOR THOSE IN TABLE 3 MARKI d BY two ASTERISKS

81

Table 8 The forecasting accuracy of the models developed for the considered case study 96

Abbreviations

ac.f. Autocorrelation function

AlCc Bias-corrected Akaike's Information Criterion

ANN Artificial neural network

AR Autoregressive

ARFIMA Autoregressive fractionally integrated moving average

ARIMA Autoregressive integrated moving average

B-J Box-Jenkins

HAWS Hourly average wind speed

L-B-J Ljung-Box-Pierce

MA Moving average

MST Minimum Spanning Tree

NNSL Nearest Neighbor/Single Linkage

p.d.f. Probability density function

SARIMA Seasonal autoregressive integrated moving average S-W Shapiro-Wilk

1 Introduction

Rationale. One of the central problems of science is forecasting Given the past, how we can predict the future? Usually the main approach is to build a model from first principles and insert the experimental initial data into the model to get predictions This is not always possible, especially in physics of complex systems Often there is lack of first principles necessary to make good models, or experimental initial data are unavailable or difficult to obtain as in fluid dynamics It would be necessary to acquire such huge amount of data, that make the procedure very difficult and with very low efficiency In all these cases in which we lack a good physical model or when we lack proper experimental initial data or there are incomplete datasets, we need to seriously consider alternative approaches Such approaches are based on time series analysis, which consists of predicting the next values of a series known up to a specific time, using the known past values of the series Time series, which are views as a realization of a random process, are collections of data which result from observations with equal time intervals between them Applications of time series are frequent in any field of science and also in econophysics, especially in science of complex systems Examples in physics are the modelling of the solar flare activity, the modelling of the flux of selected radiation probes (such as cosmic ray muon or neutron fluxes, stellar intensity information), signal processing and predicting chaotic time series, the analysis of measurements of optical turbulence time series, modelling physical processes in biological complex systems, environmental science and weather observations The key premise in modelling data set is that the physical phenomena observed by sensors exhibit long-term and short-term correlations and past values can be used to predict the future Moreover, understanding the hidden periodicities and the trend of time series allows us to forecast its behaviour in the near future In the field of time series analysis, a straightforward and general approach to describe memory effects is given by the autoregressive integrated models with moving average (ARIMA) framework These models are fitted to time series data either to better understand the data or to predict future points in the series They are applied often when the data show evidence of non-stationarity, that is are due to observable non-stationary random processes A model for the time series is obtained by finding a functional form of the past physical observables (input of the model), which added to some noise term gives rise to the prediction values at some later time (output of the model) Extensions of the ARIMA models are the fractional and the seasonal autoregressive integrated moving average, FARIMA and SARIMA All these models are a discrete time analogue of the fractional and generalized Langevin equations

Recently the analysis of wind speed records has been receiving a lot of attention, because it is very challenging non only for better design of more appropriate and more efficient wind power plants, but also for better understanding the underlying dynamical mechanism To this aim, it is crucial to investigate the inner dynamical structure of wind speed time series One of the main challenges faced in this field is the variation in power output caused by stochastic wind speed fluctuations, which gives rise to wind energy production varying from hour to hour On the other hand, being the result of the complex interactions of many factors, wind is one of the most difficult atmospheric phenomenon to forecast Fluid-dynamical models have reached a great degree of accuracy because of the advent of the satellite technology providing an inestimable amount of data and because of the computing improvement necessary for equation solving However, up to now they can't solve the problem completely given that, because of the great complexity of the addressed atmospheric phenomenon, they may lack great accuracy when focussing on the local scale and on the hour to hour variations For this reason, there is a growing attention on those predicting methods based on stochastic models and artificial neural networks (ANNs) in order to provide an effective support to the wind speed variability problem for the exploitation of wind power

The main purpose of this dissertation is to obtain a very good prediction for time series analysis, by providing a general class of stochastic models for medium-range hourly average time series analysis of complex systems, with particular attention to wind speed data All the main statistical features such as the autocorrelation, non Gaussianity of the distribution, seasonal and diurnal non-stationarity have been taken into account

Research methods and authenticity of scientific results. The authenticity of the results reported in the dissertation is proved by the use of methods of stochastic processes analysis and by the satisfactory agreement with the results obtained using a different approach

Scientific novelty. The present research introduces some novel features compared with previous works on the same subject

The first one concerns the treatment of diurnal non-stationarity, by using the differencing technique and seasonal models to allow for randomness in the daily cycle and to take into account the day to day correlation As a result, most of the obtained forecasts show no degradation during the considered forecast window whose length is 24 hours (medium-range prediction)

The second one is to propose a new nonlinear transformation to be applied to the time series, in order to use Box-Jenkins models, which require the data to be normally distributed

The third one is a preliminary analysis concerning the taxonomy of correlations of wind speed performed using the whole available data set

It is worthwhile to note that our analysis performed over different wind speed time series, measured at different sites and for different periods could give insight into a better understanding of the complexity of wind phenomena.

Theoretical and practical contributions. The stochastic models for hourly average wind speed time series developed in this work provide a better understanding of the investigated problem, may be used for simulation purposes and to forecast the future values of the underlying stochastic process. The model identification and parameter estimation, which best captures the variations exhibited by the underlying experimental data, have been obtained by determining the order of the model from the family of SARIMA models, including the order of seasonal differencing, the order of autoregression and moving average.

Theses for defence:

1. Development of an automatic procedure for modelling and prediction of time series analysis useful to describe dynamical behaviour of complex systems.

2. This technique was applied to forecasting of hourly average wind speed time series, obtaining very good agreement with real data.

3. Comparison of the performance of the developed models with a suitable artificial neural networks ANN (nonlinear approach). The forecasting accuracy is almost the same, but it differs only in the case in which a rather irregular event occurred.

Approbation of the results. The results of this work have been presented in four conferences: "10th World Renewable Energy Conference", UK (2008); "22nd Marian Smoluchowski Symposium", Poland (2009), "XCV Conference of the Italian Physical Society", Italy (2009); "EMUNI Research Souk", Italy (2010). Moreover, they have been presented to a board of examiners during author's PhD defence in Applied Physics at the University of Palermo (Italy), 2010.

Author's publications. The material of this dissertation has been published in 5 papers and 2 proceedings.

Author's contribution. All presented results have been obtained by the author personally who, in particular, has chosen target settings and ways of investigation. Structure and amount of the dissertation. The dissertation consists of four chapters, an appendix and references. The whole amount of the dissertation is 107 pages, including 92 pages of the main text, 54 references, 37 figures and 8 tables.

1.1 Renewable Energy: The Current State

Despite the financial crisis, 2008 was a breakthrough year for Europe, the environment and wind power. Another dispute over natural gas flowing from Russia to Ukraine and onto parts of Europe greeted the new year, in the middle of winter. The 2008 dispute, averted for once, again highlighted the inability of Europe to control its own energy supply. In addition to dependable energy supply, climate change and its potential ramifications were huge on the political agenda in 2008. Indeed, together the two portfolios along with the worsening global recession seemed to dominate public debate. Despite the financial carnage that was shaping up to be the worst since the depression of the 1930s, despite intense pressure from some Member States worried about the cost of implementing the legislation, on 12 December the 27 EU Heads of State unanimously agreed on legislation to realise 20% renewable energy, 20% energy efficiency and at least a 20% drop in greenhouse gas emissions compared to 1990 levels by 2020. It may be considered the beginning of a new era that clearly signals the end of our ever increasing addiction to imported fossil fuels from outside the EU. To reach the 20% renewable energy target, the EU will need to increase the share of electricity from renewable energy sources from 16% in 2006 to at least 34% in 2020. The European Commission expects wind energy share to increase from about 4% in 2008 to 12% in 2020. Indeed, as a result of increased optimism following the December agreement, which established mandatory targets for renewable energy in all 27 EU Member States, the European Wind Energy Association in March 2009 increased its 2020 target for wind power capacity in the EU from 180 GW to 230 GW. The new target of 230 GW includes 40 GW of offshore wind and would produce approximately 600 TWh per year by 2020, meeting 14-18% of EU electricity demand

while providing power equivalent to the needs of 135 million average European households (60% of EU households). In the meantime, wind energy is already a green, affordable, dependable, local, proven technology that creates new, high-technology jobs.

1.2 Wind Energy Current Statistics

- A total of 8,484 MW wind power capacity was installed in the EU in 2008. This puts wind energy ahead of any other power technology for the first time. 36% of all new electricity producing capacity installed in the EU in 2008 was wind energy (Figure 1) followed by natural gas (6,932 MW - 29%), photovoltaic (4,200 MW - 18%), oil (2,495 MW - 10%), coal (762 MW - 3%) and hydro (473 MW-2%).

- At the end of 2008, there were 65 GW of wind power capacity installed in the EU-27 producing 142 TWh of electricity, and meeting 4.2% of EU electricity demand (Figure 2).

- As for the installed wind power capacity, Italy-holds an important position in the world (Figure 3). With its 3,736 MW already installed at the end of 2008, Italy is preceded only by the United States of America, Germany, Spain, China and India. Moreover, Italy occupies the same sixth position as for the new wind power capacity installed during 2008.

9.000 8.484

Wind Gas Photovoltaic Fuel Oil Coal Hydro Biomass Other* Nuclear * Geothermal peat and waste •

** This is a preliminary figure for solar photovoltaic installations (source European Photovoltaic Industry Association EPIA

Figure 1 New power capacity installed in 2008 (source: European Wind Energy Association)

Éwop»«« UfUn. 64.936 *W Candid»«» CouMft«* 432 MW ETTA 442 MW Tot* tu«w W.933 MW

■ «Äi

j ®s «t*

im

* UM

EWSA - Ai*»j»: Ripoft 2008

Figure 2 Wind power capacity installed in Europe at the end of 2008 (source: European Wind Energy Association)

Rest of Portugal the world Denmark

UK France Italy

India

China

Germany

Spain

Figure 3 Top 10 installed wind power capacity at the end of 2008 (source: European Wind Energy Association)

1.3 Wind Resource and Power Generation

A wind turbine extracts part of the kinetic energy of the wind blowing through the swept surface area of a wind turbine rotor. The amount of energy that can be harvested at a given location depends on the local wind climate which tends to be relatively constant over time. Typically, inter-annual wind energy production from a turbine varies with a standard deviation of around 10% of mean energy. The energy in the wind varies with the third power of the wind speed; hence a doubling of the wind speed gives an eightfold increase in the available energy. In practice, wind turbines are not equally efficient at all wind speeds. They are usually optimised to extract the maximum share of the energy at wind speeds of around 8 m/s. Given a known statistical wind speed distribution at a site, the mean annual wind energy production is generally highly predictable, with a small margin of error of around 5% at the point of measurement. The quality of wind resource assessments is often the most important economic risk element in the development of wind power projects. Financiers of large wind farms will therefore often require a due diligence reanalysis of the resource

assessment, usually in the form of a second opinion on the conclusions to be drawn from the available data.

1.4 Providing Balancing Power to Cope with Wind Variability

Second to second or minute to minute variations in wind energy production are rarely a problem for installing wind power in the grid, since these variations will largely be cancelled out by the other turbines in the grid. Wind energy production may, however, vary from hour to hour, just as demand from electricity customers will vary from hour to hour. In both cases this means that other generators on the grid have to provide power at short notice to balance supply and demand (Lindley, 2010 [33]). The cost of providing this balancing service depends both on the type of other available generating