摘要:以歸一化處理后的1986-2010年河南省農(nóng)田有效灌溉面積的統(tǒng)計數(shù)據(jù)作為樣本數(shù)據(jù),分別采用BP神經(jīng)網(wǎng)絡和支持向量機回歸兩種方法建立了農(nóng)田有效灌溉面積的預測模型。預測結果表明,支持向量機的預測方法具有更高的預測精度和更強的泛化能力,預測誤差僅為BP神經(jīng)網(wǎng)絡預測誤差的11.8%,更適合進行農(nóng)田有效灌溉面積的預測。最后采用兩種模型分別對河南省“十二五”期間的農(nóng)田有效灌溉面積進行了預測,指出了其變化趨勢。
關鍵詞:農(nóng)田有效灌溉面積;BP神經(jīng)網(wǎng)絡;支持向量機;預測
農(nóng)田有效灌溉面積指有固定水源、灌溉工程設施配套、土地平整、在一般年景下能夠進行正常灌溉的耕地面積,包括機灌面積、電灌面積、自流灌溉面積和噴灌面積[1]。它是反映農(nóng)田水利建設和水利化的重要指標,也是我國各地區(qū)制定水利發(fā)展規(guī)劃的重要指標之一。對農(nóng)田有效灌溉面積進行預測可以為了解未來農(nóng)村水利基礎設施的建設狀況提供有價值的參考信息,同時也可為相關部門合理制定行業(yè)發(fā)展規(guī)劃提供理論支持。
1 預測方案的確定與預測方法的選擇
1.1 預測方案的確定
農(nóng)田有效灌溉面積的變化受多方面因素的影響,比如政策、中央財政資金投入、地方財政資金投入、農(nóng)民收入狀況等。這些因素并不是孤立地對農(nóng)田有效灌溉面積產(chǎn)生影響,而是耦合在一起以非線性的方式影響農(nóng)田有效灌溉面積的變化。
農(nóng)田有效灌溉面積的預測有兩大類方案:一種為結構式的預測方法,就是通過一定的方式建立起各主要影響因素與農(nóng)田有效灌溉面積之間的關系,然后根據(jù)未來各影響因素的變化去預測相對應的農(nóng)田有效灌溉面積;另一種為數(shù)據(jù)序列預測法,就是將各年度的農(nóng)田有效灌溉面積數(shù)值作為連續(xù)的時間序列看待,可以認為農(nóng)田有效灌溉面積的變化規(guī)律已經(jīng)蘊含在數(shù)據(jù)序列之中,再采用合適的方法對該序列在未來的取值進行預測。
在第一種方案中,首先需要確定具體影響農(nóng)田有效灌溉面積變化的因素種類及其影響規(guī)律,另外還需要對各因素的未來變化進行預測。準確地確定影響農(nóng)田有效灌溉面積變化的各種因素本身就很有難度,各因素對有效灌溉面積影響規(guī)律的辨識也同樣是一個比較復雜的問題,而預測各因素未來的變化更是一個幾乎和預測農(nóng)田有效灌溉面積難度相當?shù)膯栴}。在第二種方案中,首先需要建立起能夠充分反映農(nóng)田有效灌溉面積變化規(guī)律的預測模型,然后通過求取該預測模型在未來的輸出值即可實現(xiàn)預測。兩種方案相比,顯然第二種方案更容易實現(xiàn)。因此,在以下研究中采用數(shù)據(jù)序列預測方案。
1.2 預測方法的選擇
在數(shù)據(jù)序列的預測中,目前廣泛采用的方法有移動平均法、指數(shù)平滑法、線性回歸法、灰色預測法、神經(jīng)網(wǎng)絡法和支持向量機方法等。這些方法中神經(jīng)網(wǎng)絡法和支持向量機方法從本質上來說更為適合應用于非線性預測問題。而農(nóng)田有效灌溉面積所構成的數(shù)據(jù)序列是一個典型的非線性序列。顯然在該研究中采用神經(jīng)網(wǎng)絡法和支持向量機方法較為合適。為了充分研究這兩種方法的適用性,以下對這兩種方法進行對比分析。
2 兩種預測方法的理論基礎及特性分析
2.1 BP神經(jīng)網(wǎng)絡預測的理論基礎及特性分析
在各類神經(jīng)網(wǎng)絡中,BP神經(jīng)網(wǎng)絡堪稱最經(jīng)典、使用最為廣泛的一種神經(jīng)網(wǎng)絡[2,3]。
BP神經(jīng)網(wǎng)絡是誤差反向傳播(Back error propagation,簡稱BP)神經(jīng)網(wǎng)絡的簡稱。BP神經(jīng)網(wǎng)絡通常由1個輸入層、若干隱含層和1個輸出層組成,在每層中可以包括若干個神經(jīng)元。各相鄰層神經(jīng)元之間多為全連接方式,而同層神經(jīng)元之間則無連接[4]。各神經(jīng)元間的連接傳遞相應的權值,隱含層及輸出層各神經(jīng)元都有自己的閾值。BP神經(jīng)網(wǎng)絡作為一種前饋網(wǎng)絡,具有前饋網(wǎng)絡的共性。研究表明,三層前饋網(wǎng)絡就能夠以任意精度逼近任意連續(xù)函數(shù)及其各階導數(shù)[5]。對序列進行建模,從本質上來說就是獲得序列的變化泛函,BP神經(jīng)網(wǎng)絡的函數(shù)逼近功能正好可以實現(xiàn)此過程。
但BP神經(jīng)網(wǎng)絡也存在若干缺陷,其中比較突出的是網(wǎng)絡結構的不易確定、易限于局部收斂和收斂速度慢。其中網(wǎng)絡結構的不易確定是指在確定網(wǎng)絡結構參數(shù)的過程中沒有準確的依據(jù)可以遵循。而局部收斂則對BP神經(jīng)網(wǎng)絡的函數(shù)逼近功能影響較大。
2.2 支持向量機預測的理論基礎及特性分析
3 預測模型的建立
3.1 樣本數(shù)據(jù)的準備
從河南統(tǒng)計年鑒中收集了1986-2010年河南省農(nóng)田有效灌溉面積的統(tǒng)計數(shù)據(jù)[10]。為了降低預測模型的復雜程度,采用峰值法對這些數(shù)據(jù)進行了歸一化處理。將歸一化后的1986-2009年數(shù)據(jù)作為訓練樣本,2010年數(shù)據(jù)作為檢驗樣本。
確定預測模型每次的輸入樣本中包含6個數(shù)據(jù),即用連續(xù)6年的數(shù)據(jù)預測第七年的數(shù)據(jù)。據(jù)此可建立訓練時的輸入樣本矩陣(6×18)和輸出樣本向量(1×18)。
3.2 預測模型基本參數(shù)的確定與訓練
1)BP神經(jīng)網(wǎng)絡基本參數(shù)的確定與訓練。確定BP神經(jīng)網(wǎng)絡的隱含層數(shù)為1,輸入層神經(jīng)元數(shù)為6,輸出層神經(jīng)元數(shù)為1,隱含層神經(jīng)元數(shù)為11。隱含層和輸出層的激勵函數(shù)分別采用正切型Sigmoid函數(shù)和對數(shù)型Sigmoid函數(shù)。為了提高收斂速度,訓練時采用了Levenberg-Marquardt數(shù)值優(yōu)化算法。
2)支持向量機基本參數(shù)的確定與訓練。采用Epsilon型支持向量機回歸算法,經(jīng)過多次試驗,確定拉格朗日乘子上界為5,不敏感函數(shù)取值為0.000 01,核函數(shù)采用高斯型,高斯核函數(shù)的寬度取0.15。
4 預測與分析
4.1 兩種模型預測能力對比
利用訓練完畢的兩種預測模型仿真預測1992-2009年的河南省農(nóng)田有效灌溉面積并進行反歸一化處理。反歸一化后的各預測值、預測誤差的絕對值和預測相對誤差的絕對值見表1。從表1可以看出,支持向量機的各預測值與實際值更為接近,其預測誤差的絕對平均值、預測相對誤差的絕對平均值都遠小于BP神經(jīng)網(wǎng)絡預測結果的對應參數(shù)。圖1中的各預測數(shù)據(jù)也全部經(jīng)過了歸一化處理,從圖1中1992-2009部分也可以看出,支持向量機的預測值基本和實際值重合在一起,而BP神經(jīng)網(wǎng)絡的預測值在一些地方則與實際值相差較大,說明基于支持向量機的預測模型泛化能力更強。 利用這兩種預測模型分別預測作為檢驗樣本的2010年河南省農(nóng)田有效灌溉面積,反歸一化后的預測結果如表2和圖1所示。從表2和圖1可以看出,基于支持向量機的預測模型在檢驗樣本處的實際預測精度也遠高于BP神經(jīng)網(wǎng)絡,其預測誤差僅為BP神經(jīng)網(wǎng)絡預測誤差的11.8%。
4.2 河南省“十二五”期間農(nóng)田有效灌溉面積的預測與分析
實際上,預測結果是在現(xiàn)有條件的基礎上從數(shù)據(jù)序列的角度進行的預測,如果在“十二五”期間,政府大幅增加水利行業(yè)的資金投入,最終的發(fā)展情況將會比該預測結果更好。
5 小結
在對農(nóng)田有效灌溉面積進行預測時,數(shù)據(jù)序列預測法比結構式預測法更為簡單易行。在各種數(shù)據(jù)序列預測方法中,神經(jīng)網(wǎng)絡預測方法和基于支持向量機的預測方法更為適合農(nóng)田有效灌溉面積的非線性變化規(guī)律。
研究針對BP神經(jīng)網(wǎng)絡和支持向量機兩種預測方法進行了對比分析。理論研究表明,基于支持向量機的預測方法可以克服BP神經(jīng)網(wǎng)絡的諸多缺陷,具有優(yōu)越性。
以河南省1986-2010年的農(nóng)田有效灌溉面積統(tǒng)計數(shù)據(jù)為基礎,詳細闡述了利用兩種預測方法建立預測模型的過程,并進行了應用驗證。驗證結果表明,基于支持向量機的預測方法具有更好的泛化能力,預測精度更高。最后獲得了河南省“十二五”期間農(nóng)田有效灌溉面積的預測數(shù)據(jù)并指出了其發(fā)展趨勢。
參考文獻:
[1] 鄭家亨.統(tǒng)計大辭典[M]. 北京:中國統(tǒng)計出版社,1995.
[2] 卞鳳蘭,黃曉明,劉 睿.城鎮(zhèn)化進程中公路網(wǎng)用地的BP神經(jīng)網(wǎng)絡預測模型[J].東南大學學報(自然科學版),2010,40(5):1073-1076.
[3] 尹健康,陳昌華,邢小軍,等. 基于BP神經(jīng)網(wǎng)絡的煙田土壤水分預測[J]. 電子科技大學學報,2010,39(6):891-895.
[4] 陳 明. 神經(jīng)網(wǎng)絡模型[M]. 大連:大連理工大學出版社,1995.
[5] 柳小桐. BP神經(jīng)網(wǎng)絡輸入層數(shù)據(jù)歸一化研究[J].機械工程與自動化,2010(3):122-123,126.
[6] 張 華,曾 杰.基于支持向量機的風速預測模型研究[J]. 太陽能學報,2010,31(7):928-932.
[7] CHEN B J,CHANG M W,LIN C J. Load forecasting using support vector machines:A study on EUNITE competition 2001[J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[8] VAPNIK V N. The Nature of Statistical Learning Theory[M].New York:Springer,1995.
[9] HSU C W, LIN C J. A comparison of methods for multi-class support vector machines[J]. IEEE Transactions on Neural Networks,2002,13(3):415-425.
[10] 河南省統(tǒng)計局,國家統(tǒng)計局河南調查總隊. 河南省統(tǒng)計年鑒—2011[M].北京:中國統(tǒng)計出版社,2011.
關鍵詞:農(nóng)田有效灌溉面積;BP神經(jīng)網(wǎng)絡;支持向量機;預測
農(nóng)田有效灌溉面積指有固定水源、灌溉工程設施配套、土地平整、在一般年景下能夠進行正常灌溉的耕地面積,包括機灌面積、電灌面積、自流灌溉面積和噴灌面積[1]。它是反映農(nóng)田水利建設和水利化的重要指標,也是我國各地區(qū)制定水利發(fā)展規(guī)劃的重要指標之一。對農(nóng)田有效灌溉面積進行預測可以為了解未來農(nóng)村水利基礎設施的建設狀況提供有價值的參考信息,同時也可為相關部門合理制定行業(yè)發(fā)展規(guī)劃提供理論支持。
1 預測方案的確定與預測方法的選擇
1.1 預測方案的確定
農(nóng)田有效灌溉面積的變化受多方面因素的影響,比如政策、中央財政資金投入、地方財政資金投入、農(nóng)民收入狀況等。這些因素并不是孤立地對農(nóng)田有效灌溉面積產(chǎn)生影響,而是耦合在一起以非線性的方式影響農(nóng)田有效灌溉面積的變化。
農(nóng)田有效灌溉面積的預測有兩大類方案:一種為結構式的預測方法,就是通過一定的方式建立起各主要影響因素與農(nóng)田有效灌溉面積之間的關系,然后根據(jù)未來各影響因素的變化去預測相對應的農(nóng)田有效灌溉面積;另一種為數(shù)據(jù)序列預測法,就是將各年度的農(nóng)田有效灌溉面積數(shù)值作為連續(xù)的時間序列看待,可以認為農(nóng)田有效灌溉面積的變化規(guī)律已經(jīng)蘊含在數(shù)據(jù)序列之中,再采用合適的方法對該序列在未來的取值進行預測。
在第一種方案中,首先需要確定具體影響農(nóng)田有效灌溉面積變化的因素種類及其影響規(guī)律,另外還需要對各因素的未來變化進行預測。準確地確定影響農(nóng)田有效灌溉面積變化的各種因素本身就很有難度,各因素對有效灌溉面積影響規(guī)律的辨識也同樣是一個比較復雜的問題,而預測各因素未來的變化更是一個幾乎和預測農(nóng)田有效灌溉面積難度相當?shù)膯栴}。在第二種方案中,首先需要建立起能夠充分反映農(nóng)田有效灌溉面積變化規(guī)律的預測模型,然后通過求取該預測模型在未來的輸出值即可實現(xiàn)預測。兩種方案相比,顯然第二種方案更容易實現(xiàn)。因此,在以下研究中采用數(shù)據(jù)序列預測方案。
1.2 預測方法的選擇
在數(shù)據(jù)序列的預測中,目前廣泛采用的方法有移動平均法、指數(shù)平滑法、線性回歸法、灰色預測法、神經(jīng)網(wǎng)絡法和支持向量機方法等。這些方法中神經(jīng)網(wǎng)絡法和支持向量機方法從本質上來說更為適合應用于非線性預測問題。而農(nóng)田有效灌溉面積所構成的數(shù)據(jù)序列是一個典型的非線性序列。顯然在該研究中采用神經(jīng)網(wǎng)絡法和支持向量機方法較為合適。為了充分研究這兩種方法的適用性,以下對這兩種方法進行對比分析。
2 兩種預測方法的理論基礎及特性分析
2.1 BP神經(jīng)網(wǎng)絡預測的理論基礎及特性分析
在各類神經(jīng)網(wǎng)絡中,BP神經(jīng)網(wǎng)絡堪稱最經(jīng)典、使用最為廣泛的一種神經(jīng)網(wǎng)絡[2,3]。
BP神經(jīng)網(wǎng)絡是誤差反向傳播(Back error propagation,簡稱BP)神經(jīng)網(wǎng)絡的簡稱。BP神經(jīng)網(wǎng)絡通常由1個輸入層、若干隱含層和1個輸出層組成,在每層中可以包括若干個神經(jīng)元。各相鄰層神經(jīng)元之間多為全連接方式,而同層神經(jīng)元之間則無連接[4]。各神經(jīng)元間的連接傳遞相應的權值,隱含層及輸出層各神經(jīng)元都有自己的閾值。BP神經(jīng)網(wǎng)絡作為一種前饋網(wǎng)絡,具有前饋網(wǎng)絡的共性。研究表明,三層前饋網(wǎng)絡就能夠以任意精度逼近任意連續(xù)函數(shù)及其各階導數(shù)[5]。對序列進行建模,從本質上來說就是獲得序列的變化泛函,BP神經(jīng)網(wǎng)絡的函數(shù)逼近功能正好可以實現(xiàn)此過程。
但BP神經(jīng)網(wǎng)絡也存在若干缺陷,其中比較突出的是網(wǎng)絡結構的不易確定、易限于局部收斂和收斂速度慢。其中網(wǎng)絡結構的不易確定是指在確定網(wǎng)絡結構參數(shù)的過程中沒有準確的依據(jù)可以遵循。而局部收斂則對BP神經(jīng)網(wǎng)絡的函數(shù)逼近功能影響較大。
2.2 支持向量機預測的理論基礎及特性分析
3 預測模型的建立
3.1 樣本數(shù)據(jù)的準備
從河南統(tǒng)計年鑒中收集了1986-2010年河南省農(nóng)田有效灌溉面積的統(tǒng)計數(shù)據(jù)[10]。為了降低預測模型的復雜程度,采用峰值法對這些數(shù)據(jù)進行了歸一化處理。將歸一化后的1986-2009年數(shù)據(jù)作為訓練樣本,2010年數(shù)據(jù)作為檢驗樣本。
確定預測模型每次的輸入樣本中包含6個數(shù)據(jù),即用連續(xù)6年的數(shù)據(jù)預測第七年的數(shù)據(jù)。據(jù)此可建立訓練時的輸入樣本矩陣(6×18)和輸出樣本向量(1×18)。
3.2 預測模型基本參數(shù)的確定與訓練
1)BP神經(jīng)網(wǎng)絡基本參數(shù)的確定與訓練。確定BP神經(jīng)網(wǎng)絡的隱含層數(shù)為1,輸入層神經(jīng)元數(shù)為6,輸出層神經(jīng)元數(shù)為1,隱含層神經(jīng)元數(shù)為11。隱含層和輸出層的激勵函數(shù)分別采用正切型Sigmoid函數(shù)和對數(shù)型Sigmoid函數(shù)。為了提高收斂速度,訓練時采用了Levenberg-Marquardt數(shù)值優(yōu)化算法。
2)支持向量機基本參數(shù)的確定與訓練。采用Epsilon型支持向量機回歸算法,經(jīng)過多次試驗,確定拉格朗日乘子上界為5,不敏感函數(shù)取值為0.000 01,核函數(shù)采用高斯型,高斯核函數(shù)的寬度取0.15。
4 預測與分析
4.1 兩種模型預測能力對比
利用訓練完畢的兩種預測模型仿真預測1992-2009年的河南省農(nóng)田有效灌溉面積并進行反歸一化處理。反歸一化后的各預測值、預測誤差的絕對值和預測相對誤差的絕對值見表1。從表1可以看出,支持向量機的各預測值與實際值更為接近,其預測誤差的絕對平均值、預測相對誤差的絕對平均值都遠小于BP神經(jīng)網(wǎng)絡預測結果的對應參數(shù)。圖1中的各預測數(shù)據(jù)也全部經(jīng)過了歸一化處理,從圖1中1992-2009部分也可以看出,支持向量機的預測值基本和實際值重合在一起,而BP神經(jīng)網(wǎng)絡的預測值在一些地方則與實際值相差較大,說明基于支持向量機的預測模型泛化能力更強。 利用這兩種預測模型分別預測作為檢驗樣本的2010年河南省農(nóng)田有效灌溉面積,反歸一化后的預測結果如表2和圖1所示。從表2和圖1可以看出,基于支持向量機的預測模型在檢驗樣本處的實際預測精度也遠高于BP神經(jīng)網(wǎng)絡,其預測誤差僅為BP神經(jīng)網(wǎng)絡預測誤差的11.8%。
4.2 河南省“十二五”期間農(nóng)田有效灌溉面積的預測與分析
實際上,預測結果是在現(xiàn)有條件的基礎上從數(shù)據(jù)序列的角度進行的預測,如果在“十二五”期間,政府大幅增加水利行業(yè)的資金投入,最終的發(fā)展情況將會比該預測結果更好。
5 小結
在對農(nóng)田有效灌溉面積進行預測時,數(shù)據(jù)序列預測法比結構式預測法更為簡單易行。在各種數(shù)據(jù)序列預測方法中,神經(jīng)網(wǎng)絡預測方法和基于支持向量機的預測方法更為適合農(nóng)田有效灌溉面積的非線性變化規(guī)律。
研究針對BP神經(jīng)網(wǎng)絡和支持向量機兩種預測方法進行了對比分析。理論研究表明,基于支持向量機的預測方法可以克服BP神經(jīng)網(wǎng)絡的諸多缺陷,具有優(yōu)越性。
以河南省1986-2010年的農(nóng)田有效灌溉面積統(tǒng)計數(shù)據(jù)為基礎,詳細闡述了利用兩種預測方法建立預測模型的過程,并進行了應用驗證。驗證結果表明,基于支持向量機的預測方法具有更好的泛化能力,預測精度更高。最后獲得了河南省“十二五”期間農(nóng)田有效灌溉面積的預測數(shù)據(jù)并指出了其發(fā)展趨勢。
參考文獻:
[1] 鄭家亨.統(tǒng)計大辭典[M]. 北京:中國統(tǒng)計出版社,1995.
[2] 卞鳳蘭,黃曉明,劉 睿.城鎮(zhèn)化進程中公路網(wǎng)用地的BP神經(jīng)網(wǎng)絡預測模型[J].東南大學學報(自然科學版),2010,40(5):1073-1076.
[3] 尹健康,陳昌華,邢小軍,等. 基于BP神經(jīng)網(wǎng)絡的煙田土壤水分預測[J]. 電子科技大學學報,2010,39(6):891-895.
[4] 陳 明. 神經(jīng)網(wǎng)絡模型[M]. 大連:大連理工大學出版社,1995.
[5] 柳小桐. BP神經(jīng)網(wǎng)絡輸入層數(shù)據(jù)歸一化研究[J].機械工程與自動化,2010(3):122-123,126.
[6] 張 華,曾 杰.基于支持向量機的風速預測模型研究[J]. 太陽能學報,2010,31(7):928-932.
[7] CHEN B J,CHANG M W,LIN C J. Load forecasting using support vector machines:A study on EUNITE competition 2001[J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[8] VAPNIK V N. The Nature of Statistical Learning Theory[M].New York:Springer,1995.
[9] HSU C W, LIN C J. A comparison of methods for multi-class support vector machines[J]. IEEE Transactions on Neural Networks,2002,13(3):415-425.
[10] 河南省統(tǒng)計局,國家統(tǒng)計局河南調查總隊. 河南省統(tǒng)計年鑒—2011[M].北京:中國統(tǒng)計出版社,2011.