基于最大熵原理方法的洪水预报

范文一：基于最大熵原理方法的洪水预报误差分布研究

基于最大熵原理方法的洪水预报误差分布

研究

2007年5月

水利

SHUIU

XUEBA0第38卷第5期

文章编号:0559.9350(2007)05—0591—05

基于最大熵原理方法的洪水预报误差分布研究

刁艳芳,王本德,刘冀

(大连理512大学土木水利学院,辽宁大连116023)

摘要:采用最大熵原理(POME)方法,对我国湿润和半湿润地区部分典型水库的洪水预报误差分布规律进行了研

究.通过建立洪水预报误差分布的最大熵模型,计算出9座典型水库洪水预报的净雨相对误差,洪峰流量相对误

差和峰现时间预报误差的概率密度函数,并将其概率密度函数曲线与正态分布曲线进行比较.结果表明,我国湿

润和半湿润地区的洪水预报误差近似服从正态分布,且采用POME方法计算洪水预报误差分布是可行的.

关键词:洪水预报误差;水库;概率密度分布;湿润和半湿润地区;最大熵原理(POME)

中图分类号:P333文献标识码:A

1研究背景

近年来,随着水库现代化水雨情遥测系统的建立,计算机,卫星等先进工具在水库中的应用,预报信

息被越来越多的应用于水库调度中.虽然先进的工具使水库洪水预报精度,合格率有了很大提高,预见

期得以延长,但是由于目前洪水预报多采用水文模型来计算洪水过程,这就涉及到模型结构,参数,输入

的误差以及资料代表性等问题,因此洪水预报误差是不可避免的.对洪水预报误差统计特性的研究,主

要是对其分布规律的研究,它能为水库实时调度提供参考,使决策者知道发生不同误差的概率大小,有

利于及时弥补错误的决策.此外,水文预报的不确定性是影响预报调度风险率的重要因素,洪水预报的

精度和可靠性就成为防洪预报调度成败的关键.由此可见,洪水预报误差分布规律对洪水预报实时

校正以及水库预报调度风险分析具有重要的现实意义.

根据水文气象特征与流域下垫面状况基本可划分为湿润,半湿润与半干旱(或简称半湿润)和干旱

三类地区.不同地区的降雨和蒸发量,下垫面土壤与植被覆盖状态,流域饱气带厚度和最大蓄水容量等

差异较大,集中表现在产流特性的不同,第1类属蓄满产流区,第2类属蓄满兼超渗产流区,第3类属超

渗产流区.目前,第3类地区由于洪水资料少,洪水预报模型或方案预报误差较大,按照规范要求,评价

方案等级较低;为提高1,2类地区预报方案的精度已经做了大量的研究,使许多水库洪水预报方案达到

甲等,但是对洪水预报误差分布规律的研究较少,通常对所研究水库的预报误差资料进行非参数的假设

检验,从而判断其误差服从何种特殊分布,这些研究带有明显的主观性.为此,本文将采用最大熵

原理(POME)方法,根据资料情况,对湿润,半湿润与半干旱两类地区洪水的量,峰,峰现时间三要素预报

误差进行了研究,获得其客观反映洪水预报误差的分布规律.

2洪水预报误差分布的最大熵模型

最大熵原理(POME)由Jaynes在1957年首次明确提出.是解决不适定问题的较好的方法,它认为

收稿日期:2006-06—14

作者简介:刁艳芳(1981一),女,山东滨州人,博士生,主要从事防洪预报调度风险分析理论及应用研究.

E—mail:diaoyanfang@sohu.e0m

一

59l一

在所有的可行(可能)解中,应该选择其熵最大的一个.熵最大意味着对因为数据不足的人为假定(人为

添加信息)iiId,,从而所获得的解最合乎自然,偏差最小.最大熵方法的基础是信息熵,此熵定义为信息

的均值,它是对整个范围内随机变量不确定性的量度.由此可见,POME方法能尽量客观的分析洪水

S:一If(x)ln~f()]d(1)

maxS=一maxl厂()ln[f()]dx(2)

s.t.1f()dx=1(3)

Ix7()dx=,(i=1,2,…,m)(4)

式中::G(.,,…,),n为洪水预报误差所在的集合;m为的原点矩的阶数;n为影响的风险因子数;6是保证有意义的量;为的第i阶原点矩观测值,即样本的第i阶原点矩;/()为的

该模型表示在满足已知信息约束下,以熵最大为准则求得洪水预报误差的概率密度函数.

2.2模型求解模型的求解是一个泛函条件极值问题.为求得,()的表达式,可以根据变分法引

入拉格朗日乘子A.,A.,A,…,A,令

Js:f{一,()ln[,()j+(A.+1),()+?A;())d(6)

于是问题就转化为要使S这个泛函达到极值.由变分法,相应的欧拉方程为

一

ln[()]+A.+?Ai'=0(7)

/()=exp(A.+?A,')(8)

这就是最大熵概率密度函数的解析形式,只要确定其中的参数A.,A,,A,…,A就可以完全确定

厂().利用式(3),式(4),作数学推导,得到求解A.,,A.,…,A应满足的联立方程组为 A.=一n[.f.expc奎i=1

'd];,n.=c9,

式(9)可以看作是有关.,,,,…,的m个方程组.为便于数值求解,可以把它改写为一一exp(')d/exp(?i=1

)d(m)

式中:为残差,可用数值计算方法使其趋于零.

利用非线性规划求R的最小值.当R<e(e为规定的允许误差)或所有的II<e时即认为式

(1O)收敛,从而求解出A,,A,…,A,再按照式(9)求出A..将全部待估计的参数代入式(8),即可求出

3实例应用

本文针对湿润和半湿润地区9座水库的洪水预报误差进行了研究.表1列出了这9座水库的基本

信息.所列举的湿润地区的水库分别位于鸭绿江流域,淮河流域和长江支流域;半湿润半干旱地区的水

库位于东北地区东部的辽河,松花江流域.从流域水文气象特征,下垫面状况看,这些水库的洪水预报

误差的分布规律基本能反映出我国1,2类地区的洪水预报误差的分布规律. 本文对洪水三要素预报误差的研究主要指净雨相对误差,洪峰流量相对误差和峰现时间预报误差.

下面以桓仁水库的净雨相对误差为例,采用POME方法计算净雨相对误差的概率密度函数.

表1水库基本信息

3.1洪水预报误差分布计算根据桓仁水库54场洪水的实际净雨和预报净雨,可计算出净雨相对误

差的均值:一1.50和标准差d=14.84.对于的积分区间问题,可以考虑"截尾"处理,即用f()在

有限域内的积分值近似作为无穷域上的积分值.当的置信限为[一5,互十5]时,的置信概率为

P(互一5a?z?互十5a)=0,99999951,的积分区间可简化为[互一5盯,互+5盯].由文献[11]知一般

工程问题取前3阶计算可以满足精度要求,因此取m=3.通过POME方法求得.:一3.5864,=一

2.4299×10,,,=一2.5393×10一,=2.5663X10,,残差平方和为1.38X10..由此可得净雨相对误

差的概率密度函数为:厂()=exp(一3.5864—2.4299X10,一2.5393×10,+2.5663X10,).

绘制曲线f(),同时绘制理论正态曲线,见图1.同理,对桓仁水库洪峰流量相对误差和峰现时间

预报误差的概率密度函数分别求解,函数式如下(设为洪峰流量相对误差,为峰现时间预报误

差),其图形及理论正态曲线分别见图2,图3,方程分别为:f()=exp(一3.4813—4.4558X10,z一

3.3924X10一+4.3287X10一;),-厂(2)=exp(一2.7498+9.0938X10,2—1.4567X10一;一3.9886

X10一).

由图1,图3可以看出,最大熵曲线与理论正态曲线的差异不大.本文采用拟合优度法检验洪

水预报的相对误差与正态分布的差异,下面仍以桓仁水库净雨相对误差为例进行

说明.假设:

H0:F()=F0();H1:F()?F0()

式中,Fo=?一1exp[一

用5个实数一15,一10,一2.5,4和l2将(一?,+..)划分为6个不相交的区间,即(一..,一l5],

(,15,一10],(一10,一2.5],(一2.5,4],(4,12]和(12,+?).计算落在各区间的概率为: P.=I『:—exp(一)d=(二):0.1814;

P:.:f

P如:f

—

l0+1.50

—订一1一P.=0.1029;

二)一P.一P=0.1878;

P柏=({?i)一P..一P加一P?=0.?722;

P?=()一P.一P加一P?一P柏=0.1743;

P60=1一Pl0一P20一P30一P柏一P50=0.1814. 计算观察频数和期望频数.给定显着性水平a=0.05,查一分布上侧分位数表可得分位数值

(3,0.95)=7.815,临界域为(7.815,+?).计算检验统计量的数值得: 6M2

:一n:56.4192—54:2.4192.

一nplo

由于<7.815,因此不拒绝原假设,可以认为净雨相对误差服从正态分布.同理,可检验洪峰流

量相对误差和峰现时间预报误差的分布服从正态分布.

同桓仁水库,采用POME方法求出其它8座水库3种预报要素误差的概率分布,并进行拟合优

度检验,证实了它们与理论正态分布没有显着差异.

鼙

净雨相对误差)

图1净雨相对误差概率分布曲线

80--60--40-200204060

洪峰流量相对误差(%)

图2洪峰流量相对误差概率分布曲线

蜂现时间预报误差/h

图3峰现时间预报误差概率分布曲线

3.2计算结果对比分析比较9座水库3种预报要素误差分布的最大熵曲线与理论正态分布曲线,其

不同之处如下:(1)最大熵曲线的最大概率值大于理论正态曲线的最大概率值,3种预报要素误差的最

大熵曲线与理论正态曲线最大概率值差值的极值见表2;(2)最大熵曲线最大概率值对应的横坐标值不

等于均值,在均值附近,偏离的幅度不大.3种预报要素误差最大概率值对应的横坐标值与均值差值的

极值见表3;(3)偏差系数反映了洪水预报误差系列对平均值左右两旁分布的不对称程度.如果对称,

则偏差系数为零,不对称程度越大,偏差系数越大.3种预报要素误差偏差系数的极值见表4.

表3最大熵曲线最大概率值对应的

表2两种曲线最大概率值差值的极值横坐标值与均值差值的极值表4偏差系数的极值

净雨相对洪峰流量峰现时间一净雨相对洪峰流量峰现时间

项目误差相对误差预报误差项目误差相对误差预报误差

湿润最大值O.62820.59900.6791半湿润最大值O.4340O.84270.9141

地区最小值0.132002415O.0890地区最小值0.1713O.20280.1326 _.——

594..——

4结论

根据上述分析可以看出,最大熵曲线和正态曲线在最大概率值,最大概率值对应的横坐标值的差值

都不大,并且最大熵曲线的偏差系数也不大,因此,作者认为我国湿润和半湿润地区的洪水预报误差近

似服从正态分布,并且采用POME方法研究洪水预报误差分布是可行的.但是应指出:(1)由于资料的

限制,本文仅使用湿润和半湿润地区的部分典型水库资料得到以上初步的结论,还有待于采用更多的资

料进行验证;(2)对于具体的某个水库,如果此水库有洪水预报误差资料,则应对此资料采用POME方法

进行分析;如果无洪水预报误差资料,则可直接采用正态分布.

参考文献:

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[1O]

吴泽宁,胡彩虹,王宝玉,刘红珍.黄河中下游水库汛限水位与防洪体系风险分析[J].水利,2006,37(6):

641—648.

左保河.实时洪水预报过程中的误差分布特性研究[J].华北水利水电学

院,1997,18(2):41—46.

大连理工大学土木水利学院.洪水预报及降雨预报信息利用可能性研究[R].大连:

大连理工大学土木水利

学院,2004.

李致家,营瑞卿,薛清敏,周轶.洪水预报误差置信限与误差评定方法研究[J].河海大

学(自然科学版),

2005,33(1):32—36.

焦瑞峰.水库防洪调度多目标风险分析模型及应用研究[D].郑州:郑州大学,2004.

徐玉英,王本德.水库洪水预报子系统的风险分析[J].水文,2001,21(2):1—4.

闫骏霞.水库洪水调度峰量控制类型与碧流河水库防洪预报调度规则研究[D].大

连:大连理工大学,2005.

DebdasMukherjee,NadaMansour.Estimationoffloodforecastingandflow-durationjointp

robabilitiesofexceedance[JJ.

JournalofHydraulicEngineering,1996,5:130—140.

王丽萍,傅湘.洪灾风险及经济分析[M].武汉:武汉水利电力大学出版社,1999.

李继清,张玉山,王丽萍,纪昌明.应用最大熵原理分析水利工程经济效益的风险[J].

水科学进展,2003,14

(5):626—630.

J?N?希德尔(加拿大).工程概率设计:原理和应用[M].北京:北京科学出版社,1989.

Studyondistributionoffloodforecastingerrorsbythemethod basedonmaximumentropy

DIA—

OYan—fang,WANGBen—de,LIUJi

(DalianUniversityofTechnology,Dalian116023,China) Abstract:Themethodbasedontheprincipleofmaximumentropy(POME)isappliedtoanaly

zethe

—distributionsoffloodforecastingerrorsforsometypicalreservoirsinhumidandsemi

humidregions.The

probabilitydensityfunctionofnetrainfallrelativeelTOrs,floodpeakdischargerelativeerror

sandthetime

erroroftheforecastedfloodpeakarecalculatedbythemodeldeveloped.Itisfoundthatthedistributions

offloodforecastingerrorsbothinhumidorsemi—

humidregionapproximatelyobeythelawofnormal

distributionandthemethodbasedonPOMEiseffectiveforcalculatingthedistributionoffloodforecasting

elTors.

Keywords:floodforecastingerrors;reservoir;distributionofprobabilitydensity;humidandsemi—humid

region;principleofmaximumentropy(POME)

(责任编辑:王成丽)

一

595—

范文二：基于最大熵原理方法的洪水预报误差分布研究

基于最大熵原理方法的洪水预报误差分布研究

刁艳芳土木水利学院辽宁大连

摘要

对我国湿润和半湿润地区部分典型水库的洪水预报误差分布规律进行了研

通过建立洪水预报误差分布的最大熵模型计算出

关键词

概率密度分布湿润和半湿润地区

研究背景

对洪水预报误差统计特性的研究主

要是对其分布规律的研究洪水预报的类属超

目前第类属蓄满产流区第类属蓄满兼超渗产流区第方案等级较低为提高

甲等但是对洪水预报误差分布规律的研究较少通常对所研究水库的预报误差资料进行非参数的假设检验误差进行了研究洪水预报误差分布的最大熵模型

作者简介山东滨州人博士生

主要从事防洪预报调度风险分析理论及应用研究

在

最大熵模型设

方法能尽量客观的分析洪水

相应的最大熵原理表示为

或

式中为洪水预报误差所在的集合

是保证

有意义的量

为为影响的风

的

为的第

模型求解

入拉格朗日乘子

为求得

可以根据变分法引

于是问题就转化为要使

解之得

就可以完全确定

应满足的联立方程组为

的

式中

当

时即认为式即可求出

利用非线性规划求

误差的分布规律基本能反映出我国

表

列出了这座水库的基本

半湿润半干旱地区的水

这些水库的洪水预报

水库基本信息

桓仁水库白龟山水库双牌水库观音阁水库

半湿润半干旱地区

柴河水库清河水库

鸭绿江流域浑江淮河流域沙颖河水系

湘江支流潇水

辽河流域辽河辽河流域太子河辽河流域太子河流域面积库容?下面以桓仁水库的净雨相对误差为例

采用

表

序号

水库名称

湿润地区

洪水预报误差分布计算根据桓仁水库差的均值

和标准差

对于

当

通过

方法求得

由此可得净雨相对误

的置信概率为

工程问题取前阶计算可以满足精度要求因此取

绘制曲线

同理对桓仁水库洪峰流量相对误差和峰现时间为洪峰流量相对误差

为峰现时间预报误

其图形及理论正态曲线分别见图

由图

本文采用拟合优度法检验洪

水预报的相对误差与正态分布的差异

假设

式中

用

和

计算

落在各区间的概率为

给定显著性水平

计算检验统计量的数值得

由于拟合优

同桓仁水库

采用

座水库

种预报要素误差的概率分布

并进行

净雨相对误差概率分布曲线

洪峰流量相对误差概率分布曲线

峰现时间预报误差概率分布曲线

计算结果对比分析

比较

座水库

种预报要素误差的最

大熵曲线与理论正态曲线最大概率值差值的极值见表

种预报要素误差最大概率值对应的横坐标值与均值差值的

如果对称极值见表

则偏差系数为零

种预报要素误差偏差系数的极值见表

表

最大熵曲线最大概率值对应的横坐标值与均值差值的极值

洪峰流量峰现时间两种曲线最大概率值差值的极值

净雨相对洪峰流量峰现时间净雨相对

表

偏差系数的极值

似服从正态分布

并且采用

但是应指出

限制本文仅使用湿润和半湿润地区的部分典型水库资料得到以上初步的结论还有待于采用更多的资

则应对此资料采用方法参考

文

献

吴泽宁胡彩虹王宝玉刘红珍

左保河

李致家菅瑞卿薛清敏周轶

焦瑞峰

徐玉英王本德

大连理工大学土木水利

大连理工大学土木水利学院

闫骏霞

王丽萍傅湘

范文三：基于广义最大熵原理和遗传算法的多指标权重确定方法研究

基于广义最大熵原理和遗传算法

的多指标权重确定方法研究

霍映宝 ,韩之俊

()南京财经大学工商管理学院 ,江苏 ,南京 , 210094

摘要 :本文探讨了多目标评价的实现过程 ,针对评价过程的权重确定问题 ,提出了基于广义最大熵

原理和遗传算法的赋权方法 ,该方法把不同赋权方法有机地集成在一起 ,并可以对各种赋权方法

进行优劣比较。最后用实例验证了该方法的准确性、可靠性和有效性。

关键词 :多指标评价 ;广义最大熵原理 ;遗传算法 ;权重

中图分类号 : O21216 文献标识码 : A

Re sea rch on G iv in g W e igh t for M u lt i2in d ica tor

Ba sed on GM E Pr in c ip le An d GA

HUO Ying2bao, HAN Zh i2jun

( Schoo l of Econom y and m anagem en t N an jing U n ive rsity of Sc ience

)and Techno logy, N an jing, J iangsu, 210094, Ch ina

A b stra c t: Th is p ap e r p robe s in to the p roce ss of rea liza tion fo r m u lti2ind ica to r eva lua tion. In o rde r to give we igh t

( ) ( ) co rrec tly, a new m e thod ba sed on gene ra lized m axim um en trop y GM Ep rinc ip le and gene tic a lgo rithm GA . Seve ra l d iffe ren t m e thod s a re in te rgra ted and can be comp a red w ith each o the r by th is new m e thod. A t la st, an examp le is given to demon stra te the p rec ision and re liab ility and va lid ity of th is m e thod in th is p ap e r.

Key word s:m u lti2ind ica to r eva lua tion GM E P rinc ip le; GA; we igh t

言 1、引

面对复杂的社会经济系统 ,多指标评价问题一直是人们孜孜不倦研究的课题 ,其相关文献出现在众多的期刊和著作中 ,研究成果可谓层出不穷。透视这些研究成果我们发现 :在多指标评价问题中各指标权系数或权重的确定是很关键的一个环节 ,因为权重确定的是否合理直接影响到决策效果的可靠性与有效性。而如何判断其权重的合理性却没有一个共同或明确的标准 ,几乎每位作者都从某一研究角度认为自己提出的方法是合理的和科学的 ,其它的方法是有缺陷的。确实 ,在多目标决策问题中 ,没有任何一种权重的确定方法是完美无缺的 ,也许正是这一缺憾才促使我们不断研究去提出新的方法以丰富与发展多目标决策理论。所以 ,我们很难说主观赋权就一定逊色于客观赋权 ,也不能轻易讲基于神经网络的赋权就优于其它方法的赋权。实际上 ,从概率统计的角度看 ,各指标的权系数是一个随机变量 ,不同赋权方法得出的权系数只能是该随机变量的一个可能取值 ,显然 ,该值出现的概率越大 ,其对应的赋权方法就

越好 ,特别是如果我们能够得到权系数这个随机变量数学期望的估计并以此作为对应指标权

收稿日期 : 2003年 12月 5

日

数理统计与管理第 24 卷第 3期 2005年 540 月重的话 ,那毫无疑问这样的权重具有很好的稳定性。为此本文根据这一思路 ,引入广义最大熵

原理并采用遗传算法提出一种新的多目标赋权方法 ,且用一案例说明了该方法的有效使用。

2、多目标评价模型

211 多目标评价的目的与实现

多目标平价的目的就是通过对研究对象的特性和功能作系统的分析与整合 ,对其综合价值作出评估以提示研究对象的状态与发展规律。一般多目标评价的实现可由两次映射来完成 ,第一次映射是将多维空间的无序点转变为多维空间的有序点 ;第二次映射是将多维空间的有序点通过线性加权组合转化为一维空间的有序点。

212 指标数据的基本处理

一般起见 ,设有 m 项评价指标 ,对 n个方案或样本进行评价 ,记原始数据阵为

( ) x, x1, 2, j = 1, 2, = [ xi = x = , x]n m ij n ×mi1 i2im

由于各个评价指标往往存在属性和数量级的差异 ,需要对原始数据进行同趋化和标准化处理。同趋化处理主要解决不同属性数据的加总问题 ,使不同性质的指标变量在综合评价中发挥同方向作用 ,如果我们以效益型指标作为评价方向 ,那么对成本型指标赋负值以改变指标的性质 ,而对固定型指标则采用与目标值之差的绝对值赋负值的办法。标准化处理的目的是消除指标变量的量刚影响。假设数据已同趋化 ,我们对数据进行标准化处理 n 1 x1, 2, i = = n x ijj ? n i = 1 x- x ij j 其中( )1 y= ijn s j 1 2 ( xj = 1, 2, )s= - x m ijjj ? n i = 1

( ) ) ) ( ( 记标准化数据阵Y = y= [ x, x, x], 这时有 : E y= 0, V a r y= 1, 且变量集 ij n ×mi1 i2im j j

2 [ 1 ] 合 N 上的点均分布在半径为 n的超球面上 , 即 ‖y‖ = n 。通过原始数据的同趋化和标准 j j

化处理 , 我们完成了多目标评价的第一次映射。

213 权重的确定

为有效实现第二次映射 , 我们在多变量系统提取综合变量 F, F 是标准化后变量 y, y, 1 2 , y的线性组合 , 即 j

( )F = wy+ wy+2 + wy= w ′Y 1 1 2 2 m m

() ( ) 其中权数向量 w = w, w, w′, 多目标标准化评价向量 Y = y, y, y′。 1 2 m 1 2 m

)的确定应考虑以下两个方面的条件: m ( 我们对权数 w j = 1, 2, j

一方面要求综合变量 F 携带原多变量系统足够多的信息 , 以使评价样本的评价值尽可能

分散从而便于方案或样本的择优比较 , 故需要 F 的方差最大 , 即

1 1 2 ( ) () ( )3 m ax V a r F = V a r w ′Y = ‖F ‖= w ′Y Y ′w = w ′w ?n n

式中表示 Y 数据表的协方差矩阵 , 因数据已标准化 , 故协方差矩阵就等于 Y 的相关系 ?

数阵。即

霍映宝等 :基于广义最大熵原理和遗传算法的多指标权重确定方法研究 41

r1 r12 1m n rr1 2m 1 21 ( )( ) ( ) r = r x , x = r y , y = y y4 = R =js j s j s ij is ? ? n i = 1ω

1 rr m 1×m m m 2

) m 的估计稳健可靠。为此 , 我们引入熵的概念 , 熵( 另一方面我们要求权数 w j = 1, 2, j

[ 2 ] 是 1948年信息论的创始人香农 ( shannon)在“通信的数学理论 ”一文中提出的 ,为与热力学中热熵的区分 ,我们一般称之为信息熵或香农熵 ,热熵具有量刚 ,而信息熵是无量刚的。熵是

( ) 随机变量不确定性的量度 , 熵函数 H P 具有非负数、对称性、凸性等特征。 1957 年 , [ 3 , 4 ] ()E1T1J ayne s提出了最大熵 M E原理 , M E 原理认为 : 在非适定问题的所有解中 ,应选取符合约束条件但熵值取最大的一个解 ,这是我们可以作出的唯一不偏不倚的选择 ,任何其它的答案都意味着我们添加了人为的信息 ,这一原理已在众多领域得到广泛应用。

[ 5 , 6 , 7 , 8 ] J ayne s的 M E原理一般是针对系统内一个随机变量的 ,而 GM E是 M E 理论的拓展 ,它的目标是同时最大化系统内所有随机变量的香农熵。如果把各指标的权数看作是不同的随机变量 ,则需要同时最大化 m 个权重的香农熵 ,由于熵的度量依赖于随机变量可能取值的概 [ 7 ] 率 ,所以我们令

l j = 1, 2, , m ( )5 w = p jk zj jk ?k = 1 k = 1, 2, , l

其中 p是变量 w 的先验权数值 z的对应概率 , 通常 z可以由主观赋权法和客观赋权jkjjkjk

[ 9 ][ 9, 10 ][ 11 ]法 (如熵值法和神经网络法和 AH P等法 )预先给出 , 注意 p 和 z ?[ 0, 1 ], 且满足 jk jk

l j = 1, 2, , m ( ) p= 1 6 jk ?k = 1 k = 1, 2, , l m j = 1, 2, , m ( )z= 1 7 jk ?j = 1 , l k = 1, 2,

( ) ( ) 一般取 lΕ 2, 如果记 z= z, z, z′, p= p, p, p′, 则权数向量 w 等于 j j1 j2 jl j j1 j2 jl

0 p0 z′ 11 z′ 20 0 p 2( )8 w = zp =

0 0 pz′ mm

[ 5, 8 ] 式中 , w 是 m ×1未知权数向量 , z是 m ×m l阶先验权数矩阵 (或称权数支持矩阵 ) , p是 m l

×1的未知概率向量。

m l 根据 GM E原理 , 我们同时最大化 m 个权数变量的香农熵 , 即

( )( )( )= - p′ln p m xa 9 pln pH = - jk jk ??j = 1 k l j = 1, 2, , m ( )Ε 0 s. t. = 1 10 ppjk jk ?k = 1 k = 1, 2, , l

[ 12 ] 这是一个双目标规划问题 , 为寻求非劣解 , 可应用加权法、约束法、混合法等。我们采

用加权法构造如下的单目标数学评价模型

1 1 ( ) ( ) ( ) m inf p= - H - V a r F = p′ln p- w ′Rw ηη

数理统计与管理第 24 卷第 3期 2005年 542 月

1 1 ( ) ( ) ( ) ( )′ln p- p′z′R zp= p- zp′R zp= p′ln p ( )11 ηη l j = 1, 2, , m Ε p( )s. t. = 1 p0 12 jkjk ?k = 1 k = 1, 2, , l

( )( )η公式 11 中的为加权平衡因子 , 根据实际需要可预先给定 , 公式 12 中有 m 个约束等

式。

显然 , 这是一个非线性规划数学模型 , 可用广义简约梯度方法求最优解 , 但梯度法迭代寻 [ 13 ] ( ) 优极易陷入局部极小 , 为克服这一不足 , 我们采用全局寻优的遗传算法 GA 来求解 , 待最

3 ( 优解 j = 1, 2, p)( )( , m ; k = 1, 2, , l获得后 , 代入公式 5 便可得到每个评价指标的权数 w j jkj

, m ) , 可以看出计算的结果实际上是每个权数变量数学期望的估计 , 所以 , 该方法确 = 1, 2,

( )定的权数稳健可靠。然后 , 通过公式 2 计算综合评价值 , 为习惯起见可将综合评价值以下式

( ) F- m in F i i =1, 2, ( )i = ×100 g, n 13 i( ) ( )m ax F - m in F i i

m m l 进行转化 , 再按照分值高低对方案择优和评价。注意一般情况下 ?w = ??pz?1, 如有必 j jk jk j = 1 j = 1 k = 1 要可归一化处理 , 但是否归一化处理对排序结果没有任何影响。

此外 , 如果我们对上面的单目标数学评价模型做如下的假设

3 3 ( )k = 1, 2, 14 p= p== p= p, l 1 k2 k m k k

即假定每一种赋权方法确定的权重在对应的随机变量中出现的概率相等 , 这样便可根据 3 3 ( ) , m 以 p的大小来比较预先评价方案的优劣 , 也可由此计算评价指标的权重 w j = 1, 2, k j

实现多目标的评价 , 在这种情况下不难证明下式总成立

m m l

w pz( )1 15 = = jjk jk ???j = 1 j = 1 k = 1

214 基于遗传算法 ( GA )的求解

[ 14 ] GA 是 Ho lland于 60年代提出的 ,它是一种基于生物自然选择与遗传机理的随机搜索方法 , GA 的搜索是从问题解的编码组开始的 ,它使用适应度函数这一信息进行搜索 ,而不需 [ 13 ] 要导数等其它信息 ,研究已经表明 , GA 对任意优化问题解能以概率 1 收敛于全局最优解 , 下面我们给出一般非线性规划 GA 的主要步骤 :

( )1 编码 ; GA 不对优化问题的参数变量进行直接操作 ,它是通过编码将问题的参数变量表示成串结构数据。常见的编码技术有二进制编码、实数编码和有序串编码等。

( )2 初始群体的生成 :随机产生 N 个初始串结构数据 , GA 以这 N 个串结构数据构成初始群体开始迭代。

( )3 适应度价值评估检测 :适应度函数表明个体或解的优劣性 ,对于有约束条件的非线性规划一般采用惩罚策略将惩罚体现在适应度函数中 ,使约束化问题转化为一个附带考虑代价

[ 13 , 14 ] 或惩罚的非约束优化问题。

( )4 操作算子 :选择优良的个体繁殖后代是 GA 极其重要的一步 ,我们采用轮盘赌选择法选择个体 ;交叉操作可以得到新一带个体 ,新个体组合了其父辈个体的特征 ,有单点操作、算术操作和启发式交叉等交叉算子 ;变异是在群体中随机选择一个个体 ,然后对该个体以一定的概率改变串结构数据中某个串的值 , GA 中发生变异的概率很低 ,采用的变异方法有统一变异、边界变异等。

霍映宝等 :基于广义最大熵原理和遗传算法的多指标权重确定方法研究 43

3、实例分析

[ 9 ]以文献的案例为例 ,为节省篇幅原始数据省略 ,数据是我国 23 家柴油机生产厂家的经

济效益指标值 ,五个效益指标是资金利税率 % 、销售利税率 % 、产值利税率 % 、人均净产值

()() 元 /人和人均创利税元 /人。下面采用本文方法来确定各效益指标的权重从而对 23 个厂

家进行综合评比。

标准化后的各项指标数据与综合评价值表 1

销售利税率产值利税率人均净产值人均创利税综合评价值资金利税率评价指标企业代号 yyyyyg 12345i1 0. 6688 1. 05375 1. 08166 0. 6585 0. 37833 77. 5045 2 1. 33476 0. 56069 0. 55719 1. 2931 1. 34636 83. 2796 3 - 0. 18553 0. 11899 0. 04924 - 0. 35652 - 0. 40791 54. 731 4 - 0. 19203 0. 16692 0. 08323 1. 35565 - 0. 17688 62. 9437 5 0. 35372 0. 61462 0. 52223 0. 1033 - 0. 0058 66. 5568 6 1. 00797 0. 73189 0. 8 0. 867 1. 52979 82. 864 7 - 0. 65331 - 0. 51789 0. 54748 - 0. 67415 - 0. 8593 47. 2662 8 1. 72783 0. 71905 0. 73202 2. 70981 2. 7945 100 9 0. 26211 0. 34669 0. 27068 0. 31402 0. 03035 64. 3505 10 - 0. 29598 - 0. 32272 - 0. 44124 - 0. 77463 - 0. 4908 47. 2711 11 2. 05918 1. 13422 1. 20307 1. 06286 1. 69311 94. 4118 12 - 0. 0426 0. 21828 0. 14928 - 0. 06639 - 0. 21833 58. 6369 13 - 0. 20502 0. 17548 0. 091 - 0. 51134 - 0. 29712 55. 1024 14 0. 70261 0. 72932 0. 76795 0. 45332 0. 69964 75. 2072 15 - 0. 79625 - 1. 17702 - 1. 32701 - 0. 58454 - 1. 18512 32. 7299 16 - 0. 62733 - 0. 2919 - 0. 49271 - 0. 82277 - 0. 90321 43. 1119 17 0. 06421 0. 19089 0. 17938 0. 57332 - 0. 14241 62. 0188 18 - 1. 36474 - 1. 23609 - 1. 53777 - 0. 97493 - 1. 02353 27. 5918 19 - 2. 60176 - 3. 61752 - 3. 39574 - 1. 28245 - 0. 49113 0 20 - 0. 20502 - 0. 17548 0. 091 - 0. 51119 - 0. 29712 55. 1024 21 - 0. 66631 - 0. 50933 - 0. 53059 - 0. 87711 - 1. 10675 40. 2268 22 - 0. 23101 0. 24396 0. 18812 - 0. 6726 - 0. 3759 54. 7753 23 - 0. 10432 0. 49221 0. 41151 - 1. 28227 - 0. 49076 54. 9868

( )1 数据的基本处理

表 2 指标变量相关系数阵因指标均为效益型 ,故数据无需同趋

X1 X2 X3 X4 X5 ( ) 化处理 ,根据公式 1 进行标准化处理即

X1 1 0. 8795 0. 8678 0. 7995 0. 8366 ( ) 可 ,以消除量刚影响 ,表 1 是标准化后的

X2 0. 8795 1 0. 9677 0. 5833 0. 5453 数据。X3 0. 8678 0. 9677 1 0. 5814 0. 5537 ( )( )2 计算指标相关数阵 :根据公式 4

X4 0. 7995 0. 5833 0. 5814 1 0. 8651 计算得出表 2的相关系数阵 X5 0. 8366 0. 5453 0. 5537 0. 8651 1 ( ) 3 支持权数向量 :我们借用文献 [ 9 ]

的四种方法的结果作为支持权数向量

数理统计与管理第 24 卷第 3期 2005年 544 月

zzzzz 12345

神经网络法012480 12234 11521 11463 12302 0000 熵值法 012116 012436 012156 011346 011946 主观赋权法 0121 0121 0118 0120 0120 熵值法调整 012196 012562 011944 011349 011949 ( )4 遗传算法求解

[ 13 ] η 取加权平衡因子 = 1 构造单目标评价模型 ,通过编程调用 MA TLAB 615 中的遗传算 ( )法 ga函数来优化求解 ,参数设置选择实数编码 ,种群中的个体数目为 10 ,最大代数 100 ,交叉概率为 019 ,变异概率为 0105 ,适应度函数采用惩罚项的适值函数 ,经自动迭代得出最优的概率参数向量为 :

012901 012428 012182 012387 012835

012336 01257 012805 12252 12365 003 3 3 3 3 p=p=p=p=p= 1 2 3 4 5 012434 013106 012431 012313 01234

01245 012662 012579 012255 012369

( ) ( ) 代入 8 式得综合权数向量 w = 012237 012342 011876 011578 012061 ′, 因

( )w? 1 ,故无需归一化处理 ,按式 2 便可计算出每家上市公司的综合得分值 F。ji ?

( )( )() 5 最终综合评价值 g:根据公式 13 计算最终评价得分 g见表 1 ,综合评价值清楚地 i i

反映了每家企业的经营绩效状况和在行业中的发展水平 ,代号 19的厂家以全部效益指标为负 [ 9 ]数排名最后是合情合理的。

( )( )6 四个支持方案的评价 :在式 14 的约束下根据 GA 算法以上面同样的参数设置计算

3 3 ( ) 出评价模型最优的概率参数向量为 : p= 012577 012424 012502 012487 ′,可以看出 , 在本例中神经网络法确实要略优于其它三种方法 ,这与文献 [ 9 ]的结论吻合 ,而主观赋权法和熵值调整法几乎旗鼓相当 ,熵值法则要稍微逊色一点 ,这也反映了主观赋权法不一定就比客观

3 3 3 3 赋权法差 ,所以具体问题要具体分析。我们将 = p代入 ( 8 ) 式得综合权数向量 p( )j j = 1 , 2 , , 5

3 ( ) w= 012226 012331 011850 011541 012052 ′,发现与上面计算结果没有多大差异。

( ) 7 结果分析 :从相关系数表 2可知 ,各指标之间相关性都比较强 ,在 6 个指标中 ,几种赋

权方法都体现了资金利税率、销售利税率和人均创利税的相对重要性。而本文基于广义最大熵原理和遗传算法的多指标权重确定方法有效地对其它赋权方法进行了整合 ,实例的综合评价数据验证了该方法的合理性与可靠性 ,特别是本文的方法可以从理论的角度判断不同赋权方法的优劣程度 ,这在其它相关的文献尚难以找到。

4、结束语

本文提出了基于广度最大熵原理和遗传算法的多目标权重确定方法 ,该方法对于经济系统和工程领域等方面的多目标评价赋权具有指导价值 ,从文中的数学模型看出 ,该方法既考虑了综合评价变量携带原变量系统信息的能力 ,又考虑了指标权数的不确定性 ,还可以从概率的

角度对不同的评价方案进行比较。实例结果表明 :模型参数的估计稳健可靠。

()下转第 50 页

数理统计与管理第 24 卷第 3期 2005年 550 月空间相关性 ; 其次 , 对于不同的空间相邻结构可能会得出不同的结论 , 本文采用的是以具有相邻边界为主的空间相邻结构 , 在某些时候 , 区域的相关不一定是根据地理上相邻来定义的; 另外有缺失值的单元如果相邻 , 则会影响插补结果。同其它插补方法一样 , 空间插补方法也存在当缺失值多于某个限度时没有办法补救的问题。

除了利用空间相关进行空间插补以外 , 空间相关的概念也可以用于抽样设计。在区域上进行抽样设计的时候 , 基于样本单元之间没有相关性的传统抽样理论设计的样本量 , 可能由于单元具有空间相关性 , 造成样本所含“信息 ”不足的现象 , 这时 , 应该尽可能使得样本单元足够 “远 ”,“远 ”至不具有显著的空间相关性 , 从而使样本含有最大的信息。

[参考文献 ]

[ 1 ] A n se lin, L. Sp a tia l Econom e tric s: M e thod s and Mode ls[M ]. Kluwe r A cadem ic Pub ilshe rs, 1988. [ 2 ] C liff, A. D. and J. K. O rd. Sp a tia l P roce sse s: Mode ls and App lica tion s[M ]. P ion, 1981.

冯士雍 ,施锡铨. 抽样调查 2理论、方法与实践 [M ]. 上海科学技术出版社 , 1996. 金[ 3 ] 勇进 ,非抽样误差分析 ,中国统计出版社 , 1996 [ 4 ] 蒋妍. 无回答处理中的多重插补法 [ J ]. 统计与精算 , 2002. 06. [ 5 ] ( ) 张尧庭. 空间统计学简介 [ J ]. 统计教育 , 1996 1 . [ 6 ] 江苏省统计局 ,上半年长三角 14城市居民收支差异简析 [ R ]. 中国统计信息网 , 2003. 08. [ 7 ]

()上接第 44页

[参考文献 ]

[ 1 ] 王惠文. 偏最小二乘回归方法及应用 [M ]. 北京 :国防工业出版社 , 1999 , 8 - 11.

[ 2 ] A sh Robe rt R. Info rm a tion Theo ry[M ]. N ew Yo rk, Dove r Pub lica tion s, 1990.

J ayne s, E . T. Info rm a tion theo ry and sta tistica l m echan ic s[ J ]. Physica l R eview, 1957 , 106 , 620 - 630. [ 3 ]

J ayne s E. T. Info rm a tion theo ry and sta tistica l m echan ic s[ J ]. Physica l R eview, 1957, 108 , 171 - 190. [ 4 ]

[ 5 ] Go lan A , J udge G, M ille r D. M axim um en trop y econom e tric s: robu st e stim a tion w ith lim ited da ta [ M ]. N ew

Yo rk: john W iley and Son s, 1996.

Shen E Z. Pe rloff J M. M axim um en trop y and B aye sian ap roache s to the ra tio p rob lem [ J ]. Jou rna l of [ 6 ]

Econom e tric s, 2001 , 104 , 289 - 313

L ence S H. M ille r D J. E stim a tion of M u lti2O u tp u t P roduc tion Func ion s w ith Incomp le te D a ta: A Gene ra lized [ 7 ]

M axim um En trop y App roach [ J ]. Eu r. R ev. A gr. Econ. 1998, 25: 188 - 209.

F ra se r I. A n app lica tion of m axim um en trop y e stim a tion: the dem and fo r m ea t in the U n ited Kingdom [ J ]. [ 8 ]

App lied Econom ic s. 2000 , 32 , ; 45 - 59.

( ) [ 9 ] 于洋 ,李一军. 基于多策略评价的绩效指标权重确定方法研究 [ J ]. 系统工程理论与实践. 2003 8 , 8 -

15.

[ 10 ] 魏一鸣等. 基于神经网络的多目标权重计算方法探讨 [ J ]. 武汉化工学院学报 , 1995, 17 ( 4) : 37 - 41. [ 11 ] 梁杰 ,侯志伟. AH P法专家调查法与神经网络相结合的综合定权方法 [ J ]. 系统工程理论与实践. 2001,

( ) 21 3 : 59 - 63

[ 12 ] 马振华. 现代应用数学手册 :运筹学与最优化理论卷 [M ]. 北京 :清华大学出版社 , 1998: 307 - 370. [ 13 ] 飞思科技产品研发中心. MA TLAB615 辅助优化计算与设计 [M ]. 北京 : 电子工业出版社. 2003: 156 -

185.

[ 14 ] 阎平凡 ,张长水. 人工神经网络与模拟进化计算 [M ]. 北京 :清华大学出版社 , 2000.

范文四：基于熵最大原理的流体性质定量识别方法研究

基于熵最大原理的流体性质定量识别方法

研究

2008年第12期内蒙古石油化工75

基于熵最大原理的流体性质定量识别方法研究

黄毅,冉志兵,陶俊,张毅.

(1.西南石油大学测井实验室;2.川r庆钻探工程公司测井公司解释中心;3.中国地质大学)

摘要:针对目前测井流体性质定量识别的灰色聚类分析方法中存在的评价结果分辨率较低等问

题,利用信息论~Jaynes最大信息熵原理',提出了一种新的测井流体性质识别模型.充分利用测井和

试油资料,对江苏油田兴庄地区进行的熵计算分析,正判率达~'185以上.该模型不仅数学推导严谨,科

学合理,而且结果的分辨率,灵敏度以及评价的可靠性都大大提高. 关键词:关联系数;信息熵;流体识别;测井;灰色聚类法

引言

地下储层油藏分布系统是一个具有模糊性的灰

色系统.地下储集体的隐蔽性与非均质性),造成测

井解释对地下特性的分析与还原能力,即取决于解

释方法及其软件的完备性,同时在很大程度上取决

于测井分析家的经验,技能与判断力.近几十年来测

井分析家们对地下流体性质的定性和定量识别方法

研究一直都没有停止过,但是各种评价方法均有其

优点和缺陷.例如较早出现的测井模糊聚类分析法,

其虽然注意到流体性质分界线的模糊性,而且各种

测井信息的利用率和精度都较高,但是评价结果的

分辨率很低,有时甚至出现对流体性质的误判.而本

文正是在灰色评价的基础上,引入当今信息论中最大熵原理,提出一种新的测井流体性质定量评价模型,它不仅具有灰色聚类评价方法的优点,而且考虑了随机性所带来的不确定性影响,模型的分辨率和可靠性都很大的提高.

1流体性质灰色评价的熵模型

"熵"(entropy)是德国物理学家克劳修斯

(RudolfClausius,1822"--1888)在1850年创造的一个术语,他用它来表示任何一种能量在空间中分布的均匀程度.能量分布得越均匀,熵就越大.在现代信息论中,熵表示的是不确定性的量度.如果对于我们所考虑的那个系统来说,能量完全均匀地分布,那么,这个系统的熵就达到最大值.

设有m项评价指标的n个测井信息样本组成参考数列:

xi一{Xj(i)li一1,2,…,m;j一1,2,…,n) 以及由流体性质测井评价标准组成的比较数列:

Xh={Xh(i)lh一1,2,…,t,j一1,2,…,m)?h(i) 一

lXi(i)一Xh(i)l(1)

则Xj与X第i个指标的差异用灰色关联系数 (xi,Xh)表示为:

xj,一AhmaxAh(i)+

pmx(i)

(2)

式中咏n?h(i)称为两极最小差,其中畸n' Ah(i)的为第一级最小差.它表示在X曲线上,各相应各点与Xi各相应点距离的最小值;nnAh(i)

表示在各曲线找出的最小差的基础上,再按h一1, 2,…,t找出所有曲线中最小差的最小值.称x mxAh(i)为两极最大差,其意义与两极最小差类似.9(0<9<1)称为分辨系数一般取p=0.5时具有较高的分辨率.

由于关联系数过多,信息分散,不便于比较,为此,将其集中在一起得到关联度.且通常由指标权重来反映各指标的重要程度不同.

设备指标的权重分别为co,co,…,co,且满足条件:

?一1O?(1)i?1(3)

则关联度计算公式为:

rh(xi,Xh)一??i(xi,Xh)(4) 将样本j与第h级标准间的相似程度用以样本与各标准的差异度j为权的加权广义距离来表示, 即:

收稿日期:2008一Ol—l2

作者简介:黄毅(1982一),男,湖北利川人,西南石油大学在读硕士研究生,主要从事

地球物理及测井解释及方法研究.

76内蒙古石油化工2008年第12期

d(xj,xO—uhjI??.(xj,xOI

d(Xi,Xh)一ihiJ

吒n?h(i)+Prn~xmaxAh(i)—

(5)

(6)

由于测井曲线特征值选取统计的波动性以及油,气,水流体性质判别本身具有的模糊性,j的确定具有不确定性.为了描述这种不确定性,可将j理

解为第j个样本属于第h级流体性质的"概率".这样不确定性可用信息熵表示:

Hj一一;hjln/-thi(7)

h=l

;hj一1hj>io,j一1,2,…,n(8)

流体性质判别的目的,就是要按照纯油,气,水在各种测井曲线上的测井响应特征值来确定一个合理的油,气,水分级判别标准(即:"概率"分配),一方面使全体样本与各级水质标准之间的广义距离之和最小,即:

mind=:I;;hj(t)i?.(xi,Xh)I(9) S.t.?hj=1,j一1,2,…,n(10)

另一方而,应消除由于随机性和不确定性的影响.根据Jaynes最大熵原理,在一定的约束条件下, 使系统信息熵最大的分布就是使离差最小的"最佳" 分布.即:

maxH=;(一互hjin~thj)(11)l=In=1 S.t.?hi一1,uhi?0,j一1,2,…,n(12) 因此,求最优分级即是一个双目标优化问题构造复合目标函数:

minlI至乏uhj兰??i(Xi~Xh)I+吉至?1nhjh=IIJ—h=1I=1Ul=

(13)

S.t.?hj=1,uhj?0,j一1,2,…,FI(14) 其中,正参数B用来对两个目标进行平衡,可根据实际问题本身预先给定.

根据式(13)构造拉格郎日函数:

L(hj,)一;{hj(;(t).?.(xj,xh)+"~/lhjln/lhj)一I—H一1i=1D (?一1)(15)

式中:为拉格郎日乘数.分别对变量,j求偏

导数.并令其为0,有: 'L

广1=.(16) 豢一m+吉(1n+1)一由式(17)得

hj===expI—iB— Y

(tJi?_+BX一1I 代入(16)式得

(17)

(18)

exp(一(1一BX)3:1/<

一

xp(一B

)](19)

代回(18)式得

hj—exp(一BY.,~i3/Y.exp(一B?蛐?.))(2O)

式(2O)即为基于熵极大原理的测井流体性质定量识别的灰色评价模型,待评价样本应归入j为最小所对应的级别.

2应用实例分析

根据上述原理,我们建立了应用该方法判别储层流体性质的判别流程如下:

{,{

L=二__二二_二=__——-.

L…I…

厂_一一…一,l妻?

;一,

I..............————,——一——一——一 .一一...''.'.'一…一'.——__1

L._j

图1基于最大熵的流体灰色判别方法流程图根据上面流程,我们选择了江苏油田兴庄地区 21口井3O个试油层的声波(AC),深电阻率(ILD), 孔隙度(POR)和电阻率增大系数(I)四种测井响应特征值作为该区流体性质判别标准(表1). 表1流体性质判别标准选取

根据标准样本采用上述方法对该区随机抽取了 15个待判样本进行了流体类型判别(表2),判别结果与灰色聚类分析法判别结果进行对比,熵流体识别法正判13个,误判2个,正判率达86.7(表3),总

体来看熵识别方法的判别效果良好.

2008年第12期黄毅等基于熵最大原理的流体性质定量识别方法研究77

表2测井响应原始特征值

表3信息熵识别评价结果

将表2与表3进行对比分析,可以看出第6和12 个样本点判别失误.其中第6个样本点试油结论为油水同层,判别结论为油层.第12个样本点试油结论为水层,判别结论为油水同层.判别失误的主要原因是由于这两点的测井响应特征值的浮动与油层, 油水同层和水层的判别界线附近,造成待判样本和标准样本的差异度会因某一指标的变化而发生误判.5]

3结论

本文提出的基于熵极大原理的流体识别灰色评价模型.,具有物理概念清晰,数学推导严谨,科学合理,计算简便实用,可信度高等特点,克服了其他方法评价分辨率低的缺点.引用信息熵理论.巧妙地将熵函数引入目标函数,既消除了随机性的影响, 使信息的利用率及结果的可靠性均有较大提高可在流体性质识别中推广使用也适用于其他领域如钻井评价等.该方法需要注意的两点是:

?测井原始数据特征值的选取的精确性直接影响到该样本熵判别分析的结果.

?测井流体性质标准样本特征值的精确选取. ?测井信息的多元化,不能仅仅依靠少数的几条测井曲线的识别结果而匆忙得出结论,除需要多选取其他测井信息放入判别标准外,还应结合录井, 地质和测井新技术进行相互印证,以提高识别精度.

[参考文献]

[1]郑成德等.水环境质量评价的灰色聚类法[J].

水文,1998,4:23—27.

[2]JaynesET.InformationTheoryandStatisti一

[3-1

[4]

[5]

[6]

calMechanics[J].hyRew.1957,106:620—

630.

邓聚龙,灰色系统[M].北京:国防工业出版

社,1985.

张辉,高德利.熵权模糊综合评价模型及其在

钻井技术评价中的应用.江汉石油学院院报,

2004,26(2):107—111.

刘艳,吴文玲等.基于熵权的属性识别水质评

价模型.人民黄河,2005,27(7):18—20.

张超谟,雍世和.测井资料处理与综合解释.石

油工业出版社,1996.

ResearchonMethodofQuantitativeIdentificationtoFluidPropertyBasedontheMaximum

EntropyTheory

HUANGYi,RANZ^——6,zg.,TAOJun.,ZHANGYi.

(1.SouthwestPetroleumUniversitywelllogginglaboratory; 2.ChuanQingExplorationDrillingCompany;3.ChinaGeologyUniversity) Abstract:Thesystemofquantitativeidentificationtofluidpropertyinwellloggingisagreysy

stem

duetoit'Spartiallyuncertainties.Thereexistseveralmethodsfortheassessmentoffluidprope

rty,i.e.

thefuzzymathematicalapproachandgreyclusteringmethod.However,theresolutionsarelo

winthere—

suhsofthepresentmethods.BasedontheJaynesmaximumentropytheory,weuseanewmodeltoquan—

titativelyidentifythefluidpropertyinthispaper.AcasestudyisgivenbyusingthismodelinJiangSuoil

field.Theresultsshowthatthemodelestablishedinthispaperisnotonlystrictlyderived,butalsohas

higherresolutionandsensitivityandreliability.

KeyWords:CoefficientofCorrelation;Entropy;Fluididentification;Welllogging;GreyClustering

范文五：最大熵原理的证明

证明：当函数概率为均匀分布时，取得最大的熵值。证明：设随机变量X可能取值为x1,x2，...xn，取相应的值对应的概率

为p1,p2,...pn。

我们知道H(x)???pilnpi；此时e为熵的单位。

i?1n

还有?pi?1?0；

i?1n

利用拉格朗日乘子法我们可以构造函数：

G(p1,p2...pn,?)???pilnpi??(?pi?1);

i?1i?1nn

分别对pi和λ求导，并令其为0。我们可以得到： ?G/?pi??lnpi?1???0，i=1,2,3...n； ?pi?1?0；

i?1n

由?lnpi?1???0；可以得到pi?exp(??1)，i=1,2,3...n；由此得知：p1?p2?...?pn?1/n；得证。

此时相应的熵为H(X)?lnn;

转载请注明出处范文大全网 » 基于最大熵原理方法的洪水预报