一种基于SVM特征选择的油气预测方法.pdf
文本预览下载声明
天然气工业 2004年7月
一种基于SVM特征选择的油气预测方法*
姚凯丰1 陆文凯1 丁文龙1 张善文2 肖焕钦2 李衍达1
(1.清华大学自动化系智能技术与系统国家重点实验室2.中国石化胜利油田有限公司)
姚凯丰等.一种基于SVM特征选择的油气预测方法.天然气工业,2004;24(7):36~38
摘要支持向量机(SVM)是近年来发展起来的一种通用的机器学习方法,在许多分类问题和函数拟合问题
上都已获得了很好的效果。对于少量样本的分类问题,SVM具有调节参数较少,运算速度快等优点。通过地震、
测井等信息进行油气预测是一种典型的非线性分类器设计问题,它具有已知样本数较少、特征个数较少等特点,文
章据此提出了一种基于特征扩展和特征选择的改进SVM方法。该方法将原始特征通过非线性变换到高维空间,
然后应用线性SVM进行特征选择,并同时计算降维过程中各个特征子集对应的留一法错误率,最后选择错误率较
小的特征子集来设计线性SVM分类器。在通用数据的实验中,这种方法仅仅用较为简单的多项式核函数就大大
提高了分类器的泛化能力。与传统的模糊数学方法、神经网络方法和SVM方法相比,这种方法在四川观音场构造
的碳酸岩盐储层数据的预测误差降低了50%,是一种有效的油气预测方法。
主题词 向量计算机地震数据处理 油气藏 预测 观音场气田
Vapink从统计学习理论的角度出发,提出了支种地震信息与含油气之间的模糊隶属函数,再根据
vector
持向量机(supportmachine,SVM)方法n1。这些函数关系来预测油气聚集程度。神经网络的方
SVM已经广泛地应用在分类和函数回归等问题,并法应用在油气预测领域同样也容易遇到在其它领域
且取得了较好的效果n~33。针对油气预测这种有监一样的困难,例如如何确定神经网络的结构,如何选
督的分类问题,SVM比神经网络等传统的学习方法择训练参数来控制过学习情况等等。与神经网络相
具有以下几个特点和优点n~31:①它综合考虑了分似,SVM在进行分类器设计时也需要确定核函数K
类器的经验风险和置信风险,在一定概率意义下是 (类似于神经网络的结构)和控制经验风险和置信风
推广能力最好的分类器。这种结构风险最小化的设 险之间的折衷参数C。目前,一些SVM软件可以根
计思路可以避免陷入欠学习和过学习等情况。②它 据样本信息提供参考的C参数。3,并且对于大多数
有全局最优解,不会陷入局部最优。③它利用核函 分类问题,应用不同的核函数基本能取得相差无几
数的方法解决了非线性的分类问题,其算法复杂程 的效果n’33。本文中SVM特征扩展和特征选择的方
度主要取决于训练样本的个数,而与特征维数基本 法则进一步简化了核函数的选择。从理论和实验的
无关。 角度均证明它的推广能力要比传统SVM有所提高。
油气预测需要综合少数的测井信息和和大范围 由于油气预测问题一般是小样本学习问题,加之近
地区的地震信息来预测整个地区储集层的含油气状
况。这是一个典型的有监督分类问题,其特殊性在 本文提出的预测方法计算量很小。
于样本(井)数量较少,并且地震特征也不能完全体
SVM和改进的SVM算法
现油气聚集的情况。先前的研究主要侧重于两种方
法,一种是模糊数学的方法“3,一种是神经网络的方 假设d维空间的N个两类样本的特征分别是
法。~63。模糊数学的方法需要事先通过经验建立各
启动金资助项目资助。
作者简介:姚凯丰,1976年生,清华大学自动化系在读博士;主要从事机器学习方法和应用及地震信息处理研究。地址:
· 36·
万方数据
第24卷第7期 天然气工业
N)。SVM采用类边缘最大化准则来选择分类面。误率;②计算权重W;③剔除权重较小的一个或几个
对于线性不可分的情况,用带有错分惩罚的“软边 特征;④如果还有特征,则转到①,否则结束。
缘”来代替边缘,并且以常数C来控制惩罚程度。这 这个特征选择的过程最终给出留一法错误率随
个优化问题可以变换为一个N维空间的受约束的
显示全部