前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇分别的诗句范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
朋友是寒冬里角落处的一盆绿萝,不张扬,却用生命点缀着你人生的寂寞萧索;朋友是炎夏时于悄然间送来的一丝凉风,去掉人生的那份狂躁与焦灼;朋友是春日里杨柳岸的酒醒何处,得意时同尽欢,失意时共蹉跎;朋友是是秋日里的累累丰硕,喜人的果实结满了人生的枝柯……
前些时日,因生存,因家庭,因周围所有一切的一切,我感觉自己好累好累,每天最多睡眠三个小时,凌晨三点醒来后就再无法入眠,望着黑洞洞的窗外,心里一片凄凉空寂,似无数的蚂蚁在咬噬着心,那种感觉真的很痛楚无耐。想到伤心处,泪就会喷涌而出,枕畔大片的润湿。头发大把大把的掉,丰腴的身子一下清瘦了许多,眼下罩着一圈淡淡的晕黑,还出现了细细的纹。好悲凉无耐!
一个微雾的傍晚,突然接到远方朋友的来电:“听人说最近你消瘦了许多?遇到什么不顺心的事情了,告诉我!”闻此言,我无语,只是任由泪顺着脸颊往下流淌。压在我肩上的担子太重太重了,我亦无能力承受,我好想崩溃,却连一个能聆听我心声的人都找不到。我好想有一个能让我心灵小憩的驿站,他(她)不需要替我做什么,只要静静地,用心地,听我哭着倾诉就行了。此时我想做的只是倾诉,他(她)能帮我的,只是聆听,静静地聆听……
听着他毫不客气,甚至有点半命令式不容置疑的“告诉我!”泪倾刻间淹没了裂的心田,我如小女孩般嘤嘤唔唔哭诉起来,他听着,只是听着,渐渐地,我感觉到了他哽咽的声音“你为何不早点告诉我?”是啊,我为何不告诉他?因为他是朋友啊,我不想让他为我难过!那万般委屈的哭诉过后,我早早的睡下,一觉无梦到天亮!
“最近还好吗?工作累不累?一定要注意身体!按时吃饭,不能熬夜……”朋友的问候与叮嘱,无论何时感觉都是那么温暖,特别是在不如意的时候,更能从这份“叨叨”中感到暧意,这些流淌在语言中的“叨叨”如涓涓细流,会温暖自己一生。
朋友,让你感受到自然界的鸟鸣虫吟,溪水潺潺,呼啸的风声,芬芳的花草,以及天地间无数的良辰美景。
朋友不是酒桌上的“请请请”与“喝喝喝”,朋友不是富在深山的有客访;朋友决不是明的或暗的商品,以官位的高低、权力的大小、财富的多少来定论。
朋友不必是锦衣华服,富甲一方者。正如花有色、香、味一般,朋友亦是各不相同。朋友不必张嘴就“黑格尔”或“之乎者也”。他们可以是豪爽的侠客,可以是腹藏锦绣的学者,可以是白丁布衣。但他们必须有一个共同点——一颗善良的心,一幅敢于担当的肩膀。在你获得成功的时候,为你高兴,而不是捧场。在你遇到不幸或悲伤的时候,会给你及时的支持和鼓励,而决不会袖手旁手旁观,或落井下石。朋友当以人格为重,决不能惟利是图,且品格高贵、情操高尚。只要他们拥有一颗善良质朴的心,他们就是高贵的,优雅的,出色的。
每一个朋友就是一幅精美的图画,每一次壮丽的日落,每一处优美的风景,每一片灿烂的鲜花……朋友,给予人以彩虹般的美丽世界,使人终生享受快乐。
其实与朋友交往,只要没有抱着某种目的或欲望,简单到只需要用自己一颗心细细品味友情的味道,友情自然会芳香馥郁的萦绕在你我身旁。朋友就是生命中最重要的一座无息却利润丰厚的银行,它存储着难能可的贵的友情。
[关键词]信息安全;数据识别;油田企业
doi:10.3969/j.issn.1673 - 0194.2016.14.108
[中图分类号]G203 [文献标识码]A [文章编号]1673-0194(2016)14-0-01
1 油田工业环境中的数据特征分析
在工业生产工作环境中,数据主要来源于管理和工业生产两个领域。管理领域的数据相对而言比较常规化,主要涉及人力资源等相关管理领域工作数据,但是随着科技的不断深入发展,大量生产流程中的设备状态数据纳入到企业数据环境之中,而这种趋势,在油田工业领域中更是尤为突出。油田生产工作过程中一贯以数据的庞大繁杂著称,数据用以反映生产过程中众多设备的状态。通过这些数据可以判断整个工作过程的安全水平,然后展开进一步的调整。
随着物联网相关技术的发展,更多的数据纳入油田工业环境之中,实时性和海量性成为其主要特征。对于实时性而言,油田工业环境之中,生产过程中的数据关系到诸多设备的工作状态及安全水平,因此,只有对其展开及时的识别才能妥善处置。而对于海量性而言,主要是考虑到油田工业领域中必然会引入的大数据技术,从客观上要求对这些数据展开及时的深入分析,发挥其既有价值。因此从这样的两个方面看,对数据展开必要的识别,是有效针对不同种类来源的数据展开及时分析的必然要求。
与此同时,从安全的角度看,数据识别同样意义重大。当前数据安全的解决方案,通常会从传输和存储两个方面展开,即在传输过程中通过各种类型的网关等来对传输数据实现过滤,或者面向存储状态的数据展开分析,来确定数据中是否夹杂有不安全的因素。此种安全分析工作方式在传统企业环境下,当数据量以及传输总量相对较少的时候能够十分有效地展开工作,但是随着数据量的不断增加,流媒体数据也开始涌入到工业生产环境之中,想要切实有效地对所有的数据展开分析,就显得较为困难。相关安全系统的计算能力不断得到挑战,必须采取必要的措施改善此种情况。
在这样的背景之下,如何实现有效的数据识别,就显得意义重大。良好的数据识别体系,能够帮助安全系统以及相关的大数据技术依据不同的数据特征展开区分,从而来决定为不同的数据群体提供不同安全级别的保障,也便于为大数据分析系统优化其数据材料,并且在最短时间内响应不同数据消费端的查询请求。
2 推动数据识别体系建设
数据识别服务于整个油田数据系统。数据识别工作展开的有效性,关系到整个企业局域网数据的安全水平,对于其他多个方面的数据信息处理工作也有不容忽视的重要价值。从目前数据识别技术的发展状况看,主要是基于数据特征的识别技术,但是随着工业环境中更多数据的涌入,基于数据生命周期的识别技术同样也是未来发展的主要特征。
对于基于特征的数据识别方法而言,具体包括两个阶段的工作,第一,元数据和样本数据的采集;第二,敏感数据数据的识别与分类。
在第一个阶段中,数据识别系统的主要工作任务是通过自动化的方式面向数据库、文件系统及传输过程展开对于数据的结构化与非结构化数据样本和元数据信息的采集。采集主要内容包括元数据信息(数据表和字段的名称、类型、注释信息等)、文件类型数据(在获取文件格式的基础上,采用自动化分词等相关技术将文件内容进行切割和合并,并且建立起对应的文件特征数据)。然后在这样的采集基础之上,对获取到的数据进行梳理和过滤,提升样本整体质量。
在第二阶段中,展开对于敏感数据数据的识别与分类。应用数据识别技术,对不同类型的数据进行甄别,确定其中的敏感数据,并对其进行甄别和分级分类,从而便于进行更具有针对性的数据安全保护工作。这一部分的工作,具体包括词库建立、敏感特征提取、敏感特征匹配以及敏感数据识别质量评估等几个方面。其中词库建立主要是对采集到的数据进行收集和整理,剔除其中的无价值词汇,获取到符合识别需求的词库。而敏感特征提取,则是在建立起词库的基础之上,对词库展开分析和识别,以相关人员作为主要的力量进行构建,并且随着人工智能的发展,相关技术也在逐步引入到该环节之中。敏感特征匹配主要是对分类和识别目标展开特征提炼,将目标数据采用分词技术进行分词处理,然后进一步将提取到的特征与词库进行匹配,依据匹配情况进行排序。最后,敏感数据识别质量评估主要对识别结果进行评价,包括对错误分类的进一步纠正和对于未能识别的敏感词的补充,完善词库。
除此以外,基于生命周期的数据识别也是未来发展的一个重要方向,同样不容忽视。这主要是考虑到数据从诞生到消亡,不同的数据在不同的生命阶段中会呈现出不同的安全需求,并且数据在不同环境下面对的人群不同所产生的功能和价值,也均会有所不同。从油田工业环境的角度看,实时性强的数据随着时间的流逝,其安全价值呈现出逐步递减的趋势,而核心技术领域的数据,通常需要自始至终的密切保护。因此,对于数据产生环境和来源等方面特征的识别,能够进一步提升数据安全工作的针对性,提高数据安全体系工作整体效率。
3 结 语
在面临油田大数据环境时,数据识别技术是不容忽视的重要支持。只有在实际工作中不断深入分析和完善对应的识别规则,才能获取良好效果,为油田的发展奠定坚实基础。
[关键词]识别小句;标记;价值;归一性;情态
Abstract:Token and value are two important yet confusing concepts in the relational process. However,they are far from being clarified so far by scholars home and abroad when they are expounding the two concepts. This paper first discusses the rationale behind the pision of token and value in English identifying clauses,then summarizes the ways to determine which entity is token and which is value,and finally points out that identifying clauses are not confined to positive onesthey can be combined with polarity modality,but polarity modality plays no role in identifying token and value.
Key words:identifying clause;token;value;polarity;modality
关系过程(relational process)是及物性系统中的一个重要过程,在传统语法中讨论得较少[1]。作为关系过程的两个重要概念,标记(token)和价值(value)也越来越受到功能语法学家的重视,韩礼德在1985年版的《功能语法入门》中虽然进行了介绍,但是并没有专门辟出小节,而在1994和2003年的版本中,却用专门的小节来进行详细阐述。对标记和价值概念,国内学者虽有介绍和研究,但也只是引述韩礼德等学者的论述,仍然有不清楚之处。因此,探究标记和价值概念划分的理据,总结标记和价值的确定方法,指出韩礼德等有关标记价值论述的不足,是很有必要的。
一、标记价值划分的理据
在阐述标记价值划分的理据之前,我们必须首先了解关系小句的两种类别,亦即归属类小句和识别类小句。韩礼德指出:“在关系小句中,‘存在’具有两个部分:某一事物被说成是另一事物。”[2]119“归属类指某个实体具有哪些属性,或者归于哪种类型,其公式是‘a是x的一种’。”比如(1)Carlos is a poet. (2)Maggie looks happy.(3)The cat is on the mat. (4)He has a Toyota.[3]79识别类则是指某一实体的身份通过另一实体得到确定,或者两个实体在时间、地点、状态等环境意义上具有一定的联系,或者某一实体拥有另一实体,比如(1)Sarah is the wise one. (2)Tomorrow is the tenth. (3)Peter owns the piano.在归属类关系小句中,两个参与者(participant)是一与多之间的关系,而在识别类关系小句中,参与者之间则是一对一的关系。不过这两类小句之间的差别不是绝对的,有些识别小句位于中央,比如Pat is the richest相对于归属小句Pat is rich和识别小句The richest is Pat(注:我们同意韩礼德关于有些识别小句位于归属小句和其他识别小句之间的观点,不过我们认为这是由于rich这类表示属性的词汇的抽象性造成的。这类词在形式上具有唯一性,但是实际上却往往不具有唯一性,所以the richest往往会用来表示the very rich class。我们不同意韩礼德把Pat is one of the richest people I know看作是识别小句。),处在两者中央。
识别小句就是用某一实体去确定另一实体的身份,两实体指向同一事物,其中用来识别另一实体的叫做识别者(identifier),而被识别的实体叫做被识别者(identified)。识别小句不是同义重复,因此两实体必须不同。从事物的本质来看,我们在判别事物时,无外乎从两个方面进行判别:一是从外形上进行判别,一是从性质或功能上进行判别。韩礼德等把前者称为标记,把后者称为价值,认为两者之间的差别是“形式与功能之间的差别”[2]124。何伟在引述Thompson时说,标记和价值的划分“是以人们对经验世界的认识为前提的,概括或抽象的内容是价值,其具体体现是标记”[4]。换句话说,标记是看得见的,价值是看不见的、抽象的,包含着判断等。何伟认为,“从实质上讲,价值披露了说话者或写作者在评价标记时用的是什么‘价值标准’,这在一定程度上也反映了他所处的那种文化在度量事物时的‘价值取向’。”[4]不过我们从经验世界中也知道,我们所经验着的世界并不都是由具体事物构成,我们的经验世界离不开抽象。这时候标记和价值之间的差别就不是具体和抽象之间的差别,而是抽象与更抽象之间的差别。所以,韩礼德在1985年版的《功能语法入门》指出,标记是指“符号、名称、形式、执行者、所有者”,而价值则是指“意义、指称、功能、职能、身份”。胡壮麟等认为“标记指的是外表、符号、形式和名称;价值指的是实质、意义、智能和身份”[3]81。
由此可见,标记和价值的划分最初是基于有形事物的,然后推及无形抽象的事物。因此,在识别抽象事物时,唯有用抽象程度不同的两个实体进行彼此识别。
二、确定标记和价值的方法
何伟在《英语识别小句中的“标记价值”结构配置之研究》一文中指出,对标记和价值进行分析“可以使我们领会说话者或写作者所关心的事情或其‘价值观’”[4]。标记价值结构在某些语域(比如科技、商业、政治问题以及官样文章)起着举足轻重的作用,因此在及物性系统中也最重要。然而区分标记和价值却并非易事,就像韩礼德本人指出的那样,“在整个及物系统中,标记价值结构可能是最难接受的”[2]126。也正因为如此,韩礼德才作出了详细的解释,归纳起来主要有以下几点:
1.如果是主动语态,则小句主语就是标记;反之,如果是被动语态,则主语就是价值。比如:
(1)The daughter resembles the mother. [Tk^Vl]
(2)The mother is resembled by the daughter. [Vl^Tk]
2.在主位等式(thematic equative)中,名词短语总是价值。比如:
(3)What it tells you is the strength of the signal. [Vl^Tk]
(4)This is what we’re going to do. [Tk^Vl]
3.具体的、看得见的为标记,抽象的、看不见的为价值。换句话说,凡“符号、名称、形式、执行者、所有者”都是标记;凡“意义、指称、功能、职能、身份”都是价值。比如:
(5)Fred is the tall one. [Vl^Tk]
(6)Fred is the treasurer. [Tk^Vl]
不过当动词是be时,却不容易判断识别小句呈现的究竟是主动语态还是被动语态,比如:
(7)This offer is your best chance to win a prize. [Tk^Vl]
(8)One criterion is that of genetic persity. [Vl^Tk]
鉴于此,韩礼德提出用其他动词如represent、play等来替换be,倘若小句呈现主动语态,则主语为标记,否则为价值。比如,上述两个例句可以分别替换为:
(9)This offer represents your best chance to win a prize.
(10)One criterion is represented by genetic persity.
在一定语境下,标记和价值都是很明确的,即使发生误解,最后也能得到纠正。请看韩礼德在《功能语法入门》中所举的例子[2]127:
(11) A. So the best students are the greatest worriers,is that it?
B. Oh,I don’t think there’s any virtue in worrying,is there?
A. No,I didn’t mean is it because they worry that they get to be the best. I meant is it because they’re the best students that they worry.
在这个例子中,A本意是说“好学生因为‘好’,所以才焦虑”,因此the best students是标记,the greatest worriers是价值;换句话说,这句话可以用“The best students represent the great worriers.”来表示。B把这句话理解成“因为焦虑,所以才好”,这样the best students就成了价值,而the greatest worriers则成了标记;换句话说,这句话可以用“The best students are represented by the great worriers.”来表示。那么B为什么会误解,或者说“The best students are the greatest worriers.”为什么会有歧义呢?我们认为这是由于good和great这类词造成的。这类词比较抽象,一般用于价值判断,往往和后接的名词一起构成标记价值结构中的价值。当使用者把这类词当成和red、green一样,进行客观描述而不是进行判断时,就会出现在标记中。然而究竟何时是判断,何时是客观描述,脱离了语境往往很难判定。韩礼德在《功能语法入门》中所举的两个例子[2]128:
(12)My brother is the tallest one in the family. [Tk^Vl]
(13)My brother is the tallest one in the picture. [Vl^Tk]
只会让读者更加困惑:为什么仅仅一字之差,价值就变成了标记了呢?韩礼德对例(12)的解释是:只有一个成员的类别成为了价值,而这个成员被看作是标记。这样的解释用他自己的话来说,是“难以接受的(difficult to come to terms with)”[2]127。其实,我们换种思考方式,就不难理解了。“我”在使用这两个句子时,my brother都是不在场的,否则我只要说“This is my brother.”或“That is my brother.”就行了。在使用例(13)时,肯定有一张照片在现场,这时候my brother是“看得见的”,所以the tallest one in the picture是标记就没有任何疑问。“我”在使用例(12)时,“我的家人”是不在场的,是看不见的,tallest指向的是性质,而非特征,因此the tallest one in the family是价值而非标记。实际上,倘若我们把例(12)、(13)看作是答案,构建出相对应的问题,这一切就更清楚了。
(12a)Who is the tallest one in your family? My brother is the tallest one in the family.
(13b)Which is your brother? My brother is the tallest one in the picture.
我们再用替代法来验证一下,那么例(12)和(13)就可以分别表述为“My brother represents the tallest one in the family.”和“My brother is represented by the tallest one in the picture.”这样,通过综合考虑,就不难判定哪一个实体是标记,哪一个是价值。
三、韩礼德等有关标记价值论述之不足
功能语言学派对标记和价值概念虽然越来越重视,但是从目前的研究成果来看,对标记价值结构的论述仍然存在不足,其主要表现在与功能语法的另一对概念归一性情态的脱节。目前所见到的有关标记价值结构的论述主要是肯定的(注:韩礼德在1994年版的《功能语法入门》第122页和127页提供了两个和情态有关的例句:The one in the back row must be you及A solid phase could be represented by condensates of the nuclear fluid,但是没有展开。),这和语言的实际使用情况不相符。我们从归一性和情态这对概念中不难发现,语言使用是一个连续体,一端是肯定,另一端是否定,中间部分被情态占据。识别小句并不例外,也必须遵守这一规律。目前对标记价值结构的论述偏向于肯定一端,所以是不全面而有所偏颇的。从1994年版的《功能语法入门》第123页所列出的在识别小句中经常出现的动词中,随机挑选出consist,imply,constitute和mean几个词,利用Google搜索引擎,进行了搜索,得到的结果验证了上述观点。
(一)归一性与标记价值结构
由于现有文献中有关标记价值结构的论述皆涉及肯定句,所以我们此处仅列出否定句。
(14)It does not constitute either a sect or a school of thought,but is rather a spiritual or transcendental practice which persists despite criticism from orthodox theologians. [Tk^Vl]
(15)Moreover,mainstreaming:‘does not mean simply making Community programmes or resources more accessible to women,but rather the simultaneous mobilisation of legal instruments,financial resources and the Community’s analytical and organisational capacities in order to introduce in all areas the desire to build balanced relationships between women and men.’ [Tk^Vl]
(16)Dignity does not consist in possessing honors,but in deserving them. [Tk^Vl]
(17)Life does not consist mainly,or even largely,of facts and happenings. [Tk^Vl]
(二)情态与标记价值结构
(18)The brighter areas seem to consist of similar but even more weathered and oxidized material that apparently contains more fine,dust size particles than do the dark regions.[Tk^Vl]
(19)These remnant polar caps are believed to consist mostly of frozen water. [Tk^Vl]
(20)The core is believed to consist of mostly metallic iron and nickel. [Tk^Vl]
(21)New bar codes might mean good news,or inconvenience. [Tk^Vl]
(22)The discovery could imply that evolution of brain structures linked to speech began before the ancestors of humans and apes parted ways. [Tk^Vl]
(三)归一性情态与标记价值结构
(23)These postings may not consist of or contain software viruses,political campaigning,commercial solicitation or any form of “spam.” [Tk^Vl]
(24)Failure to meet these requests will not constitute cause for adjustment,refund or rerun. [Tk^Vl]
值得注意的是,当情态与标记价值结构结合时,情态动词表现出的语态不作为判断标记和价值的标准。这里所说的情态动词的语态是指believe,think这类用来表示情态的动词的时态,如在例(20)中,不因为is believed to是被动语态,而认为the core 是价值。事实上,我们可以把be believed to,be thought to等看成和will、can等情态动词一样。另外,归一性也不影响标记和价值的判别。
识别小句中的标记和价值概念是功能语法中一对重要而难以理解的概念,标记和价值的划分是基于事物本身的特点,前者是事物的外在表现,是形式,包括“符号、名称、形式、执行者、所有者”;后者是事物的本性,是功能,包括“意义、指称、功能、职能、身份”。分析标记价值结构可以使读者领会说话者的真实意图,领会其所作出的价值判断,从而领会其价值观。判别标记与价值有一定的规律,但是当两个实体都很抽象时,有时往往很难判断,需要进行综合考虑。
识别小句并不例外于归一性和情态所构筑成的连续体,所以识别小句不仅仅包括肯定句,也包括否定句,而与情态结合的识别小句位于两者之间。情态动词本身并不影响标记和价值的判别规律,其中也包括be believed to和be thought to这类情态动词。因此,当接续在情态动词后面的动词呈现主动语态时,主语即标记,反之则是价值。
[参考文献]
[1]袁 鑫.论英语识别小句中的标记价值关系的双向性[J].天津外国语学院学报,2004(6):56-59.
[2]Halliday,M A K. An Introduction to Functional Grammar[M].London :Arnold,1994.
关键词:高分辨距离像; 支持向量机; 高斯核函数; 广义高斯分布
中图分类号:TN957.52文献标识码:A
文章编号:1004-373X(2010)15-0001-04
Target Recognition Algorithm of Radar High Resolution Range Profile
Based on Improved Gaussian Kernel Function
ZHAO Nai-jie, LI Hui,JIN Bao-long
(Department of Electronic Engineering, Northwestern Polytechnical University, Xi’an 710129, China)
Abstract: Aiming at kernel function selection of support vector machine(SVM), the method to determine Gaussian distribution of the data is introduced by analyzing feature of data distribution based on the proposed conformal transformation method. A target recognition algorithm of radar high resolution range profile based on improved Gaussian kernel function is proposed by using Gaussian kernel function of support vector machine. The method improved SVM Gaussian kernel function and carried out the kernel function selection. Through comparing the improved Gaussian kernel function with the polynomial kernel functions, two methods are used to simulate high resolution range profile in the Matlab environment, the simulation method validate the effectiveness of Gaussian kernel function.
Keywords: high range resolution profile;SVM;Gaussian kernel function; generalized Gaussian distribution
0 引 言
传统模式识别方法都是在样本数目足够多的前提下进行研究的,所提出的各种方法只有在样本数趋于无穷大时其性能才能有理论上的保证。然而在许多实际应用中样本数目通常是有限的,如何在有限样本情况下使得到的分类器能够具有较好的分类性能和泛化性能,支持向量机(Support Vector Machine,SVM)的出现为解决这一问题提供了新思路。
SVM是20世纪90年代由Vapnik等人提出的┮恢知新的学习机[1],它拥有较好的推广能力和非线性处理能力,尤其在处理高维数据时,可有效地解决“维数灾难”问题,在人脸检测、网页分类、数据融合、函数估计等领域得到了广泛应用[2]。由于SVM 是一种基于核的机器学习方法,核函数决定了学习机的复杂度,所以核及相关参数选择得好坏直接影响到了SVM 的性能。对于一个选定的核函数来讲,其参数选择方法目前已有一些研究[3-6],其中交叉验证法(Cross-Validation)或留一法(Leave-One-Out)被认为是较为准确的方法[7],但其计算复杂度较高。Amari和Wu等基于由核函数导出的黎曼几何结构[8],提出了一种保形变换的方法,并将这一方法运用在高斯核函数上,取得了较好的实验结果。但是高斯核函数期望风险较高,并且要求的支持向量个数较多,所以在此提出一种改进的高斯核函数方法。
本文对雷达目标的高分辨一维距离像(High Resolution Range Profile,HRRP)目标识别算法做了深入研究。通常用于目标识别的样本数目很有限,因此目标高分辨距离像识别大多数情况下是一典型的高维数、小样本问题。
1 支持向量机
支持向量机算法是在训练样本的特征空间求取能把两类样本没有错误分开的最大间隔超平面,在数学上表示为一个凸二次规划的问题。也可以说算法求解的主要内容是通过求解二次规划(QP)问题,这个优化问题的求解是支持向量机算法的核心,可以说支持向量机的算法就得到了实现[9-10]。
(1) 最优超平面 SVM方法是根据线性可分情况下的最优分类面(Optimal Hyper Plane)提出的。设线性可分样本集为:
这个平面将两类样本没有错误地分开,并且使得离分类面最近的样本到分类面的距离最大,即分类间隔最大,等价于使Аw2最小,w为分类面的法向量。然而要求分类面对所有样本的正确分类,约束条件为:
yi(w•xi+b)-1≥0, i=1,2,…,n
(3)
因此,满足上述条件且使得Аw2ё钚〉姆掷嗝婢褪亲钣欧掷嗝妗A嚼嘌本中离分类面最近的点且平行于最优分类面的超平面H1,H2上的训练样本就是┦(3)中使等号成立的那些样本叫做支持向量。最优分类面可以表示为如下约束的优化问题,即在式(3)的约束下求函数为:
φ(w)=12w2=12(w•w)
(4)
的最小值。为此,可以定义如下的拉格朗日函数:
L(w,b,a)=12w2-∑ni=1ai[yi(w•x+b)-1]
(5)
式中:ai>0为拉格朗日系数。
把原问题转化为如下较简单的对偶问题:
max Q(a)=∑ni=1ai-12∑ni=1,j=1aiajyiyj(xi,xj)
(6)
式中:Аni=1yiai=0,ai≥0,i=1,2,…,n。
(2) 非线性SVM上面讨论的是最优和广义线性分类函数,要解决一个特征空间中的最优线性分类问题,只需知道这个空间中的内积运算即可。按照广义线性判别函数的思路,要解决一个非线性问题,可以设法将它通过非线性变换转换为另一个空间的线性问题,在这个变换空间求最优或最广义分类面。考虑Mercer条件:对于任意的对称函数K(x,x′),它是某个特征空间内积运算的充分必要条件,对于任意的φ(x)恒不为0,且∫φ2(x)dx0,显然这一条件不难满足[11]。如果用内积K(x,y)Т替最优分类面的点积,就相当于把原特征空间变换到了某一新的特征空间,此时的支持向量机为:
max Q(a)=∑ni=1ai-12∑ni=1,j=1aiajyiyjK(xi,xj)
(7)
式中:Аni=1yiai=0,C≥ai≥0,i=1,2,…,n;C为某个指定的常数。它起控制错分样本惩罚程度的作用,实现在错分样本的比例与算法复杂度之间的折衷。
相应的判别函数也应变为:
f(x)=sgn[∑ni=1a*iyiK(xi,x)+b*]
(8)
式中:a*i为最优解;b*为分类阈值,它由一个支持向量得到,也可通过两类中任意一对支持向量取中值。
对于给定的训练数据集,其数据分布的几何特征可能是预先已知的,常见的有高斯分布、圆形分布、圆环分布、柱状分布等。对于这类有规律的数据集,可以构造相应的核函数来训练SVM,以提高SVM的泛化能力。然而更多的情况是预先不知道训练数据集的分布特征,因此希望构造一些算法,给出数据分布的一个近似,把它作为SVM核函数及参数选择的一项重要参考指标,从而提高SVM的泛化能力。对于那些确实无法判断其几何分布的训练数据集,在SVM训练过程中,选用常用的高斯核函数或多项式核函数。
雷达目标的高分辨一维距离像是目标多散射中心在雷达径向距离上的一维分布图,反映了这些散射中心的散射强度和相对位置等目标特征信息。在特定姿态角下,目标的一维距离像可以由下面的离散数学式来表示:
x(t)=∑Pp=1∑M2m=-M1xpmδ(-m)(t-tp)
(9)
式中:p为目标上散射中心的个数;M1,M2为各散射中心的微分(随频率增大)或积分(随频率减小)的阶数;xpm为各散射中心的幅度;tp为各散射中心的时延。
雷达目标的高分辨一维距离像反映出目标散射中心的强度和相对位置等目标特征信息,为物理结构特征相似的复杂目标分类提供了必要的信息来源。
2 判断数据呈高斯分布的方法
广义高斯分布(GGD)是一类以Gaussian分布、Laplacian分布为特例,以Е莫Ш数和均匀分布为极限形式的对称分布。它在许多领域都有广泛的应用。
GGD的概率密度函数为:
f(x;μ,α,β)=α2βΓ(1/2)exp-x-μαβ,-∞
(10)
式中:Е,α>0,βХ直鹞均值、形状参数和尺度参数;Е(z)=∫+∞0e-ttz-1dt为Γ函数;β=σΓ(1/α)/Γ(3/α);σ为标准差。
对于一组给定的训练样本S={(x1,y1),(x2,y2),…,(xl,yl)},П疚奶岢鲆恢秩范ㄑ本是否为高斯分布的方法,其主要步骤如下:
(1) 在平面内,取m=k,将实轴分为k+1Ц銮间。
(2) 考虑Е,σ为未知参数,则统计量为V′=∑m+1i=1(vi-l′i)2l′i^。其中vi表示随机数样本落入第i段的个数(i=1,2,…,m+1);
p′i表示随机数落入第i段的概率;lП硎舅婊数样本总数。
(3) 先用极大似然法得到Е,σУ墓兰篇И┆,┆,由此得到p′i的估计′i,然后计算统计量V′。
(4) 若近似服从m-2的χ2Х植,则该训练样本服从GGD;反之,待测试数据不服从GGD。
通过分析给定训练样本集,可得到数据的一个近似分布,本文将它作为核函数及参数选择的一项重要参考指标,以提高SVM的泛化能力。如果训练样本集在输入空间呈高斯分布,则相应的SVM选择高斯核函数,其中的参数α可在上述判定算法中获得。
3 改进的高斯核函数进行高分辨距离像的研究
核函数是SVM 理论中尚未完全解决的问题,多数实验显示多项式核、高斯核和 sigmoid 核有相近的分类性能。由于高斯核函数
K(x,xi)=exp(-x-xi/σ2)
具有较好的局域性,便于将算法扩展到对多目标分类的场合,因此文中选用高斯核函数并对其进行改进。支持向量机期望风险的上界:
E[Pr(error)]≤E(Ni)/(Nj-1)
(11)
式中:Ni为支持向量的个数;Nj为训练矢量的个数。从式(11)可以看出,减少支持向量个数,可以减少期望风险;提高SVM的推广能力,提高目标识别的性能。根据这个原理对高斯核函数进行了改进:
K(x,xi)=Dexp(-x-xi/σ2), D>1
(12)
令Е弄2=D,Ы式(12)代入式(7)得:
w(a)=∑li,j=1ai-1/2ε2∑aiajyiyjexp(-x-xi/σ2)
=∑li,j=1ai-1/2∑εaiyiεajyjexp(-x-xi/σ2)
(13)
令Еai=βi,εaj=βj,式(13)将转化为:
w(a)=∑li,j=1ai-1/2∑βiyiβjyjexp(-x-xi/σ2)
=∑li,j=1ai-1/2∑βiβjyiyjK(xi,xj)
(14)
这样就增大式(7)中二次项系数的绝对值,从而减少了最优值aУ闹导蔼NiУ母鍪,提高了识别性能。
4 仿真分析
使用本文提出的算法对同一组高分辨距离像进行几何形状检测。数据都服从GGD分布,且在形状测试中得到形状参数Е要=0.7;在数据实验中,随机选取其中100个作为训练样本,其他100个作为测试样本;分别采用高斯核函数和多项式核函数对样本进行实验,在Matlab环境下,进行了20次实验。
改进高斯核函数的实验分析结果如图1,图2所示,它们分别指不同a取值下的分类精度、识别时间。它们有共同的规律:在a较小时,变化趋势比较大;随着a的增大,两个指标的变化趋势都变缓慢。分类精度和识别时间随着a的增大基本趋向一个稳定值,特别是分类精度如表1所示,在a=5时达到最大值。在表2中可以看出,随着独立向量个数的增多,对高分辨距离像的平均识别率呈增大趋势。这也就意味着在分类精度达到最大值的情况下,可以增加独立向量的个数来提高平均识别率。
在图3中,前100个样本作为训练数据,后100个样本作为测试数据,对高分辨距离像分别采用多项式核函数和改进高斯核函数进行分类。
图3 对高分辨距离像采用两种核函数进行分类
从图3中可以看出,对于服从GGD分布的数据集,使用高斯核函数且参数取0.7时的回归效果明显优于多项式核函数情况。这些试验结果也同时表明基于SVM的高分辨率雷达目标识别的识别性能相当不错,是雷达目标识别的一种重要的研究方向。
5 结 语
本文重点分析了样本函数呈高斯分布的情况下,提出了改进的高斯核函数方法,并在雷达高分辨距离像目标识别中做了深入研究,采用改进高斯核函数和多项式核函数两种核函数进行计算机仿真。试验结果证明,改进的高斯核与传统的高斯核相比,具有更低的方位角敏感性、训练数据更低的敏感性,从而验证了本文算法的有效性和合理性。
“享受司局级政治、生活待遇”这种用语,不了解详情的同志很容易产生误解,在此之前全国各地有很多同志提出过疑问,贵州省委组织部还就这个问题向中央组织部作了请示,为此,中央组织部老干部局专门下发了《关于行政十四级、十八级以上干部离休后提高待遇问题的电话答复》(老干办字〔1993〕第106号),对此作了明确的解释:“离休干部按中央组织部《关于行政十四级、十八级以上干部离休后分别按司局级和县处级待遇的通知》(中组发〔1982〕13号)规定提高待遇后,享受副司局级或副县处级待遇。”
为便于老同志全面准确掌握文件精神,现将中组发〔1982〕13号文件和中央组织部老干部局老干办字〔1993〕第106号文件全文刊登如下,以资学习、参考。
中央各部委,国家机关各部委党组,各人民团体党组,各省、市、自治区党委组织部:
根据中央关于对离休老干部一定要很好地安排照顾的指示精神,现决定:
一、建国前参加革命工作未担任司局(地专)级职务的行政十四级以上老干部离休后,一般可享受司局(地专)级的政治、生活待遇。
二、建国前参加革命工作未担任处(县)级职务的行政十八级以上老干部离休后,一般可享受处(县)级的政治、生活待遇。