前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇复杂网络分析范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键字:物流网络,复杂网络,复杂性
1.引言
物流网络是物流活动的重要体现,也是衡量物流活动有效性的重要指标。随着人工,仓租以及燃油费用的上升,企业要想有效地控制物流成本和提升服务客户的能力,就必须清楚地认识物流网络的结构和功能,以及合理地对物流网络进行管理,在达到满足客户需求的基础上最大程度地降低物流成本的目的,从而大大增加企业的价值。
物流网络系统是动态的复杂网络系统,是复杂网络系统的一个子集,因而它具有复杂网络系统的大部分特征。复杂网络理论的研究方法可以用来深入分析和准确研究物流网络系统运行的客观规律、物流网络系统的结构和功能以及物流网络系统的动态发展趋势和规律。
2.物流网络的研究现状
Mortiz Fleischmann等对不同行业的产品回收物流网络设计研究并概括产品回收网络的一般特征,并比较它们与传统的物流结构,此外,为不同类型的回收网络得出一个分类方案【1】。姚卫新等探讨了在电子商务环境下,为满足客户需要所形成闭环供应链物流网络的特点【2】。王建华等针对具有批量折扣和转运的供应链优化问题特征,提出供应物流网络的概念及其优化参数:节点、线路和流量【3】。杨光华等分析了区域物流网络的结构并阐述了物流宏观层面的特征,建立了基于加权网络的区域物流网络模型;从节点度和强度的分布、边的权重差异度等对区域物流网络的结构进行了定量分析【4】。吉迎东基于物流网络的整体性和动态性,分析了中国煤炭物流网络的特征【5】。韩舒怡等认为网络化是物流发展的方向,物流网络协同服务是物流网络化的主要表现形式之【6】。
从研究方法看,目前从复杂网络、复杂性来分析物流网络的研究较少,对物流网络系统的结构演化以及网络演化的内部规律探讨较少。从研究理论的视角来看,当前的研究往往基于静态、局部的视角,通常把物流网络系统的结构看成是相对稳定的、静止的,并试图优化网络系统中的物流、资金流和信息流,而没有充分注意到物流网络系统的动态适应性问题,没有从系统的整体运行规律上来考虑问题。在实际操作中,物流网络系统的结构是可根据企业的整体需要来改变的,目前的研究不能说明物流网络的形成演化机制,不同行业的物流网络为何有显著差别等问题。因此,有必要深入挖掘复杂网络理论、复杂性理论在物流网络分析中的应用价值。
3.物流网络的复杂网络特征
物流网络的小世界网络特征。研究表明:小世界网络具有高集聚系数和较小的平均路径长度。物流网络的聚集系数和平均路径长度反映了小世界的复杂性网络特征:
(1)平均路径长度是指网络中所有节点对之间的平均最短距离。网络中任意两个节点i和j之间的距离 定义为连接两个节点的最短路径。网络的直径为网络中任意两个节点之间距离的最大值,记为D= 。在无向网络中,网络中节点对之间最短距离的算术平均值为平均路径长度L,其公式为:L= 。其中,N表示网络中的节点总数。平均路径长度公式中包含了每个点到自身的距离(为0)。对于物流网络来言,平均路径可以表示产品交付给客户的时间也可以表示配送产品或者中间产品到客户的费用。随着商品生命周期不断缩短的同时客户对配送时间要求的提高,如何以最小费用、最短时间内将产品交付客户成为节点企业生存与发展的战略问题。物流网络中的任何一个节点企业为了在激烈的竞争中保持优势,必须做到以下几点:注重信息网络的建设,加快信息流通的速度,减少产品运输距离,提高自身协调和反应能力,建立配送物流中心,使物流网络具有较小的平均路径长度。
(2)聚集系数是衡量网络集聚特性的统计量,其定义有很多种不同的表述方式,本文介绍一个Watts等人提出的定义【7】: 假设网络中的某个节点i有 个节点与它相连,这 个节点就称为节点i的邻节点,这 个节点之中最多可能有 条边, 因此这 个节点之间实际存在的边数 和总的可能边数为 之比为节点i的集聚系数 : = 。对于度为0或1的节点,上式中的分子和分母均为0,故认为集聚系数 =0。所有节点i的集聚系数 的平均值是网络的集聚系数C,记为:C= 。对物流网络而言,平均聚类系数是物流网络节点企业之间相互连接和交流的程度。随着计算机技术和互联网技术的高速发展,越来越多的企业应用信息技术和互联网建立连接,如ERP、EDI系统的使用等。通过信息共享,使得物流网络中各节点企业之间的联系更加紧密,交流更加频繁。因此,物流网络具有较高的聚集系数。
度分布是网络的一个重要统计特征,节点的度指是与节点连接的边数【8】。Barabdsi和Albert在1999年提出了著名的BA模型,准确地描述了无标度网络形成的机制。无标度网络最大的特点在于网络的度分布自相似性结构和存在节点度很大的节点。一个节点的度越大,表示它在网络中的重要性就越大。节点的度可以根据其邻接矩阵来定义,将其定义为: 。网络中节点的度分布可用函数P(k)来表示,它表示网络中任意的一个点,度值为k的概率。从统计学上来讲,即为网络中度数为k的节点个数与网络节点总数的比值:P(k)= 。其中, 表示网络中度数为k的节点个数,而N表示网络中总节点个数,即网络的规模。网络的节点平均度为网络中所有节点i的度 的平均值。从目前的研究来看,两种度分布较为常见:一种是指数度分布,P(k)随着k的增大以指数形式衰减;另一种分布是幂律分布,即P(k)- 。物流网络中,通常都有一个或者多个核心企业,众多的节点企业围绕核心企业建立的生产、营销、库存、配送网络体系,极大地体现了复杂网络的无标度性。近年来,基于低成本、高服务质量而建立的第三方、第四方物流的物流网络更是集中体现了复杂网络的无标度性。
4.物流网络的复杂性分析
首先,现实中的物流网络一般都有大量的节点数,其拓扑结构以及数量巨大的节点相互作用下“涌现”网络演化的规律和网络动力学的特性。物流网络中的节点数量不仅众多,而且各自的种类多样。从网络的拓扑结构来看,物流网络通常具有多层次性,由众多的子网络构成。子网络一层一层往下拓展,从而形成了复杂的空间拓扑排列,如图1.4所示【9】。
第二,节点之间的线路是不确定的。由于节点之间相互作用的关系是不确定的,那么节点之间的线路也是时刻在变化的。节点之间的线路意义很多,可以表示路径,也可以表示流量,还可以表示相互之间的策略选择等。物流网络内节点之间的连接是有机的,连接的方式是按节点企业之间的协议来进行的。从图上来看,物流网络内节点之间的连接是按非线性方式进行转化;连接各个节点的边所代表的内容多种多样,可表示配送线路的连接、有无库存供货的合作、合作的紧密度等,其连接方式呈现立体动态结构。物流网络内节点是相互影响,相互关联的,并逐步扩大为不同物流网络之间的相互连接、相互影响、相互作用,以复杂的耦合方式推动不同网络之间的演进,从而形成一个纷繁复杂的大世界。
第三,物流网络的动态性。物流网络是动态网络,而且网络具有实时动态演进的特征,这又导致了网络结构和功能的实时变化,并通过涌现和自组织的机理产生网络的复杂效应。物流网络随着时间的变化而变化,经过网络内部和外界环境的相互作用,不断适应、调节网络的结构和功能,同时通过自组织作用,整个网络向更高级的有序化发展,不断涌现出复杂网络独特的行为与特征。
第四,物流网络的运行环境是不确定的。物流网络的运行环境是瞬息万变的。从宏观环境来讲,经济、科技、信息的全球化使得信息的传播迅速且广泛,信息数量之多使得网络的反馈系统任务繁重。“牵一发而动全身”,由于宏观环境的任何一个细微的变化都有可能造成物流网络巨大的震荡。从微观环境而言,物流网络中的任何一个节点所处的外界环境都是不同的,而且每个节点对待环境的变化所持的策略和态度各异,因此对整个物流网络的作用而言是非常复杂且是不确定的。物流网络是开放的动态系统,它与外部世界相互联系、相互作用,系统与外界环境是紧密相关的。物流网络时刻与外界进行物质、能量、资源和信息的交换。只有通过交换,物流网络才能得以生存和发展。任何一个复杂网络,只有在开放的条件下才能形成,才能维持,才能发展。
第五,物流网络的自组织。物流网络都具有自组织能力,能通过反馈系统进行自控和自我调节,以达到适应外界变化的目的。物流网络一旦建立,在运行中无不表现出系统的自组织属性。物流网络的各个节点企业通过契约、合作、战略联盟等方式进行物流、资金流、现金流的交换,在市场的作用下进行物质和能量的交换,优胜劣汰。在物流网络系统远离平衡态的情况下,有些节点企业发展较好,获得的资源较多,技术力量也日渐雄厚;反之,有些节点企业在市场竞争的角逐下,日渐衰弱,从而推出原有的物流网络系统。
第六,物流网络的混沌性。物流网络也受自身结构和功能的种种参数约束。如物流网络中的牛鞭效应,充分说明了物流网络有时受初值的影响是巨大的,物流网络在动态演化的过程中,只要起始状态(初始值)稍微有一点点微笑的变化,这种变化会迅速积累和成倍地放大,最终导致物流网络行为发生巨大的变化。简单假设一个物流网络系统,这个网络只有1个零售商、1个批发商、1个分销商和1个制造商。零售商预测客户需求,然后向批发商订货,批发商向分销商订货,而分销商则向制造商订货,制造商根据分销商的订货量进行生产的同时保持一定的安全库存。如果客户需求是n,假设每个节点企业上的安全库存率是10%,那么零售商、批发商、分销商的订货量分别为1.1n, n, n,那么制造商的生产量应为 n(即为1.62n)。因为可以看出第1个时间段,制造商最后的产量是客户需求量的160%,那么第t个时间段,制造商的产量是客户需求的 倍,其中t大于等于1。因此,只要这个初始值n发生一个小小的变动,即可产生巨大变化。针对物流网络中产生的混沌效应,节点企业必须重视需求预测,信息共享,每个节点企业缩短供货的时间,尽量减少不确定性,建立战略伙伴关系,设置合理的安全库存。
第七,物流网络的稳定性。物流网络具有一定的稳定性,在一定的外界条件下能保证网络结构的稳定和基本功能的正常发挥,换句话说物流网络具有一定的抗干扰性,如网络的鲁棒性。网络的鲁棒性是指网络系统在一定的外界环境作用下,网络的某些结构发生变化、节点数量的增减或则是出现运行故障的情况下,网络系统仍能保持其正常的相关性能进行运转,网络系统的这种稳定的、自我调整、自我适应的能力称为“鲁棒性”。刘楚燕在她的硕士论文中提出集聚型供应链网络的内部存在多个核心节点企业,这些企业在战略、战术、资源和信息方面相互依赖、相互交互,以信息流、资金流、物流的交换方式构成一个复杂的供应链网络,而这种网络具有较强的鲁棒性【10】。浙江大学李刚的博士论文研究了供应链的网络鲁棒性,将鲁棒性具体分为静态鲁棒性和动态鲁棒性;关于静态鲁棒性,文中提出随机删除节点, 删除目标节点,随机删除连接边和删除目标连接边四种规则对其模拟研究,结果显示,供应链物流网络针对不同类型的破坏呈现出不同的鲁棒性能【11】。在物流网络中,由于受到突发事件的影响,如果有些节点不能正常运转,或者需要临时增加网络节点来满足需求,很多情况下,物流网络的整体运作是不受影响的,换句话说还是能正常完成其系统特有的功能的。这就说明,物流网络具有一定的稳定性。
随着经济、信息全球化的程度加深,竞争的加剧,内外部环境的不确定性增加,物流网络涉及到的节点企业越来越多,结构越来越复杂,功能的变化也趋于复杂。利用复杂网络的理论和复杂性理论来揭示物流网络的性质,研究物流网络的动态生成演化过程机制,探索物流网络节点企业之间的协调机制,分析各个节点的脆弱性、不确定性,以及整个网络的鲁棒性和适应性,以此来实现物流网络的优化。
参考文献
【1】Mortiz Fleischmann, Hans Ronald Krikke, Rommert Dekker, Simme Douwe P. Flapper. A characterisation of logistics networks for product recovery. Omega, Volume 28, Issue 6, December 2000, Pages 653-666;
【2】姚卫新.电子商务条件下闭环供应链物流网络的设计.管理科学.2005年06期;
【3】王建华,李南,徐斌.具有批量折扣的供应物流网络优化遗传算法研究.中国管理科学,2007年03期;
【4】杨光华,李夏苗,谢小良.加权区域物流网络结构分析.计算机工程与应用.2009年26期;
【5】吉迎东.煤炭物流网络风险分析与应对研究.物流工程与管理,2012年12期;
【6】韩舒怡,徐杰.物流网络协同服务影响因素的实证研究.物流工程与管理,2012年03期;
【7】Watts D J, Strogatz S H. Collective dynamics of 'small-world' networks[J]. Nature, 1998, 393:440-442;
【8】R.Albert and A.L Barabasi,tatistical mechanics of complex networks,Rev,Mod,Phys.74,2002;
【9】李靖, 张永安.复杂网络理论在物流网络研究中的应用.中国流通经济2011年第5期;
【10】刘楚燕.集聚型供应链网络的鲁棒性研究.浙江工商大学,管理科学与工程,2011,硕士;
关键词:战略网络 复杂网络理论 网络效率 节点重要性
引言
战略网络是由不同利益成员构成的系统,由于各成员目标可能不同,每个成员都以自身利益最大化为目的参与合作,所以战略网络中存在不可避免的矛盾。目前国内外对于战略网络节点管理的研究角度多偏向于生态学理论、博弈论及系统论,对企业战略网络节点选择、节点数量及节点的进退机制进行研究。复杂网络研究的不同之处在于:从统计的角度出发,考察网络中的大规模节点以及节点之间的连接性质,这些性质的不同意味着网络内部结构的不同,而内部的结构不同将导致网络系统的功能不同。利用复杂网络理论,可以分析网络中各节点的重要程度,反映各个环节的瓶颈问题。还可以用来发现网络中的关键节点,从而对网络进行有针对性的优化,进而达到整体网络的优化。
复杂网络理论在企业网络中的应用
科学家们发现大量的真实网络既不是规则网络, 也不是随机网络,而是具有与前两者都不同的统计特征的网络,这样的一些网络被科学家们叫做复杂网络(Albert R,Albert-Laszlo B,2002;Newman M E J,2003)。复杂网络被发现具有很多与规则网络和随机网络不同的统计特征,其中最突出的是小世界效应和无尺度特性(Drik Helbing,2006;Christian Kuhnert,Dirk Helbing,2006;Marco Laumanns,Erjen Lefeber,2006)。由于现代企业网络越来越具有复杂性和不稳定性特点,复杂网络理论在企业网络方向上的应用也逐渐成为研究热点。
李守伟、钱省三(2006)在对产业网络供应链的复杂性研究中发现,我国的半导体产业的供应链条符合无标度网络的特征。此外,阮平南、李金玉(2010)将复杂网络理论用于战略网络,阐述了战略网络的无标度特征,建立了BA演化模型,解释了无标度网络演化的过程,进而解释了战略网络中核心节点的形成。庞俊亭等(2012)探索了集群创新网络所具有的小世界和无标度结构特性及集群网络在受到攻击时所具有的稳健性和脆弱性。
目前多数研究侧重定性研究网络的复杂网络特性及演化研究,有充分考虑企业网络的动态适应性问题,没有考虑到系统整体运行规律。另外,以网络效率为标准,研究网络中的节点重要性方面的文献还是很缺乏的。本文试图以复杂网络理论为基础,从这一全新视角来研究战略网络中重要节点识别问题。
战略网络的复杂网络特性分析
(一)战略网络拓扑结构
战略网络就是由那些具有战略意义的组织或个人组成的社会网络。它是由消费者、市场中介、供应商、竞争对手、其他产业的企业、利益相关者、其他组织和企业本身等节点构成的(见图1)。
用复杂网络理论研究战略网络,首先应将战略网络抽象成拓扑模型。将战略网络中的企业、科研机构、政府等作为网络中的节点。节点确定以后,根据各节点的实际联系确定是否存在边的关系。作为核心的网络节点企业存在众多的合作关系,这就导致战略网络的节点的边越来越多。为了能比较好地模拟出一个战略网络,根据战略网络的基本结构,描绘出一个简单战略网络拓扑图,如图2所示。
(二)战略网络的复杂特性
1.战略网络的小世界网络的特征。平均路径长度是指在网络中将两点间的距离被定义为连接两点的最短路所包含的边的数目,把所有节点对的距离求平均,就得到了网络的平均距离。网络的平均路径长度L(N)定义为任意两个节点之间的距离的平均值,平均路径长度表示产品的交付时间。为在保持激烈竞争环境中的优势,企业必须采取以下对策:重组整合,减少补给提前期,加快信息的流通速度,减少产品运输距离,提高自身的反应能力和适应变化的能力,建立配送物流中心,以便能够更好地实现准时供货。基于时间的竞争战略对于各节点成员来说是至关重要的,如何以最短的时间将产品交付给客户成为节点企业参与战略网络竞争必须应对的关键战略问题。在战略网络环境中,企业之间的平均最短路径,可以体现为产品或服务从一个环节到另一个环节所需要的平均最少中转数目。整个网络的平均最短路径L的计算公式为:
上述公式中,dij表示产品或服务从环节i到达环节j所需的最少中转次数,N表示战略网络中的企业总数。
聚集系数指与节点相邻的节点之间实际存在的边数与这些节点都互连的最大边数之比,网络中所有节点聚集系数的平均就是网络的聚集系数。对于战略复杂网络而言,平均聚集系数相应于网络节点企业之间相互交流的程度,随着信息高速发展时代的到来,越来越多的企业应用信息技术和互联网的媒介建立彼此之间的连接。通过信息共享的各种途径促使各节点企业之间联系更加紧密,交流更加频繁,这就体现战略网络具有较高的聚集系数。
2.战略网络复杂网络的无标度特征。无标度网络的特点是网络中的大部分节点的度值都很低,但存在着度数非常高的核心节点。各节点企业在企业网络中所处的网络地位不同,战略网络中的核心企业形成占有的知识不均匀,节点间的连接就具有择优性(Boschmma R A,Wal A L J,2007)。战略网络核心节点的形成主要来源于择优连接机制,在战略网络中,组织会倾向于选择连接数目较多的网络节点。通常一些节点企业通过先进的技术、富有竞争力的产品和良好的管理,在非常短的时间内获得大量的关系连接;网络中存在历史较长的企业,有较长的时间来积累与其它组织的关系连接。核心节点的连接数目远远超出了一般的节点,并且网络主要由这些核心节点所支配。
战略网络节点重要性模型构建
在复杂网络中,节点度是单个节点极其重要的属性节,点的度直接反映该节点在网络中与其他节点相联系的广度,定义为邻接矩阵中与该节点连接的其他节点边的数目。传统复杂理论中判断核心节点方法是依据网络中节点度或点强度参数,这个方法是具有很大片面性和局限性的。节点度高的企业只能说明企业与周围企业的联系程度密切,而不能真实地反映出该企业在网络中的作用和地位(朱大智、吴俊,2007)。因此本文将以网络效率为依据,从新的视角出发对战略网络中的节点进行重要性识别。
(一)战略网络的网络效率建模
网络效率指标被用来衡量网络中点与点之间的信息沟通程度。在战略网络中最短路径长度反映了战略网络内各节点企业产品交付时间的效率。路径越长,企业获取资源的时间越长,效率就越低;反之,路径越短,资源获取的时间成本越低,效率越高。为了计算网络效率E,首先要建立这样一个网络模型。假设忽略所有企业内部信息,只考虑企业间的联盟关系;任意两节点间的连接度是等值的。设网络G是一个无重边的无向网络,即网络中的边没有固定的方向,用G=(N,K)来代表,N是网络中节点集合,K是网络中边集合,G的邻接矩阵A=(aij)定义如下:
则A是一个n阶的对称矩阵,如果两个节点之间有联系,aij=1;否则aij=0。
假设节点i与节点j间的连通的效率eij与最短路径成反比,即eij=1/dij。那么,给出如下的战略网络效率计算公式:
(1)
上述公式中,eij表示完全连通情况下两个节点企业之间的效率。在突况下,加入变量wij,即网络效率因子。0≤wij≤1,作为企业连通效率参数。Wij=1表示相关节点企业正常运营。在遭遇突况下,Wij将降低,取0≤wij≤1。这样可以比较真实地模拟出企业在面对不同风险时,网络出现效率变化的情况。随着wij的变化,与该企业有贸易往来的相关企业均会受到一定程度的影响,将导致整个网络的效率会出现非线性的变化。通过评价网络的效率,可以尝试改善网络的构造从而优化网络的效率,网络的效率得以提高,使网络更具稳定性。
(二)战略网络中重要节点的识别建模
网络效率E无疑成为衡量战略网络效率有效的指标,然而它只能表现网络的平均水平,因此需要更深入的研究,识别网络中的关键节点。此方法主要考察的是当从网络中剔除节点i以后,网络的效率变化,根据节点对于网络效率影响能力的大小,可以识别网络中的关键节点。
E=E=E(G)-E(G`) i=1,2,……N (2)
E(G`)表示wij变化时的网络平均效率。根据网络效率变化的大小对网络中节点的重要性指数进行排序,在wij一定的情况下,网络效率变化值较大的节点无疑是网络中重要性相对较高的节点。也就是去除该节点后,网络效率下降越大,说明该企业的重要性越高。针对企业对于网络整体的作用不同,需加强预防工作,做到真正的防患于未然。对于这些重要节点,必须予以重点关注,例如,更加频繁地关注它的运作状况、与其他企业的连通状况,建立完备的预警机制等。
结论
基于网络整体的考虑,本文运用复杂网络理论,侧重从宏观整体的角度去分析单独的点和整体网络之间的关系,通过建立网络拓扑结构、衡量网络效率、识别重要网络节点三个方面,阐述了复杂网络在战略网络管理中的应用前景。建立数学模型比较真实地模拟了网络在正常情况和突况下的网络效率。本文只是从复杂网络理论的角度讨论通过战略网络效率的办法计算节点重要性,而由此识别出来的重要企业也是具有现实意义的。
参考文献:
1.Albert R,Albert-Laszlo B.Statistical mechanics of complex networks[J].Reviews of Modern Physics,2002(74)
2.Newman M E J.The structure and function of complex networks[J].Siam Review,2003(45)
3.Drik Helbing.Information and material flows in complex networks[J].Physica A,2006,363(1)
4.Christian Kuhnert,Dirk Helbing.Scaling laws in urban supply networks[J].Physica A,2006,363(1)
5.Marco Laumanns,Erjen Lefeber.Robust optimal control of material flows in demand-driven supply networks[J].Physica A,2006,363(1)
6.李守伟,钱省三.产业网络的复杂性研究与实证.科学学研究,2006(4)
7.阮平南,李金玉.战略网络中基于无标度网络的核心企业形成研究.科技管理研究,2010(16)
8.庞俊亭,游达明.基于复杂网络视角的集群创新网络特性研究.统计与决策,2012(2)
针对复杂网络交叠团的聚类与模糊剖析办法设计Issue(问题),给出一种新的模糊度量及对应的模糊聚类办法,并以新度量为根底,设计出两种发掘网络模糊拓扑特征的新目标:团间衔接严密水平和模糊点对交叠团的衔接奉献度,并将其用于网络交叠模块拓扑构造微观剖析和团间关键点提取。实验后果标明,运用该聚类与剖析办法不只能够取得模糊勾结构,并且可以提醒出新的网络特征。该办法为复杂网络聚类后剖析提供了新的视角。
关键词:网络模糊聚类;团—点相似度;团间连接紧密度;团间连接贡献度;对称非负矩阵分解;网络宏观拓扑
团结构是复杂网络普遍而又重要的拓扑属性之一,具有团内连接紧密、团间连接稀疏的特点。网络团结构提取是复杂网络分析中的一个基本步骤。揭示网络团结构的复杂网络聚类方法[1~5]对分析复杂网络拓扑结构、理解其功能、发现其隐含模式以及预测网络行为都具有十分重要的理论意义和广泛的应用前景。目前,大多数提取方法不考虑重叠网络团结构,但在多数网络应用中,重叠团结构更为普遍,也更具有实际意义。
现有的网络重叠团结构提取方法[6~10]多数只对团间模糊点进行初步分析,如Nepusz等人[9,10]的模糊点提取。针对网络交叠团结构的深入拓扑分析,本文介绍一种新的团—点相似度模糊度量。由于含有确定的物理含意和更为丰富的拓扑信息,用这种模糊度量可进一步导出团与团的连接紧密程度,以及模糊节点对两团联系的贡献程度,并设计出新指标和定量关系来深度分析网络宏观拓扑连接模式和提取关键连接节点。本文在三个实际网络上作了实验分析,其结果表明,本方法所挖掘出的网络拓扑特征信息为网络的模糊聚类后分析提供了新的视角。
1新模糊度量和最优化逼近方法
设A=[Aij]n×n(Aij≥0)为n点权重无向网络G(V,E)的邻接矩阵,Y是由A产生的特征矩阵,表征点—点距离,Yij>0。假设图G的n个节点划分到r个交叠团中,用非负r×n维矩阵W=[Wki]r×n来表示团—点关系,Wki为节点i与第k个团的关系紧密程度或相似度。W称为团—点相似度矩阵。令Mij=rk=1WkiWkj(1)
若Wki能精确反映点i与团k的紧密度,则Mij可视为对点i、j间相似度Yij的一个近似。所以可用矩阵W来重构Y,视为用团—点相似度W对点—点相似度Y的估计:
WTWY(2)
用欧式距离构造如下目标函数:minW≥0FG(Y,W)=Y-WTWF=12ij[(Y-WTW)。(Y-WTW)]ij(3)
其中:•F为欧氏距离;A。B表示矩阵A、B的Hadamard矩阵乘法。由此,模糊度量W的实现问题转换为一个最优化问题,即寻找合适的W使式(3)定义的目标函数达到最小值。
式(3)本质上是一种矩阵分解,被称为对称非负矩阵分解,或s-NMF(symmetricalnon-negativematrixfactorization)。s-NMF的求解与非负矩阵分解NMF[11,12]的求解方法非常类似。非负矩阵分解将数据分解为两个非负矩阵的乘积,得到对原数据的简化描述,被广泛应用于各种数据分析领域。类似NMF的求解,s-NMF可视为加入限制条件(H=W)下的NMF。给出s-NMF的迭代式如下:
Wk+1=Wk。[WkY]/[WkWTkWk](4)
其中:[A]/[B]为矩阵A和B的Hadamard矩阵除法。
由于在NMF中引入了限制条件,s-NMF的解集是NMF的子集,即式(4)的迭代结果必落入NMF的稳定点集合中符合附加条件(H=W)的部分,由此决定s-NMF的收敛性。
在求解W之前还需要确定特征矩阵。本文选扩散核[13]为被逼近的特征矩阵。扩散核有明确的物理含义,它通过计算节点间的路径数给出任意两节点间的相似度,能描述网络节点间的大尺度范围关系,当两点间路径数增加时,其相似度也增大。扩散核矩阵被定义为K=exp(-βL)(5)
其中:参数β用于控制相似度的扩散程度,本文取β=0.1;L是网络G的拉普拉斯矩阵:
Lij=-Aiji≠j
kAiki=j(6)
作为相似度的特征矩阵应该是扩散核矩阵K的归一化形式:
Yij=Kij/(KiiKjj)1/2(7)
基于扩散核的物理含义,团—点相似度W也具有了物理含义:团到点的路径数。实际上,W就是聚类结果,对其列归一化即可得模糊隶属度,需要硬聚类结果时,则选取某点所对应列中相似度值最大的团为最终所属团。
2团—团关系度量
团—点相似度W使得定量刻画网络中的其他拓扑关系成为可能。正如WTW可被用来作为点与点的相似度的一个估计,同样可用W来估计团—团关系:
Z=WWT(8)
其物理含义是团与团间的路径条数。很明显,Z的非对角元ZJK刻画团J与团K之间的紧密程度,或团间重叠度,对角元ZJJ则刻画团J的团内密度。
以图1中的对称网络为例,二分团时算得
Z=WWT=1.33760.0353
0.03531.3376
由于图1中的网络是对称网络,两团具有同样的拓扑连接模式,它们有相同的团内密度1.3376,而团间重叠度为0.0353。
3团间连接贡献度
ZJK度量了团J与团K间的重叠程度:
ZJK=na=1WJaWKa(9)
其中:WJaWKa是这个总量来自于点a的分量。下面定义一个新指标来量化给定点对团间连接的贡献。假设点i是同时连接J、K两团的团间某点,定义点i对团J和团K的团间连接贡献度为
Bi=[(WJiWKi)/(na=1WJaWKa)]×100%(10)
显然,那些团间连接贡献大的点应处于网络中连接各团的关键位置,它们对团间连接的稳定性负主要责任。将这种在团与团间起关键连接作用的点称为关键连接点。为了设定合适的阈值来提取团间关键连接点,本文一律取B>10%的点为关键连接点。
4实验与结果分析
下面将在三个实际网络上展开实验,首先根据指定分团个数计算出团—点相似度W,然后用W计算团—团关系和B值,并提取关键连接点。
4.1海豚社会网
由Lusseau等人[14]给出的瓶鼻海豚社会网来自对一个62个成员的瓶鼻海豚社会网络长达七年的观测,节点表示海豚,连线为对某两只海豚非偶然同时出现的记录。图2(a)中名为SN100(点36)的海豚在一段时间内消失,导致这个海豚网络分裂为两部分。
使用s-NMF算法聚类,海豚网络分为两团时,除30和39两点外,其他点的分团结果与实际观测相同,如图2(a)所示。计算B值并根据阈值提取出的五个关键连接点:1、7、28、36、40(虚线圈内),它们对两团连接起到至关重要的作用。图2(b)为这五点的B值柱状图。该图显示,节点36(SN100)是五个关键连接点中B值最大者,对连接两团贡献最大。某种程度上,这个结果可以解释为什么海豚SN100的消失导致了整个网络最终分裂的影响。本例说明,s-NMF算法及团间连接贡献程度指标在分析、预测社会网络演化方面有着独具特色的作用。
4.2SantaFe科学合作网
用本算法对Newman等人提供的SantaFe科学合作网络[15]加以测试。271个节点表示涵盖四个学术领域的学者,学者合作发表文章产生网络连接,构成了一个加权合作网络。将本算法用于网络中一个包含118个节点的最大孤立团,如图3(a)所示。
图3(a)中,四个学科所对应的主要组成部分都被正确地分离出来,mathematicalecology(灰菱形)和agent-basedmodels(白方块)与文献[15]的结果一致,中间的大模块statisticalphysics又被细分为四个小块,以不同灰度区分。计算了24个点的团间连接度贡献值B,从中分离出11个B值大于10%的点作为关键连接点:1、2、4、6、11、12、20、47、50、56、57,其标号在横轴下方标出,见图3(b),并在图3(a)中用黑色圆圈标记,这些连接点对应那些具有多种学科兴趣、积极参与交叉研究的学者。除去这11个点时,整个网络的连接布局被完全破坏,见图3(a)下方灰色背景缩小图,可见关键连接点的确起到重要的沟通各模块的作用。
4.3杂志索引网络
在Rosvall等人[16]建立的2004年杂志索引网络上进行测试。网络节点代表杂志,分为物理学(方形)、化学(方形)、生物学(菱形)、生态学(三角形)四个学科领域,每个学科中各选10份影响因子最高的刊物,共40个节点,若某刊物文章引用了另一刊物文章,则两刊间有一条连线,形成189条连接。使用s-NMF对该网4分团时,聚类结果与实际分团情况完全一致,如图4(a)所示。
由本算法得出的团—点相似度W在网络宏观拓扑结构的挖掘方面有非常有趣的应用,如第2章所述,用W计算团—团相似度矩阵Z=WWT,其对角元是团内连接密度,非对角元表征团与团的连接紧密程度,故Z可被视为对原网络的一种“压缩表示”。如果将团换成“点”,将团与团之间的连接换成“边”,利用Z的非对角元,就能构造出原网络的一个压缩投影网络,如图4(b)所示。这是原网络的一个降维示意图,也是团与团之间关系定量刻画的形象表述,定量地反映了原网络在特定分团数下的“宏观(全局)拓扑轮廓”,图上团间连线色深和粗细表示连接紧密程度。由图4(b)可以看到,physics和chemistry连接最紧密,而chemistry与biology和biology与ecology次之。由此推测,如果减少分团数,将相邻两团合并,连接最紧密的两团必首先合并为一个团。实际情况正是如此:分团数为3时,biology和ecology各自独立成团,physics和chemistry合并为一个大团,这与文献[11]结果一致。
5讨论
网络模糊聚类能帮助研究者进一步对团间的一些特殊点进行定量分析,如Nepusz等人[9]用一种桥值公式来刻画节点在多个团间的共享程度,即节点从属度的模糊程度。而本文的团间连接贡献度B反映出节点在团间连接中所起的作用大小。本质上它们是完全不同的两种概念,同时它们也都是网络模糊分析中所特有的。团间连接贡献度指标的提出,将研究引向对节点在网络宏观拓扑模式中的影响力的关注,是本方法的一个独特贡献。无疑,关键连接点对团间连接的稳定性起到很大作用,如果要迅速切断团间联系,改变网络的宏观拓扑格局,首先攻击关键连接点(如海豚网中的SD100)是最有效的方法。团间连接贡献度这一定义的基础来自于对团与团连接关系(Z)的定量刻画,这个定量关系用以往的模糊隶属度概念无法得到。由于W有明确的物理含义,使得由W导出的团—团关系Z也具有了物理含义,这对网络的宏观拓扑分析非常有利。
6结束语
针对复杂网络交叠团现象,本文给出了一个新的聚类后模糊分析框架。它不仅能对网络进行模糊聚类,而且支持对交叠结构的模糊分析,如关键点的识别和网络宏观拓扑图的提取。使用这些新方法、新指标能够深入挖掘潜藏于网络的拓扑信息。从本文的聚类后分析不难看出,网络模糊聚类的作用不仅在于聚类本身,还在于模糊聚类结果能够为网络拓扑深入分析和信息挖掘提供支持,而硬聚类则不能。今后将致力于对团间连接贡献度指标进行更为深入的统计研究。
参考文献:
[1]赵凤霞,谢福鼎.基于K-means聚类算法的复杂网络社团发现新方法[J].计算机应用研究,2009,26(6):2041-2043,2049.
[2]汪小帆,刘亚冰.复杂网络中的社团结构算法综述[J].电子科技大学学报,2009,38(5):537-543.
[3]NEWMANMEJ.Modularityandcommunitystructureinnetworks[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2006,103(23):8577-8582.
[4]WHITES,SMYTHP.Aspectralclusteringapproachtofindingcommunitiesingraphs[C]//ProcofSIAMInternationalConferenceonDataMining.2005.
[5]ENRIGHTAJ,DONGENSV,OUZOUNISCA.Anefficientalgorithmforlarge-scaledetectionofproteinfamilies[J].NucleicAcidsResearch,2002,30(7):1575-1584.
[6]BEZDEKJC.Patternrecognitionwithfuzzyobjectivefunctionalgorithms[M].NewYork:PlenumPress,1981.
[7]PALLAG,DERENYII,FARKASI,etal.Uncoveringtheoverlappingcommunitystructuresofcomplexnetworksinnatureandsociety[J].Nature,2005,435(7043):814-818.
[8]REICHARDTJ,BORNHOLDTS.Detectingfuzzycommunitystructuresincomplexnetworkswithapottsmodel[J].PhysicalReviewLetters,2004,93(21):218701.
[9]NEPUSZT,PETROCZIA,NGYESSYL,etal.Fuzzycommunitiesandtheconceptofbridgenessincomplexnetworks[J].PhysicalReviewE,2008,77(1):016107.
[10]ZHANGShi-hua,WANGRui-sheng,ZHANGXiang-sun.IdentificationofoverlappingcommunitystructureincomplexnetworksusingfuzzyC-meansclustering[J].PhysicalReviewA:StatisticalMechanicsandItsApplications,2007,374(1):483-490.
[11]PAATEROP,TAPPERU.Positivematrixfactorization:anon-negativefactormodelwithoptimalutilizationoferrorestimatesofdatavalues[J].Environmetrics,1994,5(2):111-126.
[12]ANTTILAP,PAATEROP,TAPPERU,etal.SourceidentificationofbulkwetdepositioninFinlandbypositivematrixfactorization[J].AtmosphericEnvironment,1995,29(14):1705-1718.
[13]KONDORRI,LAFFERTYJ.Diffusionkernelsongraphsandotherdiscretestructures[C]//Procofthe19thInternationalConferenceonMachineLearning.SanFrancisco:MorganKaufmann,2002.
[14]LUSSEAUD,SCHNEIDERK,BOISSEAUOJ,etal.Thebottlenosedolphincommunityofdoubtfulsoundfeaturesalargeproportionoflong-lastingassociations:cangeographicisolationexplainthisuniquetrait?[J].BehavioralEcologyandSociobiology,2003,54(4):396-405.
〔关键词〕复杂网络;微博用户;行为;小世界特性;关注;非均匀网络
DOI:10.3969/j.issn.1008-0821.2013.09.007
〔中图分类号〕G202〔文献标识码〕A〔文章编号〕1008-0821(2013)09-0035-09
伴随着移动通信技术的不断发展,移动互联网日趋成熟,为微博的发展提供了发展契机。Twitter是产生最早的微博,据Semiocast的数据调查数据显示,截至2012年12月,Twitter用户数达到517亿,成为仅次于Facebook的全球第二大社交网站,其中141亿美国用户;2012年6月,Twitter用户一共消息1058亿条[1],这个信息量是任何一家媒体,无论是传统媒体还是网络媒体,都无法企及的。目前国内较具代表性的微博主要以门户网站为主,如新浪微博、腾讯微博、人民网微博等,它们依靠网站自身的影响力与巨大的用户群,几乎占据了微博的全部用户,有着较大的影响力。据中国互联网络信息中心的最新报告,2012年12月底,我国微博用户规模为309亿,其中手机微博用户规模达到202亿,手机成为微博用户的首选终端,微博逐渐移动化发展[2]。
自2005年Twitter出现后,学术界关于微博行为的研究的不断增加,对于用户行为、用户关系、用户兴趣等都进行了较为深入的研究,也取得了较多成果。麦田(2009)认为,以Twitter为代表的微博信息平台能够成功的主要原因有:可迅速的内容,可迅速的网站结构以及病毒式的信息传播[3]。所以,微博自身的信息传播模式的便利性与快捷性对于用户来说吸引力是极大的。彭兰教授在《微博发展的动力》(2009)中指出,微博的发展除了来自微博形式的自动力外,还有来自微博用户需求的拉动力和微博社会功能的主动力[4]。实践方面,主要研究微博用户行为的动机,以及其对微博用户行为的影响程度,在此基础上对微博用户行为的表现进行预测,以及微博用户行为对兴趣构成和购买行为的影响;理论方面,主要运用相关的理论基础来解释微博用户行为,并通过一些实证研究对用户行为的具体表征进行统计分析。
基于复杂网络和社会网络的理论研究微博是近年来的一个热点,它能够较好的解释微博用户的信息、评论、转发等行为所呈现的网络关系,也可以从中挖掘出关键用户,可以较好的反映出用户之间的关系,并对用户行为进行预测。李林红和李荣荣认为,新浪微博社会网络是一个自组织系统,从整体网络、个体网络、小团体、小世界效应构建模型,通过实证研究考虑用户在信息“、转发、评论、@、回复”之间的关系,认为微博中存在自组织行为,通常整体的自组织现象弱,局部明显,而且这种关系的形成往往依据用户角度的不同,形成的自组织网的凝聚力也是不同的[5]。易兰丽(2012)利用人类动力学和复杂网络的相关理论,从网络互动的角度出发,对用户的信息、转发和评论行为进行统计分析,了解三者之间的关系,并建立用户信息评论模型和兴趣驱动模型,对微博用户的行为做了较详细的分析[6]。
从以上的分析可以看出,研究者主要是通过直观的静态分布的网络形态表现用户在关注、评论和转发方面的特征,大多是从数学和技术方面考虑,较少地考虑社会因素和用户因素。本文以复杂网络的基本统计特性为基础,以新浪微博为例,通过抓取相关数据,对其进行处理分析,对微博用户的关注行为和转发评论行为的网络特性进行分析,提出微博网络是典型的小世界网络;微博网络较为稀疏,但也存在部分密集的社群,即微博群体;微博网络是一个不均匀的网络,在信息传播与分享方面存在较大的信息不对称。
1数据获取与处理
通过新浪微博的最新数据报告可知,目前新浪微博的用户已超过4亿,同时在腾讯微博、人民网微博等平台上也拥有大量的用户;但在用户总量、活跃用户数量、微博影响力与代表性方面,新浪微博有着显著的优势。所以本文选取新浪微博中的数据作为研究样本,以期能够较好的反映微博的复杂网络特性,完整地呈现微博用户行为的基本特性。
目前获取微博中的数据有两大主流方式:一是通过新浪微博开放端口,利用API平台获取。这种方式获取较为简洁、方便、高效,便是数据数量有一定的限制;二是网络爬虫。通过设定的URL地址,按照一定的爬行策略抓取信息,这种方式获取的信息数量大且全,但是较为繁琐,且效率低,后期数据处理难度也较大。所以本文通过新浪的API平台抓取数据。
本文采用滚雪球抽样的方法,选中其中一个节点,对其粉丝的信息进行抓取,再对粉丝的粉丝信息抓取,持续若干轮,共获取节点信息65 536个、100万余条用户关系信息、10万条微博信息等。抓取的用户信息内容主要包括:用户ID、昵称、姓名、省、市、地区,个人描述、URL、图像URL、性别、粉丝数、关注数、收藏数、创建时间、是否加V、是否允许定位等用户的基本信息,用户评论信息主要包括:评论ID、评论内容、来源URL、方式、时间、者ID、评论者ID等基本信息。微博内容信息主要包括:内容ID、创建时间、具体内容、来源URL、方式、收藏数、时间、者ID等基本信息。以这种方式获取的微博数据使一些孤立的节点和“僵尸粉”也被囊括其中,使得网络密度可能较稀疏;但在很大程度上反映了微博的整体特性,无论是活跃用户,还是僵尸粉,都是分析数据的组成部分。
在进行实际分析的过程中,为了确保分析的准确性和真实性,剔除无效信息后,对获取的64 961条信息进行基本分析。在数据库中,选取1 021个关注信息,组成关注矩阵,对其关注行为进行分析;提取1123*386的微博评论矩阵和1122*537的微博转发矩阵,对微博用户的评论转发行为进行分析。
2微博用户行为的复杂网络特性
2.1小世界网络特性分析
小世界网络最基本的特征是有较短的平均路径长度和较大的聚类系数。用N表示节点数量,dij表示节点之间的最短距离,那么网络平均路径长度的计算公式如下所示:
L=21N(N-1)∑N-11i=1∑N1j=i+1dij
另外,假设节点i与其他Ki个节点都相连,如果这Ki个节点也相互连接,那么它们之间应该有Ki(Ki-1)/2条边;但这Ki个节点之间实际存的边数只有Ei,那么二者之比即为聚类系数Ci,用公式表示如下:
Ci=2Ei1Ki(Ki-1)
关键词:WS小世界网络;甲型HIN1流感;Agent;GIS
中图分类号:R181.3 文献识别码:A 文章编号:1001-828X(2017)010-0-01
引言
流行病研究主流方法建立疾病传播的动力学方程,但方程建立在均匀混合人群的理想状态下,无法描述真实的社会网络中传播的情况[1]。由于小世界网络具有聚类系数大、平均距离小的特点,即使感染强度很小也会引起网络上的广泛传播,许多社会网络具有小世界的特点,而流感传播具有社会网络的特点,研究选取小世界网络对流感时空传播行为特征构建多智能体模型。利用GIS对流行病数据进行空间分析,得出时空传播特征及规律,为应急预警和追踪监测服务。 Agent能够模拟人的智能行为,通过微观的智能体的交互作用来模拟流行病在整个社会网络上传播的宏观情况。
一、实现步骤
流感传播的多智能体模型是在研宄建立复杂网络与智能体模型的基础上,考虑人的地理时空特性,将“个体”人放置在一定的地理环境中,赋予其空间属性。因此,将小世界网络、智能体模型与GIS集成在模型中,使用Repast J平台,利用Java语言,将智能体进行动态模拟,从而动态展示甲流患者在流感传播中的时空特性[2]。
二、概念模型设计
1.模型中智能体的分类
根据流感的传播特征,对经典的SIR模型进行改进,把Agent分成五类.提出了SEITR模型,易感人群Susceptible(S),暴露人群Exposed (E),感染人群Infectious(I),治疗人群Treated(T),恢复人群Recovered(R)。治疗人群有两种状态,一种是患病后就医治疗的人群,另一种是确诊后需要被隔离的人群,因为其在隔离期间也接受治疗,所以这类统称为治疗人群。治愈后的康复人群重新成为普通的Agent,由于治疗后的患者具有一定的免疫能力,所以假定治愈后的康复人群不再被病毒感染。
2.智能体属性特征
资料显示,个体年龄、职业等对流感传播有巨大影响。在设定智能体属性时,一般考虑年龄、职业、教育水平等因素。在判断Agent之间是否存在交互感染时,如果Agent年龄在25-45岁之间或小于5岁和大于65岁,将会有更高的感染几率,而如职业、教育水平等属性,在不同程度上影响着被感染的几率。
3.智能体行为特征
流感主要传播路径是呼吸道飞沫和接触传播,健康 Agent 与具有传染性的 Agent 在一定的空间范围内接触则就可被传播。如果健康 Agent和具有传染性的 Agent 在界定的空间距离范围内直接接触,并满足传播条件,就确定已经被感染。
4.模型环境因素
Agent 的环境因素包括社会和自然因素,社会因素对 Agent 的行为产生影响,自然因素是对自然空间的一种模拟,它为 Agent 提供了一定的活动空间。用 Shapefile格式表达地理空间环境,包括不同图层。
5.节点选择
以往人们针对免疫策略常根据节点在网络中的地位选择。该模型选用三种控制节点方式进行研究:选取度较大节点、选取随机节点、选取“熟人免疫”节点[3]。模拟结果较大节点控制率更高。
三、模型结果分析
研究选取感染概率、就医时间、免疫方式为模型的可调影响因素,并结合实际情况进行调整。为了保证单次模拟结果的准确性,模型在保持其他参数不变的情况下,分别进行 10 次模拟,每次运行时间为三个月,即 90 个 TICK 取平均值为最后结果,结果显示,在无人为干预的情况下疫情爆发两周后达到高峰期,一个月后疫情得到控制并逐渐消亡。但在无人为干预的情况下,感染人数呈指数级增长。在疫情早期实施快速有效的干预手段是降低流感危害的关键。就医时间能较大地影响流感的传播,控制疫情发展的最佳就医时间为 2 天,在这期间能够使新增感染数保持在一个较低的水平;当就医时间大于 2 天时,新增量较高,累计感染人数增加较快,结果表明,流感传播的高危热点区域经历一个少数零星到多数集中变化过程,且被感染的智能体多分布于人口密度较大的区域。人口密度大的区域,潜在接触的人群也就越大,度较大的节点存在的概率也越高。
四、结语
本文在驮油络理论指导下,以甲型H1N1流感为例,结合GIS空间分析技术,构建甲型H1N1流感传播的时空模型。利用历史数据对流感传播情况进行反演。结果表明:模型模拟得出的结果与现实官方公布的数据比较吻合,但由于时间和能力的限制,模型没有很好地充分得到测试和调试,还存在着一定的不确定性,这也是当前研究的下一步工作重点之一。度较大节点在他们患病后传染给他人的概率较大,采取隔离控制措施,如学校停课,减少集会和出行等。但光控制度较大的节点还不够,度较小的节点如果在关键位置也会引发疾病大规模的传播。由此提出一种重要的免疫方法:对比较重点的对象诸如学校师生、医疗相关人员等进行免疫接种,扩大接种范围的随机免疫等,减小甲流传播范围。
参考文献:
[1]张海峰,傅新楚.含有免疫作用的SIR传染病模型在复杂网络上的动力学行为[J].上海大学学报:自然科学版,2007,13(2):189-192.
[2]郝成民,刘湘伟,郭世杰,等.Repast:基于Agent建模仿真的可扩展平台[J].计算机仿真,2007, 24(11):285-288.