2.4 简化网络

partition 将网络的顶点划分为许多互斥的子集。换句话说,一个partition 将网络分割成块。因此,我们可以通过三种方式使用partition 来简化网络:提取一个部分(局部视图),将每一类顶点收缩为一个新顶点(全局视图),或者选择一个部分并收缩相邻类以专注于内部结构和这个类的整体位置(上下文视图)。我们现在讨论三种类型的简化。

2.4.1 局部视图

简化网络最简单的方法是选择一类顶点。当然,仅仅选择顶点并不是很有趣。如果我们想检查网络这一部分的关系结构,我们还必须选择它们之间的所有线 - 当然包含选择它们的环。该操作称为子网提取,其结果称为提供局部视图的导出子网。

  • 要从网络中提取子网,请选择其顶点的子集以及仅与选定顶点相关的所有线。

如果我们想检查南美洲的金属制品贸易,我们可以提取南美洲国家的子网络,如图 20 所示。从图中可以看出,巴西占据中心位置,而法属圭亚那、马提尼克岛和瓜德罗普岛是孤立的。显然,这些岛屿与世界其他地区的国家进行贸易。最后,
在非洲大陆内很重要,因为邻国在网络中的距离也很近。
应用
要提取子网,我们需要一个网络和一个partition ,该partition 定义了我们想要提取的顶点集(类)。因此,提取命令位于Operations菜单中。在本节中,我们使用Imports_manufactures.net和Continent.clu。
要获得南美贸易网络的局部视图,请用Operations> Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters。因为南美是partition 中的第六类,所以在出现的对话框中选择类 6。 Pajek 产生了一个新的网络,其中包含 15 个国家。激活它以获得类似于图 20 的图形。
非常重要的是要注意原始partition 不适合导出子网,因为子网络包含的顶点少于原始顶点。这是一个遗憾,因为我们可能想知道,例如,南美贸易网络中的国家在世界体系中的位置。但是,我们可以通过几个步骤提取与导出子网匹配的新partition 。
Partitions>Extract SubPartition (Second from First)
首先,我们必须选择我们要转换为导出子网的原始partition 作为第一个partition :确保在第一个partition 下拉菜单中选择世界系统partition (图21)。

其次,在第二个partition 下拉菜单中选择您用于提取网络的partition ——在我们的例子中是Continent.clu 。您需要此partition 来识别要从世界位置partition 中提取的顶点子集。最后,从 Partitions 菜单执行命令 Extract SubPartition (Second from First)。一个对话框将询问要提取的类号,如果您输入 6,Pajek 将为 15 个南美国家生成一个新partition 。图 22 显示了使用此partition 绘制的南美贸易网络。

(译者注:从network中提取subnetwor及在partition中提取subpartition用的是同一个partition,network用来描述网络的结构,对顶点的操作,用partition)

2.4.2 全局视图

除了放大网络的特定区域,我们还可以缩小以获得全局视图。现在,我们不再对每个单独的顶点感兴趣,但我们想研究类之间的关系,例如大陆。哪些大洲有牢固的贸易联系?在此示例中,网络的全局视图涵盖了整个世界,但我们应该注意,全局视图也可能与本地环境中的组之间的联系有关。

  • 要缩小网络,请将其顶点的子集替换为一个新顶点,该顶点与原始网络中与该子集的顶点相关的所有线相关。

在网络分析中,我们通过将一个类的所有顶点收缩到一个新顶点来获得全局视图。在我们的示例中,我们将一个大陆内的所有国家缩小到一个代表整个大陆的新顶点(参见图 23)。连接被收缩顶点的线也被替换;例如,南美国家从欧洲国家进口的所有关系都被一条从欧洲指向南美洲的新弧线所取代。它的线值等于所有原始线值的总和。在贸易联系网络中,线值表示以千美元 (US$) 表示的进口价值,因此精简网络中的线值表示金属制品的总进口值。同一类中收缩的顶点之间的线(例如,南美洲国家之间的金属制品贸易)被环所取代。

图 23 显示了按大洲精简的世界贸易网络。为了获得清晰的画面,我们删除了总价值低于 3 亿美元的弧(进口总额)。我们可以看到,南美国家从欧洲进口了总值7.28亿美元的金属制品;但它们并没有大量出口到欧洲,因此南美和欧洲之间存在不对称的贸易关系。大洋洲和非洲国家也在进口而不是出口。南美内部贸易(5.49亿美元)远高于大洋洲和非洲,但欧洲内部贸易最高
应用
命令 Operations> Network + Partition> Shrink Network 根据激活的partition (在本例中为Continent.clu)收缩网络中的顶点类。

首先,我们被要求提供集群之间的最小连接数。这是在缩小的顶点之间必须存在的最小线数,才能在精简的网络中获得新线。我们建议选择 1(默认值)。在第二个条目中,您可以选择不能收缩的一类顶点,以便为它们提供上下文视图。收缩所有类以获得全局视图,因此键入partition 中不存在的任何类号或接受默认值 (0)。

最后,Pajek 收缩除所选类之外的所有类,并将收缩后的网络添加到 Network 下拉菜单中。

Pajek 的 Shrink Network 命令还创建了一个新partition ——称为Shrinking——以及标识partition 中用于收缩原始网络的类的新网络。但是,Pajek 不知道这些类的含义,因此它无法为缩小的类分配有意义的新标签。它选择一个被收缩的类的第一个顶点的标签,并添加一个井号 (#) 以获得收缩类的标签。例如,阿根廷恰好是网络中的第一个南美国家,因此代表这个大陆的顶点在缩小的网络中带有标签“#Argentina”。

我们通过使用 File> Partition> View/Edit 命令(参见第 2.3 节)编辑缩小的partition (“Shrinking”)手动将大洲的名称添加到图 23。

在图 23 中,我们删除了总和值小于 3 亿美元的线以获得清晰的图像。具有低值的线可以使用命令Network> Create New Network> Transform> Remove> Lines with Value> lower than 的命令自动删除。我们输入 300000 作为此操作的阈值,因为进口价值以数千美元计算。

在精简网络中,一类顶点被一个新顶点替换;在我们的示例中,拉丁美洲国家被代表该大陆的新顶点所取代。原始顶点的属性(例如它们的世界系统位置)丢失了:不可能将整个大陆分配给特定的世界系统位置。因此,不可能使用未用于精简网络的partition 中的数据。
Options> Blockmodel – Shrink
请注意,网络的收缩方式取决于在 Options> Blockmodel – Shrink 子菜单中选择的选项。默认情况下,选项 0 被选中,这意味着使用原始网络中的链接数来决定是否在缩小的网络中添加新线路。

此选项使 Pajek 显示在此“应用程序”部分开头提到的对话框。我们建议不要选择其他选项直到你了解第 12 章中介绍的块建模。
环,在这个例子中表示大陆内的贸易,不能在绘图屏幕中绘制。如果已选择选项Options> Lines>Mark Lines> with Values (快捷键 Ctrl-v),则线值将显示在绘图屏幕中(参见图 24),包括非常接近打印的环值到顶点。如果您在绘图屏幕中右键单击一个顶点,则可以更仔细地检查环的值。在编辑网络对话框中列出的行中,您可以找到环,例如从#Argentina 到#Argentina 的行。其线值为 549445,这意味着南美洲国家之间的金属制成品贸易总值为 549,445,000 美元。

2.4.3 上下文视图

全局视图表明南美在世界体系中的地位,局部视图明确巴西在南美贸易网络中的中心地位。但是,这个区域网络中的国家与世界其他地区的关系如何?孤立岛屿从哪些大陆进口金属制品?如果你想专注于一类顶点(例如,一个大陆上的国家)并考虑与“外部世界”的聚合关系,你需要一个上下文视图。

在上下文视图中,除了您特别感兴趣的类之外,所有类都被收缩了。在图 25 中,除南美国家(灰色顶点)外,所有国家都收缩为大陆(黑色顶点)。我们消除了各大洲之间的联系,因为我们通过图 23放弃了总价值低于 1000 万美元的金属制品贸易,以获得一张可理解的图纸而已经知道了它们。该社会图显示了世界贸易背景下的南美国家。显然,非洲和大洋洲不是南美国家重要的贸易伙伴。该大陆上较大的国家从欧洲和北美进口,但较小的国家与北美(巴巴多斯、特立尼达和多巴哥和玻利维亚)或欧洲(乌拉圭、瓜德罗普、马提尼克和法属圭亚那)相连。以前的殖民关系肯定在这里发挥了作用。
有很多方法可以提取或收缩网络,甚至可以将提取和收缩结合起来。当社会网络图的结构过于复杂而一眼看不明白时,子网提取和收缩就是剖析网络和获得网络部分视图的重要技术。
应用
通过部分收缩网络获得上下文视图,因此我们可以使用Operations>Network + Partition>Shrink Network命令。在询问不应缩小的类别的对话框中,键入适当的班级编号,即南美洲的班级 6。总和值小于 1000 万美元的行可以使用命令 Operations> Network + Partition> Shrink Network Network> Create New Network> Transform> Remove> Lines with Value >lower than。如果您有一个partition 可以识别缩小网络中的大陆,则大陆之间的线可以自动删除。您可以使用 Network> Create Partition > Vertex Labels Matching Regular Expression 命令创建此partition 。只需输入 ^# 即可选择所有以 # 开头的标签。现在,您可以执行命令 Operations> Network + Partition> Transform> Remove Lines> Inside Clusters 来删除 continents 类中顶点之间的线(在我们的例子中,类 1,在对话框中输入 1)。

2.5 向量和坐标

partition 存储顶点的离散属性,向量存储连续属性。原则上,连续属性可以取定义范围内的任何值;例如,一个国家的表面可以取零平方公里(或英里)和地球总表面之间的任何值。当两个国家的面积不同时,总是可以想象一个国家比一个小,一个比另一个大。
在实践中,当然,我们并不关心小于一平方公里的国家的大小差异,但原则很重要:连续属性并不意味着将顶点分组,因此它们不能用于通过提取来减少网络或缩小。连续属性表示顶点的特定且通常是唯一的值,例如,由人均国内生产总值 (GDP) 表示的国家财富。在实践中,没有两个国家的人均 GDP 完全相同,因为它等于一个国家的经济产出与其人口规模的商,这两者通常是其他国家所没有的数字。大多数商产生小数的结果,因此向量不是整数列表,而是实数列表。

  • 向量为网络中的每个顶点分配一个数值。

在我们对partition 的讨论中,我们区分了结构索引和属性。这种区别也适用于连续属性或向量。在后面的章节中,我们会遇到几个表示顶点结构特征的向量示例,例如它们的中心性(第 6 章)。GDP独立于网络测量并作为附加数据添加到图中的连续属性:它是连续属性。
向量存储数量,用于计算,例如平均中心度,并显示为大小,例如顶点大小或线宽。一些产生整数分数的结构特征用于计算,而不是用于将网络划分为子网。在这种情况下,Pajek 可以将整数值存储为向量而不是partition 。无论如何,向量可以转换为partition ,反之亦然,正如我们将在应用部分看到的那样。
顶点的一个特殊的连续属性是它在社会图中的位置。位置由坐标表示,实数对应于一个或多个轴上的位置。例如,二维绘图屏幕有两个轴,一个水平 x 轴和一个垂直 y 轴。两个轴的范围从 0 到 1(参见图 26)。

屏幕上顶点的位置由两个坐标确定(例如,加拿大位于 x 轴上的 0.14 和 y 轴上的 0.33)。
因为坐标是实数,它们可以存储为向量:一个表示顶点在 x 轴上的位置,另一个表示在 y 轴上的位置。在图 26 中,我们做了一些特别的事情:我们确保 Draw 屏幕中的位置与投影在网络后面的世界地图上的地理位置相匹配(有关如何生成此图像的详细信息,请参见附录 2)。现在,向量表示地理坐标,我们可以在社交网络中看到地理模式。
应用
在 Pajek 中,向量有自己的下拉菜单。可以像网络或partition 一样打开、编辑和保存向量(例如GDP_1995.vec,其中包含 1995 年的人均 GDP)。可以从 Vector> Info 命令的输出中收集基本信息。当你执行这个命令时,你可以请求一个最高或最低向量值的列表。在第二个对话框中,您可以指定将在频率分布中报告的值类别的数量或边界(图 27)。

请注意,向量值应该是连续的,因此每个值可能只出现一次。因此,将每个单独的值列为频率表中的条目是没有信息的;值必须加入到类中。您可以列出必须用作类边界的选定值(如图 27 中所示),或者指定以井号 (#) 开头的类数。

在报告屏幕中,Vector> Info 命令输出一些关于向量值的统计信息;

例如,它告诉我们人均 GDP 从 115 美元到 43,034 美元不等,平均为 10,249.94 美元,标准差(Standard deviation)为 10,834.75 美元。然后它打印请求的频率表,如表 2 所示。该表的第一个条目包含 22 个人均 GDP 从最低值到 2,000 美元(含)的国家。第二个条目包含人均 GDP 超过 2,000 美元至 10,000 美元(含)的 27 个国家,以此类推。在第一列中,圆括号表示“来自”,方括号表示“直到并包括”。
正如我们之前讨论过的,partition 和向量有不同的应用:partition 用于从网络中选择顶点子集,而向量指定可用于计算的数值属性。但是,有时您可能希望将partition 更改为向量,反之亦然。将partition 转换为向量非常容易:只需使用“Partition>
Copy to Vector”命令即可。但是请注意,只有当partition 中的类表示数量时,转换才有意义——比如它们是可以有意义地进行加法、减法等的数字。
Vector> Make Partition> Copy to Partition by Truncating (Abs)
将向量转换为partition 更为复杂,因为您必须将实数变为整数,这可以在 Vector> Make Partition 子菜单中以多种方式完成。截断是最简单的方法,这意味着您从向量中的实数中删除小数,以获得可以存储在partition 中的整数。人均 GDP 为 115 美元,最高但不包括 116 美元,在新partition 中更改为 115 类。在命令中,Abs 代表 absolute,这意味着将负向量值转换为正类数,因为partition 不能容纳负整数。
将向量转换为partition 的另一种方法是将向量值重新编码为固定宽度的类;例如,将人均 GDP 重新编码为间隔 10,000 美元的类。使用 Vector> Make Partition> by Intervals> First Threshold and Step ,并指定最低类的上限作为第一个阈值(例如,10000 用于包括最小值至 10,000 且包括 10,000 的类)和类宽度作为步长(例如,再次填写 10000)。请注意,Pajek 不接受将千与百分隔的逗号。
在人均 GDP 的情况下,将值转换为具有固定宽度的类并不是很有用。人均国内生产总值分布不均,因此许多国家被归为最低阶层,而较高阶层则包含少数国家。在本例中,最好使用 Vector> Make Partition> by Intervals> Selected Thresholds 命令创建宽度不等的类,即用于低值的窄类和用于较高值的较宽类。在对话框中,指定类之间的边界(例如,2000、10000 和 20000)。只需键入以空格分隔的数字,不要使用的 <=。对话框中 <= 符号表示所有类都包括上边界。
Draw> Network + First Vector Draw> Network + First Partition + First Vector Options> Size> of Vertices
在社会图中,如果使用绘图菜单中 Network + First Vector 或 Network + First Partition + First Vector,向量值由顶点的大小表示的。顶点的面积与其向量值成正比。请注意,人均 GDP 从 115 美元到 43,034 美元不等,但在绘图屏幕中,顶点的大小通常在 2 到 4 之间。如果您绘制一个向量大小在 115 到 43034 之间的网络,则顶点太大以至于它们不适合在屏幕中。

Pajek 可能会发出警告,指出它会更改顶点的大小。

如果顶点仍然太大,您可以调整向量值以在绘图中获得合理的大小。绘图屏幕的Options> Size> of Vertices命令提供了实现此目的的最简单方法。在此命令发出的对话框中,输入 0 以激活 Pajek 的 AutoSize utility功能,它会自动计算最佳顶点大小。

在图 28 中,

根据向量值,人均 GDP 较高的国家具有较大的顶点。我们可以看到,最富裕的国家是核心和强大的半外围的一部分,但请注意,地理位置也很重要;斯堪的纳维亚国家(图中红色顶点)的人均 GDP 相似(高),无论它们属于核心(瑞典)还是半边缘国家(挪威、丹麦和芬兰)。
用顶点大小表示向量值对负数没有用处,因为负数是没有意义的。 Pajek 在计算图形中顶点的大小时会忽略向量值的负号。具有大负值的顶点与具有大正值的顶点一样大,这是很容易引起误解的。始终使用 Vector> Info 命令检查是否存在负向量值。 Draw> Network + First Vector + Second Vector Vector> Transform> Normalize> Max [Draw] Options> Size> of Vertices
注意,你也可以用两个向量(Network + First Vector + Second Vector)画一​​个网络。在第一个向量下拉菜单中选择第一个向量,在第二个向量下拉菜单中选择第二个向量。第一个向量将定义顶点在水平方向的大小,第二个向量将定义垂直方向的大小。在这种情况下,顶点将被绘制为椭圆而不是圆形。例如,您可以使用Population_1995.vec作为第一个向量,将GDP_1995.vec 作为第二个向量。

如果现在单击Draw> Network + First Vector + Second Vector命令,生成的图形将不会提供信息,因为这两个向量是在不同的比例尺上测量的。

最好先对它们进行归一化,在这种情况下,我们建议将向量值除以最大值:对向量执行 Vector> Transform> Normalize> Max 命令。

带有两个新向量的绘图会更好,

尽管您可能希望增加顶点大小([Draw] Options> Size> of Vertices)以更清楚地了解人口少且人均 GDP 大(垂直拉伸)的国家和有较大人口但人均 GDP 低的国家(横向拉伸)。可以有一个partition 来决定这个绘图中的顶点颜色(Draw> Network + First Partition + First Vector + Second Vector)。
向量值也可以在绘图屏幕中显示为顶点标签:Options>Mark Vertices Using> Vector Values。在大多数网络中,结果在视觉上不是很吸引人,但它是检查绘图中顶点的精确向量值的好方法。
FishEye> Cartesian, Polar, Factor
如果布局更密集(如图 28 中的那个),您可能会发现 Draw 窗口主菜单中的 FishEye 放大镜工具非常有用。通过选择笛卡尔Cartesian或极坐标Polar变换,您可以将绘图窗口置于鱼眼模式。当绘图窗口处于鱼眼模式时,将鼠标指针悬停在绘图窗口上会放大鼠标指针周围的区域。通过将 Factor设置得更高或更低(默认值 3),您可以增加和减少鼠标指针周围的放大倍数。当您想退出 FishEye 模式时,只需在绘图窗口的某处单击鼠标按钮即可。 Pajek 会询问您是否要保留获得的布局。通过答“是”,您将保留顶点的当前位置。回答“否”,您会将顶点的位置恢复到进入 FishEye 模式之前的位置,这也是 FishEye>Exit 的结果。
下图是factor=20的效果

这是factor=8的效果

Operations> Vector + Partition> Extract SubVector
在第 2.4.1 节中,我们学习了如何选择网络的一部分(例如,一个大陆国家之间的金属制品贸易)以及如何减少partition 以适应提取的网络。以类似的方式,我们可以将向量调整适应导出子网。回想一下,我们需要一个partition 来提取网络;为了从网络中提取一个大陆的国家,需要根据大陆划分国家。我们可以使用相同的partition 来提取所选国家的向量值,例如人均GDP。首先,确保在 Partition 下拉菜单中选择了用于精简网络的partition 。接下来,在 Operations> Vector + Partition 菜单中执行命令 Extract SubVector。就像提取partition 的命令一样,Extract SubVector 命令要求用户选择必须提取的顶点类或类范围:输入 6 以选择南美国家。最后,Pajek 将简化的向量添加到向量下拉菜单中。
Operations> Vector + Partition> Shrink Vector
为了获得全局或上下文视图,我们收缩网络(参见第 2.4.2 和 2.4.3 节)。回想一下,一类顶点被一个收缩网络中的一个新顶点替换;我们用代表大陆的顶点替换了属于同一大陆的所有国家。要使用与原始网络相关的向量值(例如,一个国家的人均 GDP),我们还必须缩小向量。 Operations> Vector + Partition 子菜单中的 Shrink Vector 命令可以完成此操作,前提是您选择了相关向量和要用于收缩的partition ,即 Continent.clu。该命令允许您在将被缩小的类中的顶点的总和、平均值、最小值、最大值或中值之间进行选择。在人均 GDP 的例子中,计算一个大陆人均 GDP 的平均值或中位数是有意义的。
如前所述,顶点的坐标可以被认为是向量。在第 1 章中,我们了解到顶点的坐标保存在网络数据文件中,因此我们不需要向量来存储顶点的位置。但是,如果您想使用预定义的地理坐标或来自具有相同顶点的另一个网络中的一个网络的坐标,则坐标向量很有用。如果你有一个矩阵中所有顶点(或任何其他向量)的坐标,这些顶点的排序顺序与网络中的相同,每个坐标(或向量)的简单文本文件或一个包含 Pajek 可以读取的所有坐标(或向量)的文本文件( File> Vector> Read )。有关示例,请参见文件 x_coordinates.vec、y_coordinates.vec 和 world_coordinates.vec。请注意,该文件不应包含制表符或其他特殊字符。
您可以使用Network>Create Vector>Get Coordinate命令将顶点的当前坐标保存为向量。您必须分别为每个轴创建一个坐标向量。Operations>Network + Vector>Transform>Put Coordinate命令从向量加载坐标:每个轴一个向量。在我们的示例中,国家的地理位置可以从两个向量中读取:x_coordinates.vec 和 y_coordinates.vec。请注意,保存和加载命令列在不同的菜单中。为了保存坐标,你只需要一个网络,但是为了从一个向量加载坐标,你需要一个加载的向量和一个要添加坐标的网络。因此,加载命令位于操作菜单中。
选项> 变换> 适合区域
当您从不是由 Pajek 创建的文件中加载坐标时,绘图屏幕可能是空白的。如果坐标不在 0 和 1 之间的范围内,则会发生这种情况。在这种情况下,使用绘图屏幕中的Options>Transform> Fit Area区域命令,Pajek 将使社会图适合屏幕的大小。 Options> Layout> Real xy Proportions Networks> Union of Vertices
现在您已经掌握了绘制图 26 的知识:以地图为背景的网络。基本技巧是将地图设想为具有零大小顶点的网络。网络World.net 代表世界地图(或多或少是墨卡托投影),前提是 Draw 屏幕是方形的。如果设置了 Options> Layout> Real xy Proportions,则调整大小会被限制为正方形。顶点是不可见的,因为它们的形状设置为空(见附录 2)。现在我们有两个网络:地图和贸易关系。如果我们从 x_coordinates.vec 和 y_coordinates.vec(见前面)中添加地理 x 和 y 坐标,我们只需要组合两个网络:在第一个网络下拉菜单中选择 World.net,第二个网络下拉菜单包含带有地理坐标的贸易网络,使用 Networks>Union of Vertices 命令完成​​。

2.6 网络分析与统计

本章我们在社交网络分析中使用顶点的属性;例如,我们将各国的人均 GDP 与其在贸易网络中的视觉位置进行比较。我们发现,世界贸易体系核心国家的人均 GDP 高于外围国家。因此,社交网络分析处理关系数据以及顶点的属性。
人均 GDP 等属性通常使用统计技术进行分析。例如,将人均国内生产总值与人口增长和教育水平进行比较,以找出国家的哪些属性相关联。在人口增长较低和教育水平较高的国家,人均 GDP 较高。统计提供了广泛的技术来描述属性和研究属性之间的关联。但是,如果我们能够将顶点的结构属性表示为参与者的 attributes or propertie,则可以将它们包含在统计分析中以确定它们的关联。国家在世界体系中的位置就是这种情况,它是从世界贸易网络中计算出来的,并存储在一个partition 中。连续结构索引,例如顶点中心性(第 6 章),可以存储为向量。
在本书中,给出了一些统计分析的例子,但仅限于 Pajek 中包含的基本统计技术。毕竟,这不是一本关于统计的书。尽管如此,应该很好地理解统计和社交网络分析之间的联系,因为这两种技术构成了强大的组合。
应用
Pajek 中实现的基本统计技术之一是两个partition 的交叉制表以及两个partition 表示的分类之间的一些关联度量。让我们看看世界贸易的例子。我们在世界贸易网络中的位置划分源于 1994 年左右的金属制品贸易。此外,我们可以根据 Smith 和White 提出的 1980 年国家在世界体系中的位置对国家进行分类(World_system_1980.clu)。为了分析从 1980 年到 1994 年国家在世界体系位置之间的转变,我们可以使用简单的统计技术。
首先,我们必须选择要比较的两个partition 。在第一个partition 下拉菜单中选择 World_system_1980.clu。接下来,在第二个partition 下拉菜单中World_system.clu。获得一个交叉制表和关联度量,选择的partition 必须引用相同的网络:相同数量的顶点以相同的顺序。比较不完全引用相同顶点的partition 是没有意义的。
其次,从 Partitions 菜单中选择Partitions> Info> Cramer’s V, Rajski, Adjusted Rand Index 命令。

Pajek 将在报告屏幕中显示交叉表和一些关联度量。

表 3 包含 Info 命令的结果。在交叉表中,行包含根据 1980 年世界体系位置的四个类别:1 类核心国家、2 类强半外围国家、3 类弱半外围国家和 4 类外围国家。列包含三个世界1994 年的系统位置:1 类核心国家,2 类半边缘国家,3 类边缘国家。世界系统位置未知的国家会被 Pajek 自动忽略;他们的总数列在表格下方。因此,第一列代表了 1994 年贸易体系核心的十二个国家中的十一个。我们不知道中国在 1980 年的世界体系位置,因此将其放在 World_system_1980.clu 中的 999999998 类中partition ,作为缺失值处理。请注意,在“partition ”菜单中交换第一个和第二个partition 时,行和列会被交换。从这张表中,我们可以得出结论,在 1980 年和 1994 年之间,核心的组成几乎没有变化(参见交叉表中标有“1”的行和列)。 1980年处于强弱半外围的国家构成了1994年半外围的主要部分(第2栏),4个国家从1980年的半外围提升到1994年的半外围(行4列2)
关联的统计指数告诉我们关联有多强。指数范围从 0 到 1,根据经验,我们可以说 0 到 0.05 之间的值表示没有关联,0.05 到 0.25 之间的值表示弱关联,0.25 到 0.60 之间的值表示中等关联,并且高于 0.60 的值表示强关联。
在 Pajek 中,计算了三种类型的关联指数:Cramer’s V、Rajski’s information index 和 Adjusted Rand Index。 Cramer’s V 衡量两个分类之间的统计相关性。如果交叉表包含许多(几乎)为空的单元格,则不是很可靠,因此如果是这种情况,Pajek 会发出警告。 Rajski 的指数衡量一个分类中的信息在另一个分类中保留的程度。它有三个变体:一个对称版本,在 Pajek 的输出中由 (C1↔C2) 表示,以及两个不对称版本,它们表示第一个分类可以在多大程度上被第二个分类预测 (C1←C2 )或第二个分类可以由第一个分类(C1→C2)预测。 Adjusted Rand Index (ARI) 是两个partition 之间相似性的另一个指标。它的值范围从最小值 0(独立partition - 无关联)到最大值 1(相同partition - 最大关联)。在我们的示例中,Cramer 的 V 不是很可靠,因为许多单元的预期频率较低。 Rajski 的信息指数表明,从 1980 年的位置可以很好地预测 1994 年的世界系统位置:Rajski C1→C2 为 0.68。这两个世界系统的位置是密切相关的。调整后的兰德指数 (0.33) 表明两个partition 之间存在适度关联。

2.7 小结

在本章中,我们使用顶点的属性来查找和解释网络中的关系模式。这些属性存储在partition 或向量中。partition 和向量都是数字列表,网络中每个顶点都有一个数字,但partition 中的数字指的是离散类,而向量值表示顶点的连续属性。partition 中的类用整数表示(例如,非洲大陆的国家有代码,不允许使用负类号。向量包含实数,可以是负数)社交网络通常庞大而复杂。为了理解网络结构,首先研究网络的约简是有帮助的。可以通过两种方式使用partition 来减少网络:提取和收缩。提取是从网络中选择顶点子集以及这些顶点之间的线。您现在可以专注于网络的一部分的结构,这称为局部视图。相反,缩小网络意味着您将一系列顶点和与这些顶点相关的线集中在一起(例如,您将所有非洲国家替换为一个代表非洲大陆的顶点)。如果所有类都被缩小,这将产生网络的全局视图,如果一个顶点类没有被缩小,则产生上下文视图。在所有情况下,partition 的类定义了提取或收缩的顶点子集。不基于其在网络中的结构位置的社会行为者的属性称为属性。它们被添加到网络中以增强对其结构的分析和解释。然而,partition 和向量也可以包含顶点的结构索引,这些索引来自网络分析(例如,从贸易网络中推断出的国家的世界体系位置)。这些属性可能包含在统计分析中,因此partition 和向量是社交网络分析和统计数据之间的纽带

Exploratory Social Network Analysis with Pajek(第三版)2-2相关推荐

  1. Exploratory Social Network Analysis with Pajek(第三版)11

    11.家谱和引文 11.1 引言 时间造成了社会关系中一种特殊的不对称,因为它以不可逆转的方式对事件和世代进行排序.社会身份和地位部分地建立在共同的祖先之上,无论是在生物学意义上(出生)还是在智力上: ...

  2. Exploratory Social Network Analysis with Pajek(第三版)8

    八.扩散 扩散是一个重要的社会过程.管理者对信息和意见的传播感兴趣,制造商寻求采用新技术和产品,我们所有人都对不感染传染病有着浓厚的兴趣.传播科学.社会心理学和社会学.公共管理.市场营销和流行病学正在 ...

  3. Exploratory Social Network Analysis with Pajek(第三版)2-1

    二.属性和关系 2.1 引言 在第 1 章中,我们认为社会网络分析侧重于社会关系.网络由一系列顶点和线构成.顶点和线都具有我们希望在分析中包含的特征(例如,人的性别和他们的关系强度).如第 1 章所述 ...

  4. Exploratory Social Network Analysis with Pajek(第三版)12

    第五部分建模 在​​最后一部分,我们将注意力从纯粹的网络结构探索性描述转移到建模上.介绍了两种类型的建模:块模型(第 12 章)和随机图模型(第 13 章). 内聚性.中介和等级与社会角色相关:成为团 ...

  5. Exploratory Social Network Analysis with Pajek(第三版)7

    七.经纪人和桥 7.1 引言 有很多朋友和熟人的人有更好的机会获得帮助或信息.因此,社会关系是衡量社会资本的一种方式,是一种可以被行为者用来获得积极优势的资产.然而,网络分析师发现,除了联系的数量之外 ...

  6. Exploratory Social Network Analysis with Pajek(第三版)3

    第二部分 内聚性 团结.共同规范.身份认同.集体行为和社会内聚性被认为是从社会关系中产生的.因此,社交网络分析的首要问题是调查谁是相关的,谁不是.为什么有些人或组织是相关的,而有些则不是?这里的一般假 ...

  7. Exploratory Social Network Analysis with Pajek(第三版)1-1

    文章目录 第一部分基础 一.寻找社会结构 1.1 引言 1.2 社会计量学和社会学图 1.3 探索性社会网络分析 1.3.1 网络定义 1.3.2 操作 第一部分基础 社交网络分析侧重于例如人.人群. ...

  8. Exploratory Social Network Analysis with Pajek(第三版)6-1

    第三部分 中介 在很多理论中,社会关系被认为是人与人或组织之间传递信息.服务或商品的渠道.从这个角度来看,社会结构有助于解释信息.商品甚至态度和行为如何在社会系统中扩散.网络分析揭示了社会结构并有助于 ...

  9. Exploratory Social Network Analysis with Pajek(第三版)6-2

    6.4 介数 度和接近中心度是基于一个人在网络中的可达性:信息到达一个人的难易程度.中心度和中心性的第二种方法基于这样一种观点,即如果一个人作为通信网络中的中介更重要,那么他或她就更中心化.一个人对于 ...

最新文章

  1. chrome jssip
  2. Python3 pip安装包时报错 error: Microsoft Visual C++ 14.0 is required.解决办法
  3. macbook所有型号大全_苹果笔记本型号大全
  4. linux 批量删除进程的两种方法
  5. lol游戏挂机软件_“本不想挂机,但系统不让重连!”LOL成“挂机联盟”,5局3挂机...
  6. 输入法应提供不同工作下的字词频率模式
  7. SQL 2012 安装教程
  8. 新发现几个百度网盘/阿里云盘搜索资源站,还能查询网盘提取码
  9. 成语小秀才小程序V2.0.14完整安装包+小程序前端,小程序吸粉引流源码
  10. 固体发动机内弹道matlab,固体火箭发动机内弹道性能的仿真研究
  11. 小项目一:使用fping统计网络中主机的网络连通情况
  12. 凑单这个技术活,阿里工程师怎么搞?
  13. 救命啊!还是讨厌的中文问题
  14. 域账号加到本机管理员组和本机Power Users组
  15. 大吉大利-今晚吃鸡-枪械
  16. Airbnb产品运营数据分析
  17. 移动Web:媒体查询及手机端PC端识别
  18. idea启动过多导致C盘空间不足
  19. 最优性理论(无约束)
  20. java中的值传递和引用传递2原文:http://blog.csdn.net/niuniu20008/article/details/2953785...

热门文章

  1. 电子海图基本概念介绍
  2. 2021年茶艺师(中级)考试题及茶艺师(中级)考试报名
  3. 银联支付(亲测成功)
  4. python读取多列csv文件_多列上的csvjoin
  5. 飞机大作战java源代码_java实现抖音飞机大作战
  6. iphone手机系统回退、降级
  7. C/C++二进制,八进制, 十进制和十六进制的表示方法
  8. BBUCTF XOR题解
  9. 白山云荣获信通院“2021年度SASE优秀案例”奖
  10. docker 安装 redis6.0.8