UCINET软件是由加州大学欧文(Irvine)分校的一群网络分析者编写的。对该软件进行扩展的团队是由斯蒂芬·博加提(Stephen Borgatti)、马丁·埃弗里特(Martin·Everett)和林顿·弗里曼(Linton Freeman)组成的。
社会网络分析是最近非常流行的一种社会科学研究方法,当然,这种分析思想不仅仅是社会科学领域,其实很多自然科学领域也在研究网络,复杂网络;过去我们的研究数据基本上都是属性数据,例如:性别、年龄、收入、态度、价值观等等,但我们都是生活在一个特定社会环境中,我们的行为都受到其他人的影响;有人说:传统的抽样调查强调随机性,这就象社会科学研究的一种“绞肉机”,把个体从其所在的社会情境中剥离出来,还要确保研究对象之间不存在联系。常规统计分析处理的都是属性数据,社会网络分析处理的则是关系数据,其分析单位是“关系”,是从“关系”角度出发研究社会现象和社会结构,从而扑捉由社会结构形成的态度和行为。
目前最流行的社会网络分析软件是UCINET,Ucinet网络分析集成软件,其中包括一维与二维数据分析的NetDraw,还有正在发展应用的三维展示分析软件Mage等,同时集成了Pajek用于大型网络分析的Free应用软件程序。UCINET为Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。
与UCINET捆绑在一起的还有Pajek、Mage和NetDraw等三个软件。UCINET能够处理的原始数据为矩阵格式,提供了大量数据管理和转化工具。该程序本身不包含网络可视化的图形程序,但可将数据和处理结果输出至NetDraw、Pajek、Mage和KrackPlot等软件作图。UCINET包含大量包括探测凝聚子群(cliques,clans,plexes)和区域(components,cores)、中心性分析(centrality)、个人网络分析和结构洞分析在内的网络分析程序。UCINET包含为数众多的基于过程的分析程序,如聚类分析、多维标度、二模标度(奇异值分解、因子分析和对应分析)、角色和地位分析(结构、角色和正则对等性)和拟合中心-边缘模型。此外,UCINET提供了从简单统计到拟合p1模型在内的多种统计程序。
默认情况下,UCINET使用Windows记事本显示结果。这很方便,因为每个人都知道如何使用它。但是,它具有重要的局限性。它只能在一行上处理1024个字符。因此,如果您显示一个大型数据集,例如具有500列和许多小数位的矩阵,则该矩阵将无法容纳,并且将以难以理解的方式环绕。一个解决方案是使用另一个文本编辑器。我使用wordpad.exe,主要是因为ucinet附带了它。 要在ucinet中开始使用它,请转到“选项” |“帮助程序”。在要求文本编辑器的地方,输入“ wordpad.exe”。您不需要知道完整的路径名,Windows会找到它。 如果您选择wordpad.exe,则需要确保设置正确。在写字板中,转到“主页”选项卡,将字体设置为“ Courier New”。然后在“视图”选项卡中,将“自动换行”设置为“不自动换行”。
有多种方法可以将UCINET DL文件读入R。这些方法涉及将UCINET系统文件(扩展名为## h和## d的文件)导出到DL文本文件的额外步骤 。
有很多方法可以将数据输入UCINET。如果您的数据是压缩格式(例如节点列表或边列表),则最简单的操作通常是在Excel中输入数据,然后将其从Excel剪切并粘贴到DL编辑器中。这是一个节点列表的示例:
区分两种形式的丢失数据:节点级别和联系级别。节点级别是受访者根本不回答调查的网络部分的地方,就好像他们不是研究的一部分一样。领带等级缺失数据是他们选择不对特定演员(例如老板)进行评估,而是为其他演员做出回答的地方。(或者,在观察性研究中,未选择要观察的给定对,因此未知它们如何相互作用。)
Tie level的缺失数据(如果不是过多的话)可以通过标准插补方法来处理,例如Ward,Hoff和Lofdahl(2003)方法,我们将不对其进行进一步讨论。
Node level丢失数据更成问题。使用两种主要策略来处理它。首先,您可以完全忽略丢失的节点,就好像它根本不存在一样。从矩阵的角度来看,如果原始数据矩阵具有50行和列,则新矩阵现在将具有49行和列。
另一种方法是估算丢失的数据,这意味着猜测如果有机会,该人将回答什么。有多种方法可以执行此操作,包括通过拟合ERG模型对数据集进行建模,然后使用基于ERGM参数的最大似然估计值填充缺失的数据。但是简单的方法如下。
Undirected(逻辑对称数据)
首先,让我们考虑一种无向关系(即逻辑上对称的社会关系)的情况。在这种情况下,简单的策略是假设如果受访者回答了,他的回答方式将与其他人对他的回答相同。简而言之,数据矩阵中人的列(人们对此有何评论)用于填写人所在行的值,而该行的值丢失了。
在UCINET中执行此操作的简单方法是通过未记录的 矩阵代数 命令 replacena。给定输入矩阵A和B, replacena 例程将A中找到的所有缺失值更改为B中相应的值,并将结果保存在新矩阵C中。例如,键入
-> C = replacena(AB)
要求程序创建一个新的数据集C,如果aij丢失,则cij = bij,否则,cij = aij。
那么,您如何使用此方法将缺失的值替换为其他人所说的呢?在失踪人员专栏中提供了有关其他人对失踪人员说什么的信息。因此,当我回答调查问卷时,您cij = aij,但当他们未回答时,您为aji。换句话说,您想使用矩阵的转置。因此,如果A是原始数据矩阵,则要创建一个新版本,称为A-cleaned,如下所示:
-> A清洗= replacena(A 转置(B))
Directed(逻辑非对称数据)
如果网络是定向的,例如谁向谁提供建议,我们就不能使用上面的技巧,因为没有理由说如果我给别人J提供建议,那么人j给我I提供建议。但是如果我们可以做一些非常相似的事情* if *我们有远见,可以在两个不同的方向上询问有向关系。通过单独的指示,我的意思是每当您询问“您向谁寻求建议”(GET)时,您还询问“谁向您寻求建议”(GIVE)。这些中的每一个都创建自己的矩阵,并且您可以用来互相填充,因为如果我从j寻求建议,那么我们希望j会报告我向他们求助。现在,如果我不填写调查问卷,那么处理丢失数据的一种方法是假设我在“请咨询”矩阵中的行类似于“ replacena 填写缺少的值,如下所示:
-> CLEANEDGET = replacena(获取 转置(GIVE))
-> CLEANEDGIVE = replacena(GIVE, 转置(GET))
在Ucinet 6.549和更高版本中,此选项在菜单系统的“转换”下也可用。
本指南对UCINET进行了快速介绍。假定该软件已与数据一起安装在文件夹C:\ Program Files \ Analytic Technologies \ Ucinet 6 \ DataFiles中,并且已保留为默认目录。 启动UCINET时,将显示以下窗口。
子菜单按钮可访问UCINET中的所有例程,这些例程分为文件,数据,转换,工具,网络,可视化,选项和帮助。请注意,位于这些按钮下方的按钮只是子菜单中调用例程的快速方法。底部给出的默认目录是UCINET拾取所有数据并存储任何文件(除非另有说明)的位置,可以通过单击右侧的按钮来更改此目录。
要运行UCINET例程,我们通常需要指定UCINET数据集并提供一些参数。如果可能,UCINET会选择一些默认参数,用户可以更改这些默认参数。请注意,UCINET附带了许多标准数据集,这些数据集将位于默认目录中。运行例程后,屏幕上会显示一些文本输出,通常UCINET数据文件包含的结果将再次存储在默认目录中。
我们将运行度中心度例程,以计算标准TACINET数据集TARO中所有参与者的中心度。首先,我们突出显示“Network|Centrality and Power|Degree”,然后单击
这将弹出一个框,如下所示
如果单击帮助按钮,则将打开一个如下所示的帮助屏幕。帮助文件提供了例程的详细说明,说明了参数并描述了将出现在日志文件和屏幕上的输出。
关闭帮助文件,然后通过单击选择文件按钮或键入名称来选择TARO数据进行分析,如下所示。
现在,单击“确定”以运行例程以获取以下内容。
这是一个文本文件,提供例程的结果。请注意,您可以向下滚动以查看更多文件。可以保存或复制此文件并将其粘贴到文字处理包中。关闭UCINET时,该文件将被删除。关闭此文件。
请注意,在程序运行时,我们还创建了两个新的UCINET文件,一个称为TARO-deg,另一个称为TARO-degcz。我们可以使用“显示数据集”按钮查看新的UCINET文件。这是“工具”子菜单下方的D按钮(请参见第一个图表)。单击D直接进入打开文件菜单,并绕过一些使用Data | Display时可用的显示选项。单击显示,然后选择TARO-deg。您应该获得以下内容
请注意,此文件具有所有集中度的度量,但是没有日志文件中生成的描述性统计信息。
矩阵编辑器可用于修改或查看数据。对于将UCINET数据(例如集中度得分)传输到Microsoft Excel或SPSS,它也很有用。请注意,尽管可以使用矩阵编辑器来输入数据,但dl编辑器提供了一种更复杂,更灵活的数据输入方式,本入门指南稍后将对此进行介绍。如果单击“矩阵编辑器”按钮或在“数据”下单击“矩阵编辑器”,将打开“矩阵编辑器”并获取以下内容。注意,我们在下面的编辑器中标注了重要的按钮和区域。
要查看编辑器中数据集的外观,请单击文件,然后打开并选择PADGETT。这是具有两个关系和标签的非对称二进制数据集。一旦打开,它将看起来像这样。
我们在左下角看到两个关系PADGM和PADGB,单击选项卡更改表,我们正在查看不同的关系。标签沿行和列重复,并位于阴影区域。我们看到数据有16个参与者,如右侧的尺寸框所示。可以从电子表格中编辑和保存此数据。
单击Netdraw按钮 以启动Netdraw。这将导致一个新窗口,如下所示。我们已经注释了最重要的按钮。
要使用Netdraw,首先加载网络很重要。我们将加载Dave Krackhardt收集的标准UCINET数据集。单击加载文件按钮,然后键入或选择文件Krack-Hig-Tec
然后单击“确定”,您应该看到类似这样的内容。
现在,您将看到此数据与“Advice”,“ Friendship”和“Reports”具有三个关系。如果勾选了某个关系,则显示与之相关的边。现在,我们将引入与此数据关联的属性文件,称为High-Tec-Attributes。单击“再次加载文件”按钮,再次加载文件,还单击“数据类型”下节点属性的单选按钮,这样您就可以
请注意,您也可以单击加载按钮右侧的按钮(带有A),这将打开相同的框,但选中了属性按钮。单击变换>节点属性编辑器,您将看到节点属性编辑器打开如下。
您可以使用此编辑器来更改或添加新属性。
我们将根据年龄调整节点大小,按部门着色并根据级别对其进行塑形。关闭属性编辑器,然后单击颜色节点按钮。这将打开颜色框,单击“选择属性”按钮并选择部门,如下所示
这将为五个部门提供5种颜色。现在,单击“更改节点的形状”按钮并执行相同的过程,但选择级别并单击框底部的对勾。
这将产生三个形状。要根据年龄调整节点大小,您需要选择
单击属性>节点>符号>大小>基于属性,然后选择年龄,将其他值保留为默认值。这将导致以下结果。
要导出图以用于出版物中或读入文字处理包,请使用“文件”>“将图另存为”>“元文件”。要将图另存为文件,您可以再次在Netdraw中看到,您需要使用“文件”>“将数据另存为”>“ Vna”。
UCINET电子表格编辑器对于进行更改或查看数据很有用,但不适用于导入通常不以邻接矩阵格式排列数据的较大数据集。 UCINET支持多种数据格式,这些数据格式可通过称为dl编辑器的编辑器进行访问,该编辑器通过按下UCINET中电子表格编辑器右侧的按钮启动,如下所示
启动编辑器后,您应该获得以下内容。
支持多种数据格式,但我们仅介绍两种。通过单击数据格式选择框右侧的箭头,可以从下拉列表中选择数据格式。完整矩阵与使用普通电子表格编辑器相同。我们的第一种格式称为Nodelist1(ego alter1 alter2 ...),此格式列出了每个节点以及其相邻的节点。以下是一个示例,请注意,我们在输出选项中单击了力对称框。
每行中的第一个数字为边的起始节点,同一行中跟随的数字是结束节点的列表。因此,第一行1 3 4 5表示参与者1连接到参与者3、4和5。第二行指出参与者5连接到参与者6,依此类推。请注意,行之间或行中没有顺序。 Actor 2没有列出末端节点,因此是一个隔离节点。下面给出了与该链表相对应的网络。
请注意,电子表格中的条目是标签,因此我们可以使用名称而不是数字。如果对数据进行定向,则弧将从起始节点转到终止节点。以下是显示带有标签的定向网络的示例。
如果数据很有价值,那么我们就不能使用节点列表格式。另一种方法是Edgelist1(自我变更[值])格式。此格式每行有三个条目,其格式为开始节点,结束节点,值。以下是一个示例。
在此示例中,我们看到Martin与Steve的连接值为5。应注意,电子表格中的数据只能保存为UCINET文件,否则无法保存,因此在excel电子表格中构造这些数据是一个好主意并复制粘贴或导入它们。输入完成后,可以通过单击文件按钮并选择保存UCINET数据集将文件保存在UCINET中。要清除电子表格,请单击左上方的
我们没有提到UCINET和Netdraw的许多功能,但是希望本指南可以帮助您入门。
Windows操作系统Vista或更高版本。如果您使用的是Mac或Linux,则可以通过BootCamp,VMFusion Ware,Parallels或Wine运行UCINET。
32位版本是标准版本,可在32位和64位Windows系统上运行。有限的64位版本可用,但不具有所有UCINET功能。
程序本身的磁盘空间为100mb(不包括数据)
RAM越高越好,但是32位版本不能利用超过3GB的内存。如果您有大数据和64位版本的Windows,则可以尝试使用实验性的64位版本,在这种情况下,需要8GB或更大的RAM。但是请记住,即使非常大的数据集可以容纳在内存中,也可能花费很长时间进行分析。
虽然绝对最大网络大小约为200万个节点,但实际上大多数UCINET程序太慢,无法运行大于5000个节点的网络。但是,这取决于特定的分析和网络的稀疏性。例如,度中心性可以在成千上万个节点的网络上运行,并且当关系很少时,无论有多少个节点,大多数图论例程的运行速度都会更快。
北京友万信息科技有限公司,英文全称:Beijing Uone Info&Tech Co.,Ltd ( Uone-Tech )是中国大陆领先的教育和科学软件分销商,已在中国300多所高校建立了可靠的分销渠道。拥有最成功的教学资源和数据管理专家。如需申请软件采购及老版本更新升级请联系我们,咨询热线:010-56548231 ,咨询邮箱:info@uone-tech.cn 感谢您的支持与关注。