本部分的内容专注于集群上Property Operator的内容,其中比较重要的就是mapVertices、mapEdges和mapTriplets,即对顶点进行map、对边进行map、对Triplets进行map,在Graph中其方法分别如下所示:

首先来看一下graph实例中的10个元素的具体的值:

可以看到这个10个顶点元素中每个顶点元素的属性值都是1,这个是源码设定的。

下面我们把每个顶点的元素的值都变成2,当然这样做没有实际意义,只是试验用途:

查看一下每个顶点的属性都变成2:

可以发现都变成了2,这也证明了我们的操作是成功的。

我们也可以使用以下优化的方式实现上述同样的功能,只不过此时是把每个顶点的属性变成了3:

查看一下变成3以后的结果:

第八章:在Spark集群上掌握比较重要的图操作之Property Operators(1)相关推荐

  1. 第八章:在Spark集群上掌握比较重要的图操作之Property Operators(2)

    从结果上看是符合 我们预期的. 如果要对边进行操作,基本和前面一样,首先 我们看一下边元素的具体信息: 此时我们把所有的边的属性变成2并查看其执行结果: 上述操作的attr是来自Edge的属性,其源码 ...

  2. 第九章:在Spark集群上掌握比较重要的图操作之Structural Operators

    Spark GraphX中属于Structural Operators的操作主要有reverse.subgraph.mask.groupEdges等几种函数,他们在Graph中的源码分别如下所示: 上 ...

  3. 第十章:在Spark集群上掌握比较重要的图操作之Computing Degree

    Degree是离散数学的概念,在Spark GraphX中把Degree分为inDgrees.outDegrees.degrees等三种不同的degree,以下图为例: 在上面这张图中,顶点5的inD ...

  4. anaconda3环境整体打包放在Spark集群上运行

    一.将虚拟Python环境打包 创建好环境后,进入到环境所在的文件夹,例如环境是/home/hadoop/anaconda3/envs, cd到envs下,使用打包命令将当前目录下的文件打成zip包: ...

  5. 使用Python+jieba和java+庖丁分词在Spark集群上进行中文分词统计

    写在前边的话: 本篇博客也是在做豆瓣电影数据的分析过程中,需要对影评信息和剧情摘要信息进行分析而写的一篇博客 以前学习hadoop时,感觉做中文分词也没那么麻烦,但是到了Spark,却碰到了诸多困难, ...

  6. 第七章:在Spark集群上使用文件中的数据加载成为graph并进行操作(3)

    你可以调整graph的构造参数来指定partition的数量. 当数据加载完毕的时候整个web-Googel.txt就缓存进了内存之中,如下所示: 可以看到数据被缓存成了edges. 下面我们使用把m ...

  7. 第七章:在Spark集群上使用文件中的数据加载成为graph并进行操作(2)

    Spark-shell启动后我们可以在控制台看到起运行信息: 点击作业ID即可查看Spark shell运行信息: 下面我们就开始在集群上通过读取hdfs文件的方式来构建graph对象,首先要做的就是 ...

  8. spark集群访问mysql_spark连接数据源以及在spark集群上跑

    1.spark连接mysql import org.apache.spark.SparkConf import org.apache.spark.sql.{SaveMode, SparkSession ...

  9. pythonspark集群模式运行_有关python numpy pandas scipy 等 能在YARN集群上 运行PySpark

    有关这个问题,似乎这个在某些时候,用python写好,且spark没有响应的算法支持, 能否能在YARN集群上 运行PySpark方式, 将python分析程序提交上去? Spark Applicat ...

最新文章

  1. 常考数据结构与算法:求二叉树的层序遍历
  2. iOS AppStore 申请加急审核
  3. 如何做一场高质量的分享?
  4. wine应用运行后字体都是问号
  5. Mac OS X安装Lua
  6. pythonfillcolor_openpyxl 填充颜色(单元格)
  7. Struts2源码学习(一)——Struts2中的XWork容器
  8. ECMAScript 学习笔记02
  9. 合并账号_亚马逊账号最新死法:合并listing和折扣促销
  10. 德国铁路公司基于模型的铁路系统设计路线图 - 基于模型的系统开发在铁路部门的应用
  11. 《Linux命令行与shell脚本编程大全》 第二十二章 学习笔记
  12. NYOJ--114--某种序列(大数)
  13. CAN 通信协议(希望大家多多指点)
  14. android电视盒子蓝牙遥控器app,Android TV 智能电视/盒子 APP 开发焦点控制 两种方法实例...
  15. 运放_电流互感器电流检测电路
  16. UOJ#310-[UNR #2]黎明前的巧克力【FWT】
  17. 如何挑选视频会议摄像头?
  18. 漏洞复现篇——利用XSS漏洞实现键盘记录
  19. Centos7使用Docker部署Chemex资产管理系统
  20. Diskgenius的下载使用(一键修复坏道)

热门文章

  1. 第二章《深入C#数据类型》项目经理评分
  2. 我的2013 --岁月划过生命线(大二.上)
  3. Python批量重命名Maya场景中的3D物体
  4. 又是一天,这次是网页显示的问题
  5. 复制文本朗读_原创:昭明文选配乐朗读 卷第五十一 论一 东方曼倩 非有先生论 王子渊 四子讲德论 并序...
  6. RTT的IPC机制篇——信号
  7. 动态规划——乘积为正数的最长子数组长度(Leetcode 1567)
  8. java中的关键事件是_java – 自定义关键事件
  9. 检测和校准实验室能力认可准则_CNAS-CL01:2018检测和校准实验室能力认可准则之管理体系...
  10. html js 回调函数,js中回调函数的学习笔记