电信CALL 通话记录hbase kafka flume 学习
可视化:
--------------
1.
2.
3.
4.
5.
package com.it18zhang.callloggen;
import java.util.HashMap;
import java.util.Map;
/**
*
*/
public class App {
public static Map<String,String> caller = new HashMap<String, String>();
static{
caller.put("15810092493", "史玉龙");
caller.put("18000696806", "赵贺彪");
caller.put("15151889601", "张倩 ");
caller.put("13269361119", "王世昌");
caller.put("15032293356", "张涛");
caller.put("17731088562", "张阳");
caller.put("15338595369", "李进全");
caller.put("15733218050", "杜泽文");
caller.put("15614201525", "任宗阳");
caller.put("15778423030", "梁鹏");
caller.put("18641241020", "郭美彤");
caller.put("15732648446", "刘飞飞");
caller.put("13341109505", "段光星");
caller.put("13560190665", "唐会华");
caller.put("18301589432", "杨力谋");
caller.put("13520404983", "温海英");
caller.put("18332562075", "朱尚宽");
caller.put("18620192711", "刘能宗");
}
public static void main(String[] args) {
genCallLog();
}
public static void genCallLog(){
}
生成jar包,部署到centos执行
--------------------------------
1.使用maven生成jar文件
...
2.部署到centos
3.执行
$>mkdir /home/centos/calllog
java -cp xxx.jar com.it18zhang.callloggen.App /home/centos/calllog/calllog.log
4.创建centos上的执行脚本
[calllog.sh]
#!/bin/bash
java -cp Calllog.jar com.it18zhang.callloggen.App /home/centos/calllog/calllog.log
5.修改权限
$>chmod a+x calllog.sh
6.执行脚本
$>cd ~/calllog
$>./calllog.sh
手机号
---------------
0755-67568979
186----------
086+0755-67568979
固话
--------------
0755-67568979
0755-67568979
网络电话
-------------
12358757575765656565
启动zk集群[s201 + s202 + s203]
-------------
$>zkServer.sh start
启动kafka集群[s202 + s203 + s204]
-----------------
$>cd /soft/kafka/config
$>kafka-server-start.sh -daemon server.properties
创建kafka主题
-----------------
//创建主题
$>kafka-topics.sh --zookeeper s202:2181 --topic calllog --create --replication-factor 3 --partitions 4
//查看主题列表
$>kafka-topics.sh --zookeeper s202:2181 --list
//启动控制台消费者,消费calllog主题,用于测试.
$>kafka-console-consumer.sh --zookeeper s201:2181 --topic calllog
s201上编写flume配置文件件,实时收集calllog.log日志
--------------------------------------------
1.配置文件
[/soft/flume/conf/calllog.conf]
a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type=exec
#-F 最后10行,如果从头开始收集 -c +0 -F:持续收集后续数据,否则进程停止。
a1.sources.r1.command=tail -F -c +0 /home/centos/calllog/calllog.log
a1.channels.c1.type=memory
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.topic = calllog
a1.sinks.k1.kafka.bootstrap.servers = s202:9092 s203:9092 s204:9092
a1.sinks.k1.kafka.flumeBatchSize = 20
a1.sinks.k1.kafka.producer.acks = 1
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
2.启动flume收集程序
$>flume-ng agent -f /soft/flume/conf/calllog.conf -n a1 &
在s202主机安装flume软件
------------------------
...
启动hadoop hdfs集群[s201 ~ s206]
角色划分:
NameNode //s201,s206
DataNode //s202,s203,s204,s205
JournalNode //s202,s203,s204
ZK //s201,s206
---------------------------------------------
1.启动hadoop(完全分布式 + HA,s201 + s206作为主备名称节点)
在s201上启动dfs集群.
$>start-dfs.sh
2.webui
http://s201:50070/
3.查看节点状态
$>hdfs haadmin -getServiceState nn1
4.容灾切换
$>hdfs haadmin -failover nn1 nn2
启动hbase集群
-------------------------------
1.[角色划分]
master //s201,s204
regsionServer //s202,s203,s204
2.启动hbase集群
//s201
$>start-hbase.sh
3.查看进程和webui
http://s201:16010
4.启动备份master节点
//s204
$>hbase-daemon.sh start master
创建hbase名字空间+表
----------------------
1.创建名字空间
$>hbase shell //进入hbase shell
$hbase>create_namespace 'ns1' //创建空间
$hbase>create 'ns1:calllogs' , 'f1' //创建表
$hbase>truncate 'ns1:calllogs' //重建表
IBM Power720(210000)
---------------------
基本规格
处理器类型POWER7+
处理器主频3.6GHz
处理器缓存每个内核256KB二级缓存,4MB三级缓存
最大处理器个数8
内存类型DDR3
标准内存容量32GB
最大内存容量128GB
4颗CPU
去IOE
---------
IBM: //ibm小型机
Oracle: //oracle数据
EMC //网络存储设备
戴尔(DELL)13900 * 100 = 140万
-------------------------------
商品名称:
戴尔(DELL)R730服务器
机架式主机 2U
至强 E5处理器
内存类型 ECC
硬盘总容量:8T以上 8T x 100 = 800T = 副本(3) 800/3 = 250 80%(4/5) = 150T
类型:
机架服务器电源:冗余
操作系统: DOS
内存 总容量:64G及以上
硬盘转速:其他
支持CPU颗数 2颗
机箱规格 2U机架式
显存 集成显卡
硬盘类型 SAS
Raid卡
缓存: 无缓存
处理器: 至强Xeon-E5
创建kafka消费者,订阅calllog主题
-------------------------------
1.设计rowkey
业务数据: caller , callee , date , duration
分区号 号码 时间,标记 (对方号码),时长
regionNo, caller,date , flag,callee,duration
caller(11) + 通话时间(201701) =
(后四位) + 201701 = % 100
2.
3.
4.
11 - 4 = 7
hbase(main):001:0> scan 'ns1:calllogs'
ROW COLUMN+CELL
39,15032293356,20170313140201,0,18620192711,297 column=f1:callDuration, timestamp=1491896679156, value=297
39,15032293356,20170313140201,0,18620192711,297 column=f1:callTime, timestamp=1491896679156, value=20170313140201
39,15032293356,20170313140201,0,18620192711,297 column=f1:callee, timestamp=1491896679156, value=18620192711
39,15032293356,20170313140201,0,18620192711,297 column=f1:caller, timestamp=1491896679156, value=15032293356
93,18620192711,20170313140201,1,15032293356,297 column=f1:dummy, timestamp=1491896679184, value=no
使用mvn命令,下载工件的所有依赖软件包
----------------------------------------
mvn -DoutputDirectory=./lib
-DgroupId=com.it18zhang
-DartifactId=CallLogConsumerModule
-Dversion=1.0-SNAPSHOT
dependency:copy-dependencies
导入kafka消费者,放置以上面的lib下,使用命令行方式运行
-----------------------------------------------------
java -cp CallLogConsumerModule.jar;./lib/activation-1.1.jar;./lib/apacheds-i18n-2.0.0-M15.jar;./lib/apacheds-kerberos-codec-2.0.0-M15.jar;./lib/api-asn1-api-1.0.0-M20.jar;./lib/api-util-1.0.0-M20.jar;./lib/avro-1.7.4.jar;./lib/commons-beanutils-1.7.0.jar;./lib/commons-beanutils-core-1.8.0.jar;./lib/commons-cli-1.2.jar;./lib/commons-codec-1.9.jar;./lib/commons-collections-3.2.2.jar;./lib/commons-compress-1.4.1.jar;./lib/commons-configuration-1.6.jar;./lib/commons-digester-1.8.jar;./lib/commons-el-1.0.jar;./lib/commons-httpclient-3.1.jar;./lib/commons-io-2.4.jar;./lib/commons-lang-2.6.jar;./lib/commons-logging-1.2.jar;./lib/commons-math3-3.1.1.jar;./lib/commons-net-3.1.jar;./lib/findbugs-annotations-1.3.9-1.jar;./lib/guava-12.0.1.jar;./lib/hadoop-annotations-2.5.1.jar;./lib/hadoop-auth-2.5.1.jar;./lib/hadoop-common-2.5.1.jar;./lib/hadoop-mapreduce-client-core-2.5.1.jar;./lib/hadoop-yarn-api-2.5.1.jar;./lib/hadoop-yarn-common-2.5.1.jar;./lib/hamcrest-core-1.3.jar;./lib/hbase-annotations-1.2.4.jar;./lib/hbase-client-1.2.4.jar;./lib/hbase-common-1.2.4.jar;./lib/hbase-protocol-1.2.4.jar;./lib/htrace-core-3.1.0-incubating.jar;./lib/httpclient-4.2.5.jar;./lib/httpcore-4.2.4.jar;./lib/jackson-core-asl-1.9.13.jar;./lib/jackson-mapper-asl-1.9.13.jar;./lib/jaxb-api-2.2.2.jar;./lib/jcodings-1.0.8.jar;./lib/jdk.tools-1.6.jar;./lib/jetty-util-6.1.26.jar;./lib/jline-0.9.94.jar;./lib/joni-2.1.2.jar;./lib/jopt-simple-4.9.jar;./lib/jsch-0.1.42.jar;./lib/jsr305-1.3.9.jar;./lib/junit-4.12.jar;./lib/kafka-clients-0.10.0.1.jar;./lib/kafka_2.11-0.10.0.1.jar;./lib/log4j-1.2.15.jar;./lib/lz4-1.3.0.jar;./lib/mail-1.4.jar;./lib/metrics-core-2.2.0.jar;./lib/netty-3.7.0.Final.jar;./lib/netty-all-4.0.23.Final.jar;./lib/paranamer-2.3.jar;./lib/protobuf-java-2.5.0.jar;./lib/scala-library-2.11.8.jar;./lib/scala-parser-combinators_2.11-1.0.4.jar;./lib/slf4j-api-1.6.1.jar;./lib/slf4j-log4j12-1.7.21.jar;./lib/snappy-java-1.1.2.6.jar;./lib/stax-api-1.0-2.jar;./lib/xmlenc-0.52.jar;./lib/xz-1.0.jar;./lib/zkclient-0.8.jar;./lib/zookeeper-3.4.6.jar com.it18zhang.calllog.consumer.HbaseConsumer
编写web程序,从hbase中提取所有进行展示,可视化
---------------------------------------
1.导入ssm项目
...
2.创建CallLog
...
3.创建CallLogService.java + CallLogServiceImpl.java
...
4.
1.按照时间段查询通话记录
1.hbase交互
Scan : 设置startRow + endRow
rowkey : hashcode , + callerid , + callTime, 0 , callee , duration.
2.
3.
编写CallLogController.java
---------------------------
/**
* 进入查询通话记录的页面,form
*/
@RequestMapping("/callLog/toFindCallLogPage")
public String toFindCallLogPage(){
return "callLog/findCallLog" ;
}
@RequestMapping(value = "/callLog/findCallLog",method = RequestMethod.POST)
public String findCallLog(@RequestParam("caller") String caller, @RequestParam("startTime") String startTime, @RequestParam("endTime") String endTime){
Calendar startCalendar = Calendar.getInstance();
Calendar endCalendar = Calendar.getInstance();
return "callLog/callLogList" ;
}
编写jsp
-----------------------------
<%@ page contentType="text/html;charset=UTF-8" language="java" %>
<%@ taglib uri="http://java.sun.com/jsp/jstl/core" prefix="c" %>
<html>
<head>
<title>查询通话记录</title>
<link rel="stylesheet" type="text/css" href="../css/my.css">
</head>
<body>
<form action='<c:url value="/callLog/findCallLog" />' method="post">
<table>
<tr>
<td>电话号码 :</td>
<td><input type="text" name="caller"></td>
</tr>
<tr>
<td>起始时间 :</td>
<td><input type="text" name="startTime"></td>
</tr>
<tr>
<td>结束时间:</td>
<td><input type="text" name="endTime"></td>
</tr>
<tr>
<td colspan="2">
<input type="submit" value="查询"/>
</td>
</tr>
</table>
</form>
</body>
</html>
电信CALL 通话记录hbase kafka flume 学习相关推荐
- 大数据项目(二)————某电信公司通话记录改造
1.项目介绍 某互联网公司面向APP应用开发者提供的,以品牌互推.流量互导.广告分账为主的一站式服务平台. 将通话记录数据由原来的oracle系统改造成使用大数据架构解决方案.主要使用hbase做通话 ...
- 大数据学习--kafka+flume++sqoop+hadoop+zookeeper+spark+flink
大数据工程师 学习指南 一必备技能 Zookeeper.Hadoop.Hive.HBase.Flume.Sqoop.Flink 等等 1定义(from百度百科) 1.1Zookeeper 百度百科-验 ...
- [大数据] 搜索日志数据采集系统 flume+hbase+kafka架构 (数据搜狗实验室)
1 采集规划 说明: D1 日志所在服务器1 -bigdata02.com D2 日志所在服务器2 -bigdata03.com A flume2 - bigdata02.com 日志收集 C flu ...
- selenium+phantomjs 爬虫 获取中国移动,电信,联通通话记录
主要获取中国电信,中国移动,联通通话记录 提取征信维度,使用selenium+phantomjs完成对网站数据的爬取,由于phantomjs不符合 分布式爬取要求,所以自己动手重构了phantomjs ...
- request获取int类型的值_获取通话记录或通讯录的数量为负值
安卓源码避坑指南5--获取通话记录或通讯录的数量为负值 通过蓝牙PBAP协议同步通讯录.通话记录时,想必对其数量大小也是很感兴趣的,因此一般的设计思路都是先获取到同步对象的总大小,然后再同步该对象的具 ...
- 玩下软工项目,第一轮--全局Context的获取,SQLite的建立与增删改查,读取用户通话记录信息...
项目的Github地址:https://github.com/ggrcwxh/LastTime 采用基于git的多人协作开发模式 软件采用mvc设计模式,前端这么艺术的事我不太懂,交给斌豪同学去头疼了 ...
- 安卓随机通话记录_几款安卓amp;苹果虚拟来电软件,带你快速逃离尬聊现场,留有情面慰人心扉...
有时候,我们会遇到一些尴尬的"车祸"现场-- 我们被七大姑八大姨硬撵着去和一位不中意的妹子吃饭,从见面开始,一直尬聊赔笑,内心煎熬难忍,此情此景,谁能救我们? 我们被老赖约出去吃饭 ...
- 在计算机上知道手机密码,不知道密码查手机通话记录:傻瓜式教程
不知道密码查手机通话记录:傻瓜式教程 搜狐媒体平台 05-14 09:12 大 有时我们不慎忘记了自己手机的服务密码,在这种情况下,是否还可以查询自己手机的通话记录呢?答案是可以的,今天我要介绍的方法 ...
- 误删通话记录?这几个方法能恢复
有没有朋友和我一样将通话记录删了却又想找回来?我今天汇总了几个可以恢复通话记录的方法,还附带了一个恢复微信聊天记录的方法,需要的朋友就快收藏吧. 恢复通话记录的方法: 一.借助iTunes备份恢复 i ...
最新文章
- 【ok】李宏毅机器学习12: 对称矩阵
- 【转】理解SQL Server的安全对象和权限
- oracle中 sql语句:start with .. connect by prior.. 用法
- 人工智能与大数据的完美结合 1
- v-if v-show区别(面试题)
- Every Woman is beautiful
- 学习dajango+sqlite3入门学习
- 【专题三】如何考量虚拟化的投资回报率?——服务器虚拟化的阴暗面
- 扩展卢卡斯定理(Exlucas)
- “小程序 · 云开发”重磅上线,让小程序开发更高效!
- oracle 分页过程,oracle存储过程分页的完整例子
- Android RecyclerView根据不同的item设置不同的背景颜色
- c语言标准流程图,c语言设计流程图!设计流程图
- ws2812 c语言程序,STC15单片机驱动WS2812B七彩LED(汇编混合编程)
- POJO和po,vo,bo
- 英语作文计算机80词九年级,英语作文80词左右初三带翻译
- CTS测试中的testSensorOperations项
- 站群代做关键词排名出技术
- 马云退隐前,在年会上说了最重要的三件事
- 英文歌曲:Yesterday Once More(昨日重现)