广播电视用户行为分析

2018-03-22 01:37:25袁立孟彩霞西安邮电大学计算机学院
数码世界 2018年3期
关键词:结构化数据挖掘数据库

袁立 孟彩霞 西安邮电大学计算机学院

1 引言

随着信息技术的迅猛发展和普及应用,信息系统规模不断扩大,并且产生了海量的数据,2012年2月《纽约时报》发表专栏文章,宣告了大数据时代的降临。大数据时代的到来,改变着社会的方方面面,给企业带来了较大的机遇和挑战:一方面,以大数据分析挖掘为基础,企业可以实现客户分群、精准营销、事件预测、资源优化、商机挖掘等功能,从而带来巨大的商业价值,实现各种高附加值的增值服务,进一步提升企业的经济效益和社会效益;另一方面,企业的商业模式、业务策略、决策依据等都将日益基于大数据分析而非基于经验和直觉,这对企业的业务运营支撑体系,主要是信息化体系的建设以及发展战略带来了巨大挑战。

2 按照广播电视用户的分类

汇总层的数据和应用层的数据按照业务逻辑进行归类,分为:客户类、渠道类、产品类、收入类、行为类、资源类。

3 平台建设

3.1 Hadoop基础平台的建设

大数据HADOOP平台架构包括数据采集层、数据存储和计算层、数据服务接口层及平台自运行能力层。要求能够处理结构化和非结构化数据,具备实时计算、流数据处理、准实时采集生产系统源数据的能力。大数据平台要具备数据安全保障能力,满足省级数据安全的相关管理要求。

(1)数据采集层:实现对数据源的数据的采集和装载,并经过加工、清洗,提供到大数据存储层完成数据存储。

(2)数据存储与计算层:采用混合结构搭建,实现数据的存储和计算。存储层采用HDFS存储架构;计算层包括HIVE、HBASE包括数据获取、离线批处理、实时处理、异构数据同步等功能。其中离线批处理以MapReduce为基础并提供Hive、Mahout等处理组件,实时处理包括Storm流式实时计算框架。

(3)数据服务层:通过数据存储和计算层的挖据和分析,将海量数据处理结果通过封装、开放,根据不同业务部门的使用需求,通过数据共享发布及应用提供给外部使用。

3.2 ETL平台的建设

平台ETL性能要同时满足今后数据准实时抽取和批量采集两种方式的要求,要求能够在满足规定的时限内完成每日数据加载工作。ETL过程支持并行处理,且必须具备统一自动调度、日志监控和运营管理的功能。

3.3 数据采集平台的建设

平台支持结构化数据库及非结构化数据,包括文本、语音、图片等文件格式。

3.4 数据质量管控

3.5 数据安全管控

(1)数据本身安全;

(2)数据存储安全;

(3)数据访问安全;

(4)数据展示安全;

(5)数据导出安全;

(6)数据权限安全;

(7)数据脱敏安全。

3.6 数据专题域分析建设

基于有数据业务分析系统、用户行为分析系统、BOSS系统等业务域分析系统,能够将现有业务域各分析系统及业务域各类数据、资源融入大数据平台,并将各类数据、资源、计算结果由大数据平台发布共享。并产生新的专题分析数据。

3.7 数据加工处理平台

平台数据处理能力通过能力封装形式实现,业务处理流程通过可视化平台界面进行配置,全能力数据流处理状态可视化,数据接入系统后,为方便应用程序使用,需具备统一格式转换功能,消息协议转换功能。

对于消息接口,接收特定协议格式后,为方便后续程序处理,需具备常见转换为常见消息格式功能,包括:StringJSONXML等,并具备自定义消息格式功能。

面向内外部应用,提供大数据整合和基础数据处理能力。

外部数据源的各类数据,负责对外部来源系统的数据进行统一过滤、存储和沉淀,实现数据准确性、完整性、一致性。

大数据平台采用GBase 8a MPP数据库的MPP数据库。

GBase 8a MPP数据库,是在GBase 8a列存储数据库基础上开发的,基于现代云计算理念和shared nothing架构的并行数据库集群,可支持TB到PB级别结构化数据存储查询,高性能、高可用、高扩展的分布式、并行的数据库系统。以其独特的扁平架构,高可用性和动态扩展能力,为超大型数据管理提供一个高性价比的通用平台。

3.8 用户行为分析数据的支撑

通过大数据平台使多种业务数据汇聚融合,形成支撑对有线电视用户的使用行为深层洞察能力,最终支撑用户行为分析的应用展示。用户行为分析 从总量、栏目、节目逐级剖析、支撑月、日、小时级的监控分析,实现了数据的多维度、多时段及准实时监控。

4 结语

对客户进行精准营销,首先要对客户特点和客户需求特点进行深入了解,然后根据这些特点对客户进行特定的业务推荐或者维系策略,这样才可以最大限度提升客户的满意度,在改善用户体验的同时,适时的增加广告精准投放业务,深耕市场提升营业利润。

[1]白冰.数据挖掘在电视节目收视率中的应用研究[D].江苏科技大学, 2008.

[2]裴蕾.基于Web数据挖掘的电子商务推荐系统研究[D].同济大学,2006.

[3]瞿华礼.数据挖掘技术在电视用户满意度分析中的应用研究[D].安徽大学, 2011.

[4]王鑫.数据挖掘中聚类分析算法的研究[D].山东师范大学, 2006.

[5] 谢晓燕.基于阵列处理器的去块滤波算法并行化设计[N].西安邮电大学学报 2017. P67-72

猜你喜欢
结构化数据挖掘数据库
促进知识结构化的主题式复习初探
探讨人工智能与数据挖掘发展趋势
结构化面试方法在研究生复试中的应用
计算机教育(2020年5期)2020-07-24 08:53:00
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
数据库
财经(2017年2期)2017-03-10 14:35:35
数据库
财经(2016年15期)2016-06-03 07:38:02
数据库
财经(2016年3期)2016-03-07 07:44:46
数据库
财经(2016年6期)2016-02-24 07:41:51
一种基于Hadoop的大数据挖掘云服务及应用
基于图模型的通用半结构化数据检索
计算机工程(2015年8期)2015-07-03 12:20:35