请选择 目标期刊

自然资源分布式GIS服务平台研究 下载:53 浏览:445

龚敏霞1,2 吉波3 徐年峰3 胡岭1 《测绘科学与技术》 2020年12期

摘要:
结合自然资源业务需求,分析了国土资源"一张图"数据平台传统技术架构的不足。在介绍分布式计算发展现状与趋势的基础上,提出了基于云计算架构的自然资源分布式GIS服务平台建设目标。在设计平台总体架构的基础上,重点阐述了基于Hbase的海量空间数据存储、检索和查询方法,阐述了基于Spark的分布式GIS计算方案以及基于MPP架构的海量数据渲染模型设计等关键问题。本研究与相应的开发试验为自然资源分布式GIS服务平台的建设落地提供了可借鉴的技术思路。

电力大数据平台中HBase的实时性优化方案 下载:82 浏览:227

方威 胡晓勤 《数据与科学》 2019年2期

摘要:
近年来,随着大数据场景的兴起,RDBMS由于其自身的扩展性和可用性限制无法满足企业需求。No SQL数据库的出现弥补了传统关系型数据库在大数据领域的不足。No SQL数据库本身具有良好的扩展性、容错性以及实时访问、存储TB级别数据的特点。HBase就是以HDFS和MapReduce为基础的开源No SQL型分布式数据库,它不支持二级索引、事务和批量数据处理时延长等[1]。本文以HBase和Spark为基础,增加插件使HBase支持SQL语句和二级索引,通过修改Spark源码,提升对HBase数据的本地化计算级别。插件对HBase无侵入、低耦合,支持用户输入SQL语句,把输入字段转化为HBase的列族和列限定符,根据不同的场景选取不同的执行方案。MapReduce计算框架具有计算效率低,无法利用HBase的读写缓存的缺陷[1],原始Spark框架不能感知HBase数据分片。本文改进Spark能感知HBase数据分片,对HBase中数据进行高级别本地化计算。最终,将本文设计的系统与业内常用的Hive+HBase方案对比常用SQL消耗的时延[3]。通过实验得出,本文构建的优化方案在没有缺失HBase的优良特性的基础上加强了部分应用场景的实时性。

基于HBase的RDF数据的存储与查询系统研究 下载:59 浏览:448

王益尧 《天线研究》 2018年2期

摘要:
Web语义网技术在近几年快速发展,用来描述语义网信息资源的知识描述框架RDF(Resource Description Framework)的数据量在快速增长,传统的集中式管理方法已经不能解决大数据量的挑战。对此提出一种基于Hadoop/HBase的分布式存储管理与查询计算系统方案,将RDF数据以图邻接表的形式表达,构建以实体、边属性标签为Row Key的两张表,同时进行基于深度搜索和跳数的数据划分策略,并基于Hadoop集群对LUBM标准数据集进行SPARQL查询,以系统查询执行时间作为衡量标准,通过实验验证该模型是有效可行的。

电网数据存储技术选型的研究 下载:315 浏览:2876

​王林 毛正雄 任永辉 李绍龙 《电网技术研究》 2022年11期

摘要:
随着电网在各个行业中的普及,电网业务中的数据也越来越多,传统的大电网统一数据库或集中式数据库已经无法满足电网数据存储的需求,因此,业界对电网数据存储技术的研究越来越多。大数据平台分布式文件系统是目前国网公司储存电网数据的一种技术,其具有成本低、容错率高、吞吐量高等特点,在非结构化数据和实时数据的存储中均具有一定的优势。本文将对电网数据中的非结构化数据和实时数据进行分析,并针对其存储情况来探究其存储技术选型。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享