hdfs - 爱搜

发表于 2025-08-14 veracity hive hdfs

近日，由中国电子信息产业发展研究院主办，以“数字转型智创未来”为主题的“2019中国IT市场年会”在京召开，来自政府领导、业界专家、企业领袖等代表进行了深入探讨和交流。近日，由中国电子信息产业发展研究院主办，以“数字转型智创未来”为主题的“2019中国IT市场年会”在京召开，来自政府领导、业界专家、企业领袖等代表进行了深入探讨和交流。大会历经20届，已经成为中国IT产业的风向标

服务器设置不当很易酿成资讯安全风险

发表于 2025-10-04 47820 hdfs shodan

服务器设置不当很易酿成资讯安全风险，例如早前近 27000 个 MongoDB 数据库就因此遭到入侵和勒索。日前更有专家发现，全球有逾 4000 个 HDFS 服务器未有好好设定，曝露了 5120 TB 的资料。物联网搜索引擎 Shodan 称，全球有不少 HDFS （Hadoop Distributed File System）服务器因设定不当而导致资料外露

职位描述开发经理大数据方向职位名称: 开发经理大数据方向

发表于 2025-08-04 hive hdfs 任务分配

职位描述开发经理（大数据方向）职位名称: 开发经理（大数据方向）工作地点: 上海工作类别: IT技术经理公司性质: 国内综合软件和服务提供商，是国内最早专业从事城市信息化领域服务的企业之一工作职责根据产品线的战略规划，制定软件开发计划，保证开发计划按要求执行；负责产品开发、设计文档的编写、评审、实现以及整个产品周期的管理；负责具体代码的实现，进行核心模块的代码实现；负责产品的性能优化与人机交互体验的改进；负责产品开发团队成员的任务分配，并带领团队，提升开发团队整体技术能力；保障产品的正常实施，组织解决产品实施过程的各类问题；根据客户需求制定具体的设计方案；针对市场变化，分析产品，对产品提出改进方案。任职资格大学本科学历以上，5年以上工作经验，熟悉产品管理的专业知识；负责设计过数据分析、数据挖掘、数据可视化、在线数据相关产品经验；对主流大数据产品、数据交换、处理产品的现状和发展趋势有深入了解；了解数据挖掘技术，需要有深入的商业智能或者数据挖掘工作经验，在以上相关行业工作3年以上；了解Hadoop，HDFS，Hive等分布式大数据技术、能与技术人员良好沟通的优先考虑；追求高品质产品的精神与热情，对行业动态有足够洞察力及敏锐度；具有优秀的表达、沟通与协调能力、团队合作精神、保密意识。

背景 hdfs 集群作为大数据最核心的组件

发表于 2025-10-12 namenode mave 非中文

背景 HDFS 集群作为大数据最核心的组件，在公司承载了DW、AI、Growth 等重要业务数据的存储重任。随着业务的高速发展，数据的成倍增加，HDFS 集群出现了爆炸式的增长，使用率一直处于很高的水背景随着集群规模的不断扩张，文件数快速增长，目前集群的文件数已高达2.7亿，这带来了许多问题与挑战。首先是文件目录树的扩大导致的NameNode的堆内存持续上涨，其次是Full GC时间越来越长，导一、HDFS客户端环境准备 1）根据自己电脑的操作系统拷贝对应的编译后的hadoop jar包到非中文路径 2）配置HADOOP_HOME环境变量和path路径二、HDFS的API操作新建Mave 一、概述从整个HDFS系统架构上看，NameNode是其中最重要、最复杂也是最容易出现问题的地方，而且一旦NameNode出现故障，整个Hadoop集群就将处于不可服务的状态，同时随着数据规模和集群

服务器设置不当很易酿成资讯安全风险

发表于 2025-07-21 47820 hdfs shodan

服务器设置不当很易酿成资讯安全风险，例如早前近 27000 个 MongoDB 数据库就因此遭到入侵和勒索。日前更有专家发现，全球有逾 4000 个 HDFS 服务器未有好好设定，曝露了 5120 TB 的资料。物联网搜索引擎 Shodan 称，全球有不少 HDFS （Hadoop Distributed File System）服务器因设定不当而导致资料外露

apache cassandra是一个高度可扩展的高性能分布

发表于 2025-07-26 dynamo rackspace cassandra

Apache Cassandra是一个高度可扩展的高性能分布式数据库，用于处理大量商用服务器上的大量数据，提供高可用性，无单点故障。这是一种NoSQL类型的数据库。让我们先了解一下NoSQL数据库

谈到大数据，相信大家对hadoop和apache spark

发表于 2025-07-10 resilient rdd dataset

谈到大数据，相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上，并没有对它们进行深入的思考，下面不妨跟我一块看下它们究竟有什么异同。首先，Hadoop和Apache Spark两者都是大数据框架，但是各自存在的目的不尽相同

在大数据技术体系当中，hadoop无疑是学习当中的重难点

发表于 2025-07-29 yarn hive hdfs

在大数据技术体系当中，Hadoop无疑是学习当中的重难点，也是大数据从业人员在未来的职业岗位当中，实际需要用到的重要技术框架，在部分企业招聘当中，Hadoop工程师也是需要引进的重要人才。为了尽快掌握相关技术，入行大数据，不少人选择Hadoop培训。那么Hadoop培训费用多少，Hadoop培训靠谱吗，今天我们就来聊一聊

信息技术新工科产学研联盟师资培训班大数据+人工智能正式开班

发表于 2025-08-12 吴彩云 mapreduce hdfs

信息技术新工科产学研联盟师资培训班(大数据+人工智能)正式开班！ 8月24日，为了提升高校教师、科研人员以及大数据、人工智能相关专业从业者的水平，促进专业的建设与普及，由中国软件行业协会、信息技术新工科产学研联盟和联盟江苏地方高校产教融合工作委员会主办、南京云创大数据科技股份有限公司承办、金陵科技学院协办的信息技术新工科产学研联盟师资培训班(大数据+人工智能)同时开班。上午，清华大学博士、中国大数据应用联盟人工智能专家委员会主任、中国信息协会教育分会人工智能教育专家委员会主任、云创大数据总裁刘鹏教授和中国计算机学会大数据专家委员会委员罗圣美高工分别带来了“人工智能理论框架与应用”和“大数据技术生态与应用实践”的课程讲解。两位专家讲解理论结合实际，受到大家的热烈欢迎

大数据系统通常使用 hdfs 进行存储

发表于 2025-09-13 unify 并行性 hive

大数据系统通常使用 HDFS 进行存储，以实现数据在集群中各个节点之间的持久性、透明分布和均衡。HDFS 是一个不可变的文件系统，其间的数据不可编辑，只能追加。为了使用不可变的文件系统，不同的文件格式采用写入新文件以支持数据突变，随后使用异步后台合并来保持性能并避免产生许多小文件