hadoop
10 Spark核心技术与高级应用 于俊[等]著 2016 11 分布式实时计算框架原理及实践案例 王成光着 2016 19 网络工程师5天修炼 朱小平 施游编著 2015 百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!从使用、原理、运维和开发4个方面深度讲解Hadoop最核心的技术这是一本技术深度与企业实践并重的著作,由百度顶尖的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:(1)使用:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统;(2)原理:结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理;(3)运维:结合百度的实际生产环境,详细讲解了Hadoop集群的安装、配置、测试以及管理和运维;(4)开发:详细讲解了Hadoop Streaming、Pipes的使用和开发实践,以及MapReduce的编程实践和常见问题。与市面上已有的Hadoop相比,本书的最大不同之处是它直切企业应用和实践Hadoop技术的痛点,深入讲解了企业最需要和最头疼的技术和问题,内容上非常聚焦
[招聘信息] 实习自然语言处理-NLP;实习OCR图像识别研究员-AI NLP自然语言处理职位描述:1.计算机、数学或统计学等相关专业本科及以上学历;2.熟悉自然语言处理常见算法与模型(语言模型,MaxEnt/CRF,pLSA/LDA, w2v,CNN/RNN,Bert等);3.参与或主导过NLP项目(中文分词、文本分类、文本聚类、文本结构化、文本相似度计算等);4.熟悉Hadoop、Spark、Hive 等大数据处理技术; 5.熟练掌握Python编程;6.良好的编程基础和数据结构算法基础;7.较强的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;8.有开发高品质产品、编写高质量代码的自我要求;9.具备强烈的进取心、求知欲及团队合作精神,热衷于追求技术创新。加分项:1.对神经网络,深度学习算法原理有深入了解者;2.热爱互联网和新技术,具有快速学习能力,研究过开源软件的源码并有心得;3.熟悉其他常用编程语言如:Java、Scala、C++、Shell等。 OCR图像识别职位描述:工作职责:1、开发文字识别和版面分析领域的算法,并将算法应用到各个业务场景中;2、跟进OCR前沿技术(文档图像预处理,文字检测,文字识别,版面分析,语义理解),进行技术难点攻关与前瞻研究
HHDI的数据源广泛支持各种带有JDBC驱动的关系型数据库、MPP数据库、SAP ECC系统、XMLA多维数据、各SQL ON Hadoop引擎以及xls、csv等格式的文本数据,除系统自带的各种数据库驱动外,用户还可以自己添加维护新的数据类型。 创建源和目标的各种数据连接,依据预先设置的数据驱动模板进行配置。 对数据库驱动的模板配置信息进行维护,可修改默认数据库的模板配置,也可以新增一种新数据类型的模板
经过多年的积累,广州泰迪科技与机械工业出版社、人民邮电出版社共同策划,校企联合编写《R语言数据分析与挖掘实战》、《Python数据分析与挖掘实战》、《Hadoop与大数据挖掘》、《Hadoop大数据开发基础》、《Spark大数据技术与应用》、《Python编程基础》、《Python数据分析与应用》、《R语言商务数据分析实战》等20余本大数据专业教材,目前已在全国500余高校使用,惠及师生60余万人。 大数据行业案例库是泰迪科技在数据挖掘领域探索10余年和高校资深讲师联合经验总结之作,内容涵盖智能电网、移动电信、医疗健康、网络舆情、电子商务、金融保险、交通运输、信息安全、政务民生等诸多行业,特别适合有数据挖掘相关课程教学的高校、研究所和培训机构,也可作为个人学习数据挖掘技术的**素材。如电力窃漏电用户自动识别、气象与输电线路缺陷关联分析、航空公司客户价值分析、城市公交站点设置的优化分析、信用卡高风险客户识别、P2P网络信贷获贷结果预测等
大数据助力智慧党建升级 为党建工作升级赋能!随着Hadoop、Spark等新技术的兴起,以及计算能力、存储技术的提升,人们对于大数据的生理能力有了很大的改善,对于数据的应用对社会治理和行业发展有着非常重要的意义。 大数据的应用在社会治理和行业发展中发挥更加积极、有效和赋能的作用,把融合作为大数据的价值所在,坚持以问题为导向,加快大数据与实体经济的融合、加快大数据与社会治理的融合,起到推动实体经济转型升级和提高政府治理能力和水平的核心作用。 随着“互联网+”的发展,党建工作也应当与时俱进的积极融入互联网,利用大数据、云计算技术,探索“互联网+党建”的新模式,实现在线缴纳党费、开展党性教育、解决百姓难题、推动扶贫攻坚等功能,从而既巩固夯实基层党建根基,也有效发挥出党组织和党员的服务、带动作用,激发基层党建工作的新活力
知识付费领域的新星,每天与600万家庭互动分享 ,孩子的故事大全,父母的育儿宝典。 目前,旗下微信阅读量每月超千万次 ,已播出2000多个故事,总播放量15亿次以上,时长共计1.35亿小时 ,人均每天收听时长接近1小时。APP日活接近15%,月活超过50%,月留存在60%以上
得益于政策的大力推动,我国大数据产业链逐渐完善,但是由于国内企业缺乏核心技术,目前国内市场仍然以国外企业为主导,我国大数据产业呈现出空心化的发展现状。关于大数据的收集与处理你知多少? 什么样的数据才能称为大数据。 “大数据”一词时下的热门程度无需赘言,这一两年来互联网相关的任何活动、会议必不可少“大数据”板块
华宇大数据管理平台依托MPP+Hadoop分布式混合技术架构、大数据分析等先进技术,具备数据管理、 共享交换、数据服务三大功能, 具有数据汇聚实时自动、数据质量高度可信、数据服务全面可用等特征, 实现了数据统计、业务态势动态分析等工作自动化、实时化。 平台支持对汇集的数据资源进行全生命周期管理。包括数据集成调度、存储监控、数据资源目录管理、元数据管理、主数据管理、数据质量管理、数据安全管理、平台运维管理
成本大片35分钟免费播放高中毕业生、中等职业学校毕业生。 成本大片35分钟免费播放培养德、智、体、美全面发展的,能够较快适应生产、建设、管理、服务等一线岗位需要的,面向电信、零售、银行、金融、政府等部门的云平台管理、大数据技术应用与分析的相关工作岗位,具有大数据技术应用与云计算理论基础知识,掌握云平台运维的基本技能,掌握大数据存储、清洗、管理、建模和分析的基本技能,了解大数据技术应用框架与其生态系统,掌握Hadoop技术框架的管理和使用,具有较高成本大片35分钟免费播放素质与良好职业素养,能从事云计算运维与大数据技术应用相关基础工作的发展型、复合型、创新型技术技能人才。 大数据导论、C程序设计、计算机网络、Python、数据结构、数据采集、Hadoop集群搭建与实施、数据清洗、数据存储、数据分析与可视化、Linux操作系统、大数据实战、大数据系统开发
Java作为目前应用最广泛的编程语言之一,广泛应用于互联网开发领域。随着人工智能和大数据等领域发展,网络编程技术需求日益增长,成为了各大企业对开发人员的必备技能之一。因此,Java开发网络培训成为了学习网络编程技术的**选择