Hadoop学习笔记(一)

1、Hadoop概述1.1、什么是Hadoop?Hadoop是一个由Apache基金会所开发的分布式系统基础架构。主要解决,海量数据的存储和海量数据的分析计算问题。广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。1.2、Hadoop发展历史Hadoop创始人Doug Cutt


Kettle学习(一)

Kettle相关笔记1、kettle的介绍kettle是一款开源的ETL工具,纯Java编写,可以在windows,linux,unix等平台上运行,绿色无需安装,高效的完成数据抽取2、kettle相关知识2.1、kettle工程存储方式1、XML形式存储2、以资源库方式存储(数据库资源库,文件资源