Assessment: Hortonworks Certified Apache Hadoop Administrator 1.x
Date Completed: 2013/12/24
Result: Pass
聖誕禮物 Got
peicheng 發表在 痞客邦 留言(1) 人氣(17)
Hadoop 1.0 Administrator Certification
References for Certification Candidates
Intended Audience
The Certified Apache Hadoop Administrator certification is intended for IT administrators and operators who deploy, manage and monitor Hadoop-based solutions, consultants who create Hadoop project proposals and Hadoop administration instructors. Those certified are recognized as having high level of skill in Apache Hadoop administration
peicheng 發表在 痞客邦 留言(0) 人氣(37)
Hbase 啟動流程
開啟一個 Hbase cluster 可以按造以下流程開啟
HDFS
DataNodes
HBase HMaster (active)
HBase HMaster (backup)
HBase Region Servers
peicheng 發表在 痞客邦 留言(0) 人氣(15)
note一下,
0.20 前使用 org.apache.hadoop.mapred 舊介面
0.20 版本開始引入org.apache.hadoop.mapreduce 的新API
peicheng 發表在 痞客邦 留言(0) 人氣(45)

MapFile 是 排序且帶索引的 hadoop SequenceFile 。
一個 MapFile 在 HDFS上是一個資料夾,包含兩個file組成,一個是index,也就是key的索引,另外一個就是 data,排序好的原始資料。
在查找時,只需要把index載入,memory中,使用binary search的方式,就可以很快查找到要找的key。
index
內含
# hadoop fs -text numbers.map/index
peicheng 發表在 痞客邦 留言(0) 人氣(32)
IPC port
JobTracker:8021
namenode:8020
JobTracker WebUI : 50030
peicheng 發表在 痞客邦 留言(0) 人氣(13)
Tutorial - Apache Hive - Apache Software Foundation
https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-Joins
Hive 的說明內只出了Joins的幾種組合用法,
其中有個是 left semi join
In order check the existence of a key in another table, the user can use LEFT SEMI JOIN as illustrated by the following example.
INSERT OVERWRITE TABLE pv_users
SELECT u.*
FROM user u LEFT SEMI JOIN page_view pv ON (pv.userid = u.id)
WHERE pv.date = '2008-03-03';
peicheng 發表在 痞客邦 留言(0) 人氣(15)
[hadoop] commission and decommission Step
peicheng 發表在 痞客邦 留言(0) 人氣(1)
peicheng 發表在 痞客邦 留言(0) 人氣(9)
[hadoop] intermediate Sort
keyword:spill index , spill files, MapReduce
Goal: Sort by key
peicheng 發表在 痞客邦 留言(0) 人氣(8)