mapreduce 学习笔记

工具

phoenix++:官网
下载源代码后在doc目录下能找到相关的论文。
优点:对于单机多核的机器,只要支持P-THREAD库基本就能跑这个工具。

应用场合

MapReduce编程模型对数据密集型的问题效果比较显著。

数据集搜寻

WebGraph

学习资料

Google MapReduce中文版
基于map-reduce的并行最短路径算法
MapReduce技术的初步了解与学习
下面这篇有空再看看,且里面代码的显示方案很不错
MapReduce的模式、算法和用例

过程中发现的优秀博客

famousphil.com
Highly Scalable Blog
nuaaqy专栏:研究Hadoop-MapReduce中

PPT

介绍最短路径和最小生成树在MAPREDUCE编程模型下的并行算法
MST+Dijkstra+MapReduce