在计算机科学中,分布式计算(英语:Distributed computing,又译为分散式计算)这个研究领域,主要研究分散系统(Distributed system)如何进行计算。分散系统是一组电子计算机(computer),通过计算机网络相互链接与通信后形成的系统。把需要进行大量计算的工程数据分区成小块,由多台计算机分别计算,在上传运算结果后,将结果统一合并得出数据结论的科学。
3.1)分布式计算的核心问题:
从理论层面,这里有两个需要解决的问题:如何将一个复杂的任务分解(毕竟,任务之间并不是完全独立的,如何同步和互斥?),如何整合?既然需要整合计算资源,来利用若干计算节点实现规模宏大的计算。这里需要解决的两大技术难题就是计算的分解(map)和聚合(reduce)
分布式计算目前有一个开源架构hadoop,它是基于mapreduce和hdfs来设计的。目前,分布式计算的一个主要应用场景是海量数据挖掘与日志分析。
原文:http://blog.csdn.net/trochiluses/article/details/19327639