首页 > 其他 > 详细

Hadoop

时间:2019-05-01 22:05:55      阅读:135      评论:0      收藏:0      [点我收藏+]
Bigdata:
结构化数据:约束
半结构化数据:
非结构化数据:没有元数据;

    搜索引擎:搜索组件、索引组件
        蜘蛛程序:

        存储:
            分析处理:

                2003年:The Google File System
                    2004年:MapReduce:Simplified Data Processing On Large Cluster
                    2006年:BigTable:A Distributed Storage System for Structure Data

                    HDFS + MapReduce = Hadoop
                    Hbase

                    Nutch

    批处理:

    函数式编程:
        Lisp, ML函数式编程语言:高阶函数;
                map, fold
                        map:
                                map(f())
                                    map:接受一个函数为参数,并将其应用于列表中的所有元素;从而生成一个结果列表
                          fold:
                                接受两个参数:函数,初始值
                                        fold(g(),init)

            mapreduce:
                mapper:
                    reducer:
                    shuffle and sort

Hadoop

原文:https://blog.51cto.com/smoke520/2388236

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!