能不能解释一下hadoop中的mapreduce，hadoopmapreduce,现在要完成一项海量数据处

文章由Byrx.net分享于2019-03-23 06:03:48评论（237）

能不能解释一下hadoop中的mapreduce，hadoopmapreduce,现在要完成一项海量数据处

现在要完成一项海量数据处理的工作。
大约有500G的.gz log文件
现在要从log中提取一些信息做统计工作~
因为文件太大，所以打算用hadoop来做。
现在已经安装了hadoop，然后需要自己写mapreduce
打算用脚本来写，比如shell，python。
可是因为刚入手，所以对mapreduce不是很理解。
不知哪位高手能用生动的语言解释一下什么事mapreduce，对于我这个问题来说，mapreduce有分别起到什么作用呢？

编橙之家文章，

热门文章：

有哪些支持C语言的流化程序(类似protobuf/thi
rq总是No module named XX，rqnamed,使用python rq作
Flask-Login中@login_manager.user_loader是做什么的？
使用eventlet之后反而性能更差的一组测试例子
db.session.commit()的时候抛出sqlalchemy.exc.Integri
Flask-admin 中如何把两个关联的Model在同一个

能不能解释一下hadoop中的mapreduce，hadoopmapreduce,现在要完成一项海量数据处

能不能解释一下hadoop中的mapreduce，hadoopmapreduce,现在要完成一项海量数据处

相关内容

最新python问答

python~HOT