博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop综合大作业
阅读量:5300 次
发布时间:2019-06-14

本文共 302 字,大约阅读时间需要 1 分钟。

Hadoop综合大作业 要求:

1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。

    1、启动hadoop

    

  2、Hdfs上创建文件夹并查看

    

  3、上传英文词频统计文本至hdfs

    

  4、启动Hive

    

  5、导入文件内容到表docs并查看

    

  6、进行词频统计

    

  7、查看统计结果

    

2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。

  

 

 

转载于:https://www.cnblogs.com/crx234/p/9079133.html

你可能感兴趣的文章
科技写作:何时用英文写作?
查看>>
微服务核心20讲 读书笔记
查看>>
努力有什么用
查看>>
nginx_tomcat
查看>>
WEB前端面试题查询整理
查看>>
【CodeForces - 598D】Igor In the Museum(bfs)
查看>>
Spark-Mllib中各分类算法的java实现(简易教程)
查看>>
给你的HTTPS添加Let's Encrypt证书
查看>>
Y1吐槽002 情绪
查看>>
vcenter api 接口获取开发
查看>>
MVC Razor模板引擎 @RenderBody、@RenderPage、@RenderSection及Html.RenderPartial、Html.RenderAction...
查看>>
红帽Linux故障定位技术详解与实例(2)
查看>>
Zabbix分布式监控系统实践 自定义配置
查看>>
POJ 3579 Median(二分查找+找到第k大的值)(二分实例详解)
查看>>
【BZOJ-4213】贪吃蛇 有上下界的费用流
查看>>
FastBoot BootLoader Recovery 模式解释
查看>>
Android 上SuperUser获取ROOT权限原理解析
查看>>
CoreSight™ Technology
查看>>
LPC18xx/43xx OTP Controller driver
查看>>
[BZOJ4916]神犇和蒟蒻
查看>>