初识Hadoop-Ubuntu开发环境搭建(Day09)

基础配置 (1)网络配置 (2)安装openssh-server (3)配置Java环境,安装Eclipse 在Eclipse的ini中添加java路径 配置完成创建项目 注意,JavaTools只有WIndows才会用 接下来的过程和CentOS+Windows一样,不做描述了,可以参考之前的文章
初识Hadoop-MapReduce编程(Day08)

MapReduce编程 Wordcount实现 1、开发工具介绍 (1)maven 不使用最新版本,会和Hadoop冲突,默认使用3.3.9 使用方法: 1. 下载后解压缩到安装目录,并创建仓库文件夹 2. 设置配置文件settings.xml 修改仓库位置 配置国内镜像 (2)Eclipse 设置字符集 设置Maven 2、开发wordcount…
初识Hadoop-Hadoop平台搭建和使用(Day07)

一、安装配置Hadoop 1.基础环境确认 设置IP地址等信息,能联网 修改hostname 创建对应的用户haddop 对hadoop用户配置sudo权限 切换root用户卸载默认jdk 关闭防火墙及关闭开机自启 关闭selinux 创建文件夹 安装Oracle的Jdk1.8(官方指定),解压 jdk到/opt/modules/文件夹 修改环境变…
初识Hadoop-Hadoop简介(Day06)

一、Hadoop是什么 历史背景 (1)简介 Hadoop是大数据的开源框架,主要解决两个问题:海量数据的存储和海量存储的运算 (2)Hadoop处理海量存储和海量计算的包含模块 Hadoop Common: 支持其他的Hadoop模块的通用工具,对用户来说是无感知的 Hadoop Distributed File System(HDFS)Hado…
初识Hadoop-Linux技术基础回顾及平台搭建(Day05)

一、 配置DNS(域名解析服务) (1)Linux端域名解析配置 临时修改: hostname hadoop233 永久修改 vim /etc/sysconfig/network 修改本地hosts(域名解析) vim /etc/hosts 重启网络服务(让配置生效) service network restart (2)Windows端域名解析配…
初识Hadoop-数据库技术基础-多表查询(Day04)

5、多表查询【重点、难点】 1、多表连接 如果将多张表直接连接在一起,MySQL会拼接成笛卡尔积 将第一张表中的n条记录与第二张表中的m条记录进行拼接,形成一张n*m的新表 select * from table1 inner join table2; 将商品表和商品类型表连接 select * from commodity inner join …
初识Hadoop-数据库技术基础-基础知识(Day01)

1、数据类型 整型 数值类型: 基本都用INT 浮点型 定点型 DECIMAL(M,D):DECIMAL(10,2)表示整个的数值共10位(包括小数点1位),小数点后2位,整数部分7位,共10位 企业中定点数据类型基本弃用,但在32位机器环境中用于解决浮点数精度损失问题 64位解决精度损失的问题时:浮点数以字符串的形式保存,用数值的形式读取 位类型…
初识Hadoop-数据库技术基础-MySQL介绍和安装(Day02)

主要学习内容 在企业中实现海量数据的存储 这些海量数据如何处理 MySQL数据库的分类 MySQL数据库的安装 关系型数据库(MySQL5.7) 非关系型数据库(Redis、HBase、MongoDB) NewSQL(MySQL8.0) 先打开安装包,选择开发者模式(包括服务端以及客户端) 第二步、检查安装环境,有无缺少必要的环境,需要的话自行安装…
初识Hadoop-数据库技术基础-MySQL命令与单表查询(Day03)
Jsp-Session对象
MySQL Shell使用 添加环境变量 打开cmd输入mysql -u root -p 输入密码 登录成功 登录命令语法 mysql -u user -p password (不在参数后输入) -h hostname -p port MySQL命令 SQL命令分类: DDL(数据定义语言) 用来创建数据库中的各种对象 DML(数据操纵语言) 用来…
Session对象是和请求相关的HttpSession对象,他封装了属于客户回话的所有信息 Session对象是一个内置对象,它在第一个Jsp页面被装载时自动创建,完成会话管理 然后是一个登录页面设计