MosesDon

获赞数

关注数

粉丝数

南京信息工程大学滨江学院 | 电子信息工程

IP 属地未知

2020-05-06 加入

浏览 7.2k

主页回答提问文章40

╭╮╱╭┳━━━┳╮╱╭╮
┃┃╱┃┃╭━╮┃┃╱┃┃
┃╰━╯┃┃┃┃┃╰━╯┃
╰━━╮┃┃┃┃┣━━╮┃
╱╱╱┃┃╰━╯┃╱╱┃┃

个人简介什么都没有

7 声望

量化

高并发

mssql

python

黄金勋章

暂未获得该勋章

如何获得

白银勋章

暂未获得该勋章

如何获得

1 青铜勋章

见多识广

个人动态

发布了文章2021-01-29
量化初识
 MosesDon
Python量化半自动、追踪止损、分批止盈、全仓分批止盈示例Python量化交易多线程和异步协程
发布了文章2020-12-29
sql优化
 MosesDon
sql优化SQL调优
发布了文章2020-12-22
Flume入门案例
 MosesDon
Flume入门案例1 监控端口数据官方案例1.1 案例需求：使用Flume监听一个端口，收集该端口数据，并打印到控制台。1.2 需求分析：1.3 实现步骤：1.3.1 安装netcat工具 {代码...} 1.3.2 判断44444端口是否被占用 {代码...} 1.3.3 创建Flume Agent配置文件flume-netcat-lo...
发布了文章2020-12-15
Flume拓扑结构--Flink进阶认识
 MosesDon
Flume Agent连接此模式不建议桥接过多的flume数量， flume数量过多不仅会影响传输速率，而且一旦传输过程中某个节点flume宕机，会影响整个传输系统。
发布了文章2020-12-15
Flume Agent内部原理-Flink进阶认识
 MosesDon
ChannelSelector的作用就是选出Event将要被发往哪个Channel。其共有两种类型，分别是Replicating（复制）和Multiplexing（多路复用）。ReplicatingSelector会将同一个Event发往所有的Channel，Multiplexing会根据相应的原则，将不同的Event发往不同的Channel。
发布了文章2020-12-15
flume初识-基本概念
 MosesDon
1 定义Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构，灵活简单。2 flume基础框架2.1 AgentAgent是一个JVM进程，它以事件的形式将数据从源头送至目的。2.2 SourceSource是负责接收数据到Flume Agent的组...
发布了文章2020-12-15
flume初识-配置conf文件
 MosesDon
Taildir Source维护了一个json格式的position File，其会定期的往position File中更新每个文件读取到的最新的位置，因此能够实现断点续传。Position File的格式如下：
发布了文章2020-12-13
hive压缩和列式存储
 MosesDon
当Hive将输出写入到表中时，输出内容同样可以进行压缩。属性hive.exec.compress.output控制着这个功能。用户可能需要保持默认设置文件中的默认值false，这样默认的输出就是非压缩的纯文本文件了。用户可以通过在查询语句或执行脚本中设置这个值为true，来开启输出结...
发布了文章2020-12-13
修改Hadoop集群具有Snappy压缩方式
 MosesDon
1．查看hadoop checknative命令使用 {代码...} 2．查看hadoop支持的压缩方式 {代码...} 3．将编译好的支持Snappy压缩的hadoop-2.7.2.tar.gz包导入到 {代码...} 4．解压hadoop-2.7.2.tar.gz到当前路径 {代码...} 5．进入到/opt/software/hadoop-2.7.2/lib/native路径...
发布了文章2020-12-12
sql执行初识
 MosesDon
select * from 表1 join 表2 on xxx where xxx group by xxx having xxx order by limit xxx
发布了文章2020-12-12
sql-view(hive为例)
MosesDon
视图(View) ：视图是一种特殊(逻辑上存在)的表视图是只读的视图可以将敏感的字段进行保护，只将用户需要查询的字段暴露在视图中，保护数据隐私create view 视图名 as select 语句SQL VIEW 使用语法
发布了文章2020-12-12
hive&hadoop 配置项的调优-Java heap space
MosesDon
设置 set io.sort.mb=10; 默认值是100io.sort.mb 的作用排序所使用的内存数量。默认值：100M，需要与mapred.child.java.opts相配默认：-Xmx200m。不能超过mapred.child.java.opt设置，否则会OOM。
发布了文章2020-12-12
文件输入文件夹下所有文件：(null) entry in command string: null ls -F
MosesDon
hadoop 的 input Path 设为文件夹路径时，需要读取文件夹路径下所有文件报如下错误：原因：报错提示的意思是说，Path这个路径需要是一个具体的文件，而不能是文件夹。解决方案： 1、改为具体的文件的路径，则输入为该具体的文件 2、在具体的文件夹路径作如下修改，则...
发布了文章2020-12-09
hive常用函数
 MosesDon
给值为NULL的数据赋值，它的格式是NVL( string1, replace_with)。它的功能是如果string1为NULL，则NVL函数返回replace_with的值，否则返回string1的值，如果两个参数都为NULL ，则返回NULL。
发布了文章2020-12-09
hive优化
 MosesDon
Fetch抓取是指，Hive中对某些情况的查询可以不必使用MapReduce计算。例如：SELECT * FROM employees;在这种情况下，Hive可以简单地读取employee对应的存储目录下的文件，然后输出查询结果到控制台。在hive-default.xml.template文件中hive.fetch.task.conversion默认...
发布了文章2020-12-06
大数据集群安装——hadoop
MosesDon
解压安装文件到/opt/server下面tar -zxvf hadoop-2.7.2.tar.gz -C /opt/server/查看是否解压成功
发布了文章2020-12-03
Hive基本操作
 MosesDon
注意：1、load操作不会对数据做任何的转换修改操作2、从本地linux load数据文件是复制文件的过程3、从hdfs load数据文件是移动文件的过程4、load操作也支持向分区表中load数据，只不过需要添加分区列的值
发布了文章2020-12-01
hive-分区表
 MosesDon
MR：在MapTask输出key-value时，为每个key-value计算一个区号，同一个分区的数据，会被同一个reduceTask处理这个分区的数据，最终生成一个结果文件！通过分区，将MapTask输出的key-value经过reduce后，分散到多个不同的结果文件中！Hive: 将表中的数据，分散到表目...
发布了文章2020-11-19
hadoop-API开发问题
 MosesDon
报错信息 {代码...} 参考链接Hadoop Java API 简单使用个人解决方式：由于用的父子maven文件2个都加了对应jar版本依赖
发布了文章2020-10-19
数据结构与算法-栈、队列
 MosesDon
队列题目1数组实现队列tips：使用环形数组 {代码...} 题目2栈怎么实现图？队列怎么实现图？

加载更多