bigdata-learning

zookeeper-learning

kafka-learning

hbase-learning

elasticsearch-learning

hadoop-learning

spark-learing

flink-learning

flinkcdc-learning

机器学习

Spark MLib Parameter Server TensorFlow

Spark MLib

ALS MLP DAG （Directed Acyclic Graph，有向无环图 job -> stage -> task Random Forest（随机森林） GBDT gradient boosting decision tree

TensorFlow、PyTorch

RNN、LSTM

Parameter Server

$$F(w) = \sum_{i=0}^N l(x_i, y_i, w) + \Omega(w)$$

Parameter Server分为两大部分：服务器节点组(server group)和多个工作节点组(worker group)。资源管理中心(resource manager)负责总体的资源分配调度。服务器节点组内部包含多个服务器节点(server node)，每个服务器节点负责维护一部分参数，服务器管理中心(server manager)负责维护和分配server资源。每个工作节点组对应一个Application（即一个模型训练任务），工作节点组之间，以及工作节点组内部的任务节点之间并不通信，任务节点只与server通信

Parameter Server仅仅是一个管理并行训练梯度的权重平台，并不涉及具体的模型实现，因此Parameter Server往往作为MXNet、TensorFlow的一个组件，要想具体实现一个机器学习模型，还需要依赖通用的、综合性的机器学习平台。

TensorFlow为代表的机器学习平台的工作原理

tensor pooling active function sigmoid

x w b MatMul Add ReLU

Embedding

PMML的全称是“预测模型标记语言”(Predictive Model Markup Language，PMML)，是一种通用的以XML的形式表示不同模型结构参数的标记语言。在模型上线的过程中，PMML经常作为中间媒介连接离线训练平台和线上预测平台

Scikit-learn、TensorFlow

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
.idea		.idea
data/input		data/input
flink-cdc		flink-cdc
flink-learning		flink-learning
flink-tuning		flink-tuning
flink-tutorial		flink-tutorial
flume-interceptor		flume-interceptor
gmall-flink-2		gmall-flink-2
gmall-mock		gmall-mock
hadoop-learning		hadoop-learning
hbase-learning		hbase-learning
hdfs-client		hdfs-client
project-ct		project-ct
project-learning		project-learning
spring-learning		spring-learning
sql		sql
zookeeper-learning		zookeeper-learning
.gitignore		.gitignore
README.md		README.md
README_MR.md		README_MR.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

bigdata-learning

zookeeper-learning

kafka-learning

hbase-learning

elasticsearch-learning

hadoop-learning

spark-learing

flink-learning

flinkcdc-learning

机器学习

Spark MLib

TensorFlow、PyTorch

Parameter Server

TensorFlow为代表的机器学习平台的工作原理

Embedding

推荐系统的评估问题

About

Uh oh!

Releases

Packages

Uh oh!

Languages

gottaBoy/bigdata-learning

Folders and files

Latest commit

History

Repository files navigation

bigdata-learning

zookeeper-learning

kafka-learning

hbase-learning

elasticsearch-learning

hadoop-learning

spark-learing

flink-learning

flinkcdc-learning

机器学习

Spark MLib

TensorFlow、PyTorch

Parameter Server

TensorFlow为代表的机器学习平台的工作原理

Embedding

推荐系统的评估问题

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages