PSConfiguration封装了所有XDML中参数服务器中使用的两个组件Kudu和Hazelcast所有的配置参数和PS相关的参数。
- 使用get和set方法获取和配置XDML中参数服务器的相关参数。
-
setJobType
- 定义:
setJobType(jobType:PSJobType) :this.type
- 功能描述:设置作业参数服务器的作业类型,目前有train,predict和increment_train三种作业类型。
- 参数:
- jobType: 枚举类JobType的实例
- 返回值:this
- 定义:
-
setKuduMaster
- 定义:
setKuduMaster(master: String): this.type
- 功能描述:设置kudu集群的master地址
- 参数:
- master: Kudu集群的mater节点地址
- 返回值:this
- 定义:
-
setKuduReplicaNum
- 定义:
setKuduReplicaNum(kuduReplicaNum: Int)
- 功能描述:设置kudu数据备份数,默认为3
- 参数:
- kuduReplicaNum:kudu数据备份数
- 返回值:this
- 定义:
-
setKuduPartitionNum
- 定义:
setKuduPartitionNum(kuduPartitionNum: Int)
- 功能描述:设置kudu的分区数,默认为50
- 参数:
- kuduPartitionNum:kudu存储的分区数
- 返回值:this
- 定义:
-
setKuduTableForceOverride
- 定义:
setKuduTableForceOverride(kuduTableForceOverride: Boolean): this.type
- 功能描述:设置当kudu中新建表时有重名的表出现是否强制覆盖旧表,默认为true
- 参数:
- kuduTableForceOverride:是否强制覆盖,true为覆盖,false为使用旧表
- 返回值:this
- 定义:
-
setKuduKeyColName
- 定义:
setKuduKeyColName(kuduKeyColName: String): this.type
- 功能描述:设置kudu表的键所在列的名字
- 参数:
- kuduKeyColName:键列的名字
- 返回值:this
- 定义:
-
setKuduValueColName
- 定义:
setKuduValueColName(kuduValueColName: String): this.type
- 功能描述:设置kudu表的值所在列的名字
- 参数:
- kuduValueColName:值列的名字
- 返回值:this
- 定义:
-
setKuduValueNullable
- 定义:
setKuduValueNullable(kuduValueNullable: Boolean)
- 功能描述:设置kudu表的值列是否可以为null,默认为false
- 参数:
- kuduValueNullable:值是否可以为null
- 返回值:this
- 定义:
-
setKuduRandomInit
- 定义:
setKuduRandomInit(kuduRandomInit: Boolean)
- 功能描述:设置是否需要参数的随机初始化,默认为false
- 参数:
- kuduRandomInit:布尔类型是否需要随机初始化值,默认范围是0-1之间随机值,可以通过setKuduRandomInit方法设置随机范围。
- 返回值:this
- 定义:
-
setHzClusterNum
- 定义:
setHzClusterNum(hzClusterNum:Int):this.type
- 功能描述:配置在参数服务器启动的时候需要启动的hz的节点数,默认为50
- 参数:
- hzClusterNum:参数服务器中需要启动的hz节点数
- 返回值:this
- 定义:
-
setHzPartitionNum
- 定义:
setHzPartitionNum(hzPartitionNum: Int): this.type
- 功能描述:设置hz的分区数,默认为271
- 参数:
- hzPartitionNum:Hazelcast的分区数
- 返回值:this
- 定义:
-
setHzClientThreadCount
- 定义:
setHzClientThreadCount(hzClientThreadCount: Int): this.type
- 功能描述:设置hazelcast的client最大处理线程数,默认为20
- 参数:
- hzClientThreadCount:hzclient的线程数
- 返回值:this
- 定义:
-
setHzOperationThreadCount
- 定义:
setHzOperationThreadCount(hzOperationThreadCount:Int) :this.type
- 功能描述:设置hz的server最大操作线程数,默认是20
- 参数:
- hzOperationThreadCount:hz的server最大操作线程数
- 返回值:this
- 定义:
-
setHzMaxCacheSizePerPartition
- 定义:
setHzMaxCacheSizePerPartition(hzMaxCacheSizePerPartition: Int): this.type
- 功能描述:设置Hz的单个分区最大缓存数据量,默认是50000000
- 参数:
- hzMaxCacheSizePerPartition:Hz的单个分区最大缓存数据量
- 返回值:this
- 定义:
-
setHzWriteDelaySeconds
- 定义:
setHzWriteDelaySeconds(hzWriteDelaySeconds: Int): this.type
- 功能描述:设置hz异步向kudu中持久化数据的时间间隔,单位为s,默认为20
- 参数:
- hzWriteDelaySeconds:久化数据的时间间隔
- 返回值:this
- 定义:
-
setHzWriteBatchSize
- 定义:
setHzWriteBatchSize(hzWriteBatchSize: Int): this.type
- 功能描述:设置hz写入的batchsize
- 参数:
- hzWriteBatchSize:hz写入的batchsize
- 返回值:this
- 定义:
-
setHzHeartbeatTime
- 定义:
setHzHeartbeatTime(hzHeartbeatTime: Int): this.type
- 功能描述:设置hz server的心跳时间,单位为ms,默认为3000
- 参数:
- hzHeartbeatTime:hz心跳时间
- 返回值:this
- 定义:
-
setHzClientHeartbeatTime
- 定义:
setHzClientHeartbeatTime(hzClientHeartbeatTime: Int): this.type
- 功能描述:设置hz client的心跳时间,
- 参数:
- hzClientHeartbeatTime:hz client的心跳时间
- 返回值:this
- 定义:
-
setHzIOThreadCount
- 定义:
setHzIOThreadCount(hzIOThreadCount:Int):this.type
- 功能描述:设置hazelcast的IO操作的线程数
- 参数:
- hzIOThreadCount:IO操作线程数
- 返回值:this
- 定义:
-
setPsTableName
- 定义:
setPsTableName(psTableName: String*): this.type
- 功能描述:设置本次作业使用的PS中的表名
- 参数:
- psTableName:为可变参数,参数服务器中使用的表名,如果使用多张表,可以设置多个。
- 返回值:this
- 定义:
-
setPsDataType
- 定义:
setPsDataType(psDataType: PSDataType): this.type
- 功能描述:设置参数服务器中使用的value的数据类型
- 参数:
- psDataType:PSDataType的枚举类型,目前包括Float,Double,Float_array和Double_array
- 返回值:this
- 定义:
-
setPsDataLength
- 定义:
setPsDataLength(psDataLength: Int): this.type
- 功能描述:设置参数服务器中使用的value的数据长度
- 参数:
- psDataLength:参数服务器中value的数据长度
- 返回值:this
- 定义:
-
setPredictModelPath
- 定义:
setPredictModelPath(predictModelPath:String):this.type
- 功能描述:设置预测作业中需要使用的模型路径
- 参数:
- predictModelPath:需要载入模型的HDFS路径
- 返回值:this
- 定义: