AcroLearner

Machine Learning API for Cloud Service

中文  日本語  English

机器学习API使用步骤概要
AcroLearner当前提供自然语言处理的朴素贝叶斯分类器(Naive Bayes)、线性回归预测、逻辑回归分类和时间序列预测的机器学习RESTful API。
1.学习准备
1.1.定义学习主题: 设定学习类型等基础信息,可以一起附带学习项目,发行学习处理用的trainKey和获取结果用的resultKey
1.2.投入学习数据: 根据学习主题,追加单独或多个学习项目数据。如果有大量项目追加请与我联系。
2.学习处理: 输入trainKey,根据预先设定的学习主题和学习项目数据,生成对应的分类或预测模型。
   - 自然语言分类场合,按下文本分类学习按钮生成朴素贝叶斯分类器(Naive Bayes)的分类模型。
   * 现在仅进行日本语的词素解析,对于字母类语言也可以部分对应。
   - 数值的回归分析预测的场合,按下线性回归学习按钮生成对应的回归预测模型。
   - 数值的回归分类解析的场合,按下逻辑回归学习按钮生成相应的回归分类模型。
   - 时间序列回归预测的场合,按下AR/MA/ARMA/ARIMA模型的学习按钮生成相应的回归预测模型。
3.取得分类预测结果: 输入resultKey,获取文本或数值分类、数值预测结果。
   - 自然语言分类场合,在trainText输入源文本,按下文本分类解析按钮,执行解析处理,取得朴素贝叶斯分类器(Naive Bayes)解析的分类结果。
   - 数值的回归分析预测的场合,在trainText输入说明变量,按下线性回归预测按钮获取回归预测结果。
   - 在进行数值的回归分类解析时,在trainText输入说明变量,按下逻辑回归分类按钮即可获取回归分类概率结果。
   - 时间序列回归预测的场合,输入适当参数,按下AR/MA/ARMA/ARIMA模型的预测按钮根据预先生成的预测模型取得预测结果。
**AR: Autoregressive; MA: Moving average; ARMA: Autoregressive moving average; ARIMA: Autoregressive integrated moving average
**也准备了统计计算工具API。
** 其他的信息取得、更新、删除等API也请自由尝试。

1.学习准备

   1.1.定义学习主题
NameTypeURLJsonParamQueryParam

01105004
post
追加机器学习的主题。
(language=0:English, 1:Japanese, 2:Other;  partOfSpeech: 名词,形容词,动词,副词,连体词,助词,助动词,接头词,接续词,记号 等,仅对日文的文本分类有效)
(trainType=1:Naivebayes文本分类, 2:线性回归, 3:逻辑回归, 4:时间序列AR, 5:时间序列MA, 6:时间序列ARMA, 7:时间序列ARIMA)
可以同时登录学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。
若成功返回,请记录下返回的trainKeyresultKey

01105005
put
更新现有的学习主题。
(language=0:English, 1:Japanese, 2:Other;  partOfSpeech: 名词,形容词,动词,副词,连体词,助词,助动词,接头词,接续词,记号 等,仅对日文的文本分类有效)
(trainType=1:Naivebayes文本分类, 2:线性回归, 3:逻辑回归, 4:时间序列AR, 5:时间序列MA, 6:时间序列ARMA, 7:时间序列ARIMA)
可以同时登录学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。

01105003
get
取得指定的学习主题属性信息(包括resultKey)。

01105006
delete
删除现有的学习主题。

01105007
put
设定学习主题的状态。(StatusId=0:未生效; 1:有效; 2:伦理删除)
重要: 在执行下面的学习、解析或预测处理之前,需要预先在这里设定为《1:有效》。

   1.2.投入学习数据
NameTypeURLJsonParamQueryParam

01106004
post
追加指定学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。

01106005
put
更新指定学习主题的项目信息(可多项)。
- 文本分类的场合,需要设定category,同一个category也可以登录多个项目信息。
- 线性回归的场合,至少需要登录2个数值项目的trainTexttrainText里的各个数值用空格分割,各个项目trainText里的数值个数需要保持一致,最后一个项目的trainText里保存实测值。
- 逻辑回归的场合,也至少需要登录2个项目的trainText,最后一个项目的trainText里保存分类,可以是字符串,trainText的各个数值或字符串用空格分割,各个项目trainText里的数值或字符串个数需要保持一致。
- 时间序列回归预测的场合,仅需要登录一个项目的trainTexttrainText里的各个数值用空格分割。

01106001
get
取得指定学习主题的项目一览。

01106002
get
取得指定学习主题的项目一览CSV。

01106003
get
取得指定学习主题的项目信息。

01106006
delete
删除指定学习主题的项目信息(可以指定多个项目编号)。

2.学习处理(生成分类预测模型)

NameTypeURLJsonParamQueryParam

01105008
get
根据学习项目里预先导入的学习文本数据集,生成Naive Bayes(朴素贝叶斯)分类模型。根据学习项目的数量,有些场合的处理时间或许稍长。

01105010
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的线性单回归或重回归模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔)

01105012
post
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的逻辑回归分类模型。这里的测试用json输入是可选项,已经投入的学习数据集的一部分可以作为测试数据使用。
返回的学习结果一览的最后一行的精度系数(Score)值如果接近于1,将会得到较好的计算精度。
(testPercent: 已经投入的学习数据集中测试用数据的比例 learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔)

01105014
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的自回归AR模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; pOrder: 自回归的回数)

01105016
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的移动平均MA模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; qOrder: 移动平均回数)

01105018
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的自回归移动平均ARMA模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; pOrder: 自回归的回数; qOrder: 移动平均回数)

01105020
get
根据学习项目里预先导入的学习数据集(空格分隔的数值文字列),生成对应的自回归差分移动平均ARIMA模型。返回的学习结果一览的最后一行的决定系数(Score)值如果接近于1,将会得到较好的预测结果。
(learnCount: 学习回数 learnRate: 学习增分比率 interval: 学习误差返回间隔; pOrder: 自回归的回数; dOrder: 差分阶数; qOrder: 移动平均回数)

3.取得分类预测结果

NameTypeURLJsonParamQueryParam

01105009
post
赋予文本信息,取得Naive Bayes(朴素贝叶斯)分类模型的解析结果。根据学习项目的数量,有些场合的处理时间或许稍长。

01105011
post
根据生成的线性单回归或重回归模型执行预测处理,返回预测结果。

01105013
post
根据生成的逻辑回归模型执行分类处理,返回分类概率结果。

01105015
get
根据生成的自回归AR模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

01105017
get
根据生成的移动平均MA模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

01105019
get
根据生成的自回归移动平均ARMA模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

01105021
get
根据生成的自回归差分移动平均ARIMA模型执行预测处理,返回预测结果。
(outStartNo: 预测结果返回值的开始序号; outEndNo: 预测结果返回值的结束序号; cycleStartNo: 原始学习序列的周期开始序号; cyclePeriod:原始学习序列的周期)

统计计算工具

NameTypeURLJsonParamQueryParam

01301008
post
返回平均、几何平均、平方平均、中间值、最频值、最小值、最大值、合计、计数、分散、母分散、标准偏差、总偏差、共分散、总相关系数、偏差矩阵、共分散矩阵、pearsons相关矩阵、spearmans相关矩阵、kendalls相关矩阵等统计结果。如果要进行线性回归学习,建议说明变量和目的变量的相关系数要达到0.7以上。

01301009
post
返回平均、几何平均、平方平均、中间值、最频值、最小值、最大值、合计、计数、分散、母分散、标准偏差、对数转换、对数差分转换、比率转换、Logit转换、移动平均、移动中央、白色噪音、n阶差分、自己共分散、自己相关系数、偏自己共分散、偏自己相关系数的统计值。
(moveInterval:移动平均、中央的计算区间; convertMode:转换模式(0:original,1:Diff,2:Log,3:LogDiff,4:Ratio,5:Logit); smoothMode:平滑模式(0:no,1:MoveAverage,2:MoveMedian); diffOrder:差分阶数)