我去六六六

积分:38
上传文件:1
下载次数:11
注册日期:2017-08-22 16:31:24

上传列表
1709.04326.zip - 多智能体设置在机器学习中的重要性日益突出。超过了最近的大量关于深度的工作多agent强化学习,层次强化学习,生成对抗网络和分散优化都可以看作是这种设置的实例。然而,多学习代理人的存在这些设置使得培训问题的非平稳常常导致不稳定的训练或不想要的最终结果。我们提出学习与对手的学习意识(萝拉),一种方法,原因的预期。其他代理的学习。罗拉学习规则包括一个额外的术语,解释了在预期的参数更新的代理政策其他药物。我们发现,利用似然比策略梯度更新的方法,可以有效地计算萝拉更新规则,使该方法适合于无模型强化学习。这种方法因此规模。大量的参数和输入空间和非线性函数逼近。初步结果表明,遭遇两萝拉剂导致出现针锋相对针锋相对因此,在无限重复的囚徒困境中进行合作,而独立学习则没有。在这域,LOLA也得到更高的支出相对于朴素的学习者,并且对基于高阶梯度法的开发具有鲁棒性。应用于无限重复 便士匹配,只有萝拉剂收敛到纳什平衡.我们也将萝拉应用到网格世界任务中。一个嵌入式的社会困境使用深复发性政策。再次,通过考虑其他Agent的学习,LOLA代理商学会合作出于私利。,2017-10-12 19:18:42,下载12次

近期下载
SingleNeuralNetwork.rar - 神经网络算法,股票 开盘 收盘 最高 最低 预测股票的趋势
预测.zip - BP神经网络模型预测的Python代码实现,测试有效
bp.zip - 一种BP神经网络的PYTHON代码,可用于简单预测等
bp.zip - python 实现的bp神经网络预测,数据已经有,可以直接替换,叠加次数还有步长可以自己设置。
libsvm-3.22.zip - libsvm3-22 svm库 比较新。用起来很好。 LIBSVM是台湾大学林智仁(LinChih-Jen)教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用。
SVM-timeseries.zip - 基于SVM的时序序列预测,用python实现,内附测试数据,方便可用。
Weighted-HMM-AR-model.rar - 一种基于加权隐马尔可夫的自回归状态预测模型
svm_series.rar - 用python实现的SVM回归预测的程序,通过Anaconda实现对机器学习包sklearn的调用。
svm.rar - 支持向量机python实现算法,回归、分类、预测
MIT-questionsaanswers.zip - MIT机器学习的习题和答案哦,比较齐全,可以下载来参考一下子。
MiniDraw.rar - 实现一个小型绘图板软件系统,具有方便的图形用户界面,具有编辑、打开、保存和各种绘图功能(主类是MiniDrawPad)。

收藏