Tài liệu tham khảo |
Loại |
Chi tiết |
Sleeman and P. Edwards (eds.), Proceedings of the Ninth International Conference on Machine Learning, Aberdeen: Morgan Kaufmann, 1992 |
Sách, tạp chí |
Tiêu đề: |
Proceedings of the Ninth International Conference on Machine Learning |
Tác giả: |
Sleeman, P. Edwards |
Nhà XB: |
Morgan Kaufmann |
Năm: |
1992 |
|
Sutton, R., and Barto, A., Reinforcement Learning: An Introduction, Cambridge, MA: MIT Press, 1998.Tesauro 1995 |
Sách, tạp chí |
Tiêu đề: |
Reinforcement Learning: An Introduction |
Tác giả: |
R. Sutton, A. Barto |
Nhà XB: |
MIT Press |
Năm: |
1998 |
|
Tesauro, G., “Temporal-Difference Learning and TD-Gammon,” Comm. ACM, 38(3):58-68, March, 1995 |
Sách, tạp chí |
Tiêu đề: |
Temporal-Difference Learning and TD-Gammon |
Tác giả: |
Tesauro, G |
Nhà XB: |
Comm. ACM |
Năm: |
1995 |
|
Learning,” in A. Cohn (ed.), Proceedings of the 11th European Conference on Artificial Intelligence, John Wiley & Sons, 1994.Watkins 1989 |
Sách, tạp chí |
Tiêu đề: |
Proceedings of the 11th European Conference on Artificial Intelligence |
Tác giả: |
A. Cohn |
Nhà XB: |
John Wiley & Sons |
Năm: |
1994 |
|
Watkins, C. J. C. H., Learning from Delayed Rewards, PhD thesis, Cambridge University, Cambridge, England, 1989.Willeke 1998 |
Sách, tạp chí |
Tiêu đề: |
Learning from Delayed Rewards |
Năm: |
1998 |
|
Willeke, T., “Learning Robot Behaviors with TR Trees,” unpublished memo, Robotics Laboratory, Department of Computer Science, Stanford University, May 19, 1998 |
Sách, tạp chí |
Tiêu đề: |
Learning Robot Behaviors with TR Trees |
Tác giả: |
Willeke, T |
Nhà XB: |
Robotics Laboratory, Department of Computer Science, Stanford University |
Năm: |
1998 |
|