Aprendizaje por refuerzo y Q-Learning no significan lo mismo, ni siquiera son la misma cosa... Q-Learning es un algoritmo de aprendizaje por refuerzo, mientras que aprendizaje por refuerzo es una rama de la inteligencia artificial. Aún así, buena explicación de Q-Learning; de saber nada, ahora lo entiendo un poco mejor :)