drm/amdgpu: fix race condition in amd_sched_entity_push_job

nhaehnle · alexdeucher · commit 07df04dfcfe5 · 2015-12-02T15:04:04.000-05:00
As soon as we leave the spinlock after the job has been added to the job queue, we can no longer rely on the job's data to be available. I have seen a null-pointer dereference due to sched == NULL in amd_sched_wakeup via amd_sched_entity_push_job and amd_sched_ib_submit_kernel_helper. Since the latter initializes sched_job->sched with the address of the ring scheduler, which is guaranteed to be non-NULL, this race appears to be a likely culprit. Signed-off-by: Nicolai Hähnle <nicolai.haehnle@amd.com> Bugzilla: https://bugs.freedesktop.org/attachment.cgi?bugid=93079 Reviewed-by: Christian König <christian.koenig@amd.com>
diff --git a/drivers/gpu/drm/amd/scheduler/gpu_scheduler.c b/drivers/gpu/drm/amd/scheduler/gpu_scheduler.c
@@ -288,6 +288,7 @@ amd_sched_entity_pop_job(struct amd_sched_entity *entity)
  */
 static bool amd_sched_entity_in(struct amd_sched_job *sched_job)
 {
+	struct amd_gpu_scheduler *sched = sched_job->sched;
 	struct amd_sched_entity *entity = sched_job->s_entity;
 	bool added, first = false;
 
@@ -302,7 +303,7 @@ static bool amd_sched_entity_in(struct amd_sched_job *sched_job)
 
 	/* first job wakes up scheduler */
 	if (first)
-		amd_sched_wakeup(sched_job->sched);
+		amd_sched_wakeup(sched);
 
 	return added;
 }
@@ -318,9 +319,9 @@ void amd_sched_entity_push_job(struct amd_sched_job *sched_job)
 {
 	struct amd_sched_entity *entity = sched_job->s_entity;
 
+	trace_amd_sched_job(sched_job);
 	wait_event(entity->sched->job_scheduled,
 		   amd_sched_entity_in(sched_job));
-	trace_amd_sched_job(sched_job);
 }
 
 /**

Original file line number	Diff line number	Diff line change
`@@ -288,6 +288,7 @@ amd_sched_entity_pop_job(struct amd_sched_entity *entity)`
`288`	`288`	`*/`
`289`	`289`	`static bool amd_sched_entity_in(struct amd_sched_job *sched_job)`
`290`	`290`	`{`
	`291`	`+ struct amd_gpu_scheduler *sched = sched_job->sched;`
`291`	`292`	`struct amd_sched_entity *entity = sched_job->s_entity;`
`292`	`293`	`bool added, first = false;`
`293`	`294`
`@@ -302,7 +303,7 @@ static bool amd_sched_entity_in(struct amd_sched_job *sched_job)`
`302`	`303`
`303`	`304`	`/* first job wakes up scheduler */`
`304`	`305`	`if (first)`
`305`		`- amd_sched_wakeup(sched_job->sched);`
	`306`	`+ amd_sched_wakeup(sched);`
`306`	`307`
`307`	`308`	`return added;`
`308`	`309`	`}`
`@@ -318,9 +319,9 @@ void amd_sched_entity_push_job(struct amd_sched_job *sched_job)`
`318`	`319`	`{`
`319`	`320`	`struct amd_sched_entity *entity = sched_job->s_entity;`
`320`	`321`
	`322`	`+ trace_amd_sched_job(sched_job);`
`321`	`323`	`wait_event(entity->sched->job_scheduled,`
`322`	`324`	`amd_sched_entity_in(sched_job));`
`323`		`- trace_amd_sched_job(sched_job);`
`324`	`325`	`}`
`325`	`326`
`326`	`327`	`/**`