virglrenderer/src/venus/vkr_ring.c

/*
 * Copyright 2021 Google LLC
 * SPDX-License-Identifier: MIT
 */

#include "vkr_ring.h"

#include <assert.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>

#include "os/os_thread.h"
#include "util/u_math.h"
#include "util/u_memory.h"
#include "virgl_context.h"
#include "virgl_util.h"

enum vkr_ring_status_flag {
   VKR_RING_STATUS_IDLE = 1u << 0,
};

static void
vkr_ring_store_head(struct vkr_ring *ring)
{
   /* the renderer is expected to load the head with memory_order_acquire,
    * forming a release-acquire ordering
    */
   atomic_store_explicit(ring->shared.head, ring->cur, memory_order_release);
}

static uint32_t
vkr_ring_load_tail(const struct vkr_ring *ring)
{
   /* the driver is expected to store the tail with memory_order_release,
    * forming a release-acquire ordering
    */
   return atomic_load_explicit(ring->shared.tail, memory_order_acquire);
}

static void
vkr_ring_store_status(struct vkr_ring *ring, uint32_t status)
{
   atomic_store_explicit(ring->shared.status, status, memory_order_seq_cst);
}

static void
vkr_ring_read_buffer(struct vkr_ring *ring, void *data, size_t size)
{
   const size_t offset = ring->cur & ring->buffer_mask;
   assert(size <= ring->buffer_size);
   if (offset + size <= ring->buffer_size) {
      memcpy(data, (const uint8_t *)ring->shared.buffer + offset, size);
   } else {
      const size_t s = ring->buffer_size - offset;
      memcpy(data, (const uint8_t *)ring->shared.buffer + offset, s);
      memcpy((uint8_t *)data + s, ring->shared.buffer, size - s);
   }

   ring->cur += size;
}

struct vkr_ring *
vkr_ring_create(const struct vkr_ring_layout *layout,
                void *shared,
                struct virgl_context *ctx,
                uint64_t idle_timeout)
{
   struct vkr_ring *ring;
   int ret;

   ring = calloc(1, sizeof(*ring));
   if (!ring)
      return NULL;

#define ring_attach_shared(member)                                                       \
   ring->shared.member = (void *)((uint8_t *)shared + layout->member##_offset)
   ring_attach_shared(head);
   ring_attach_shared(tail);
   ring_attach_shared(status);
   ring_attach_shared(buffer);
   ring_attach_shared(extra);
#undef ring_attach_shared

   assert(layout->buffer_size && util_is_power_of_two(layout->buffer_size));
   ring->buffer_size = layout->buffer_size;
   ring->buffer_mask = layout->buffer_size - 1;
   ring->extra_size = layout->extra_size;

   /* we will manage head and status, and we expect them to be 0 initially */
   if (*ring->shared.head || *ring->shared.status) {
      free(ring);
      return NULL;
   }

   ring->cmd = malloc(ring->buffer_size);
   if (!ring->cmd) {
      free(ring);
      return NULL;
   }

   ring->context = ctx;
   ring->idle_timeout = idle_timeout;

   ret = mtx_init(&ring->mutex, mtx_plain);
   if (ret != thrd_success) {
      free(ring->cmd);
      free(ring);
      return NULL;
   }
   ret = cnd_init(&ring->cond);
   if (ret != thrd_success) {
      mtx_destroy(&ring->mutex);
      free(ring->cmd);
      free(ring);
      return NULL;
   }

   return ring;
}

void
vkr_ring_destroy(struct vkr_ring *ring)
{
   assert(!ring->started);
   mtx_destroy(&ring->mutex);
   cnd_destroy(&ring->cond);
   free(ring->cmd);
   free(ring);
}

static uint64_t
vkr_ring_now(void)
{
   const uint64_t ns_per_sec = 1000000000llu;
   struct timespec now;
   if (clock_gettime(CLOCK_MONOTONIC, &now))
      return 0;
   return ns_per_sec * now.tv_sec + now.tv_nsec;
}

static void
vkr_ring_relax(uint32_t *iter)
{
   /* TODO do better */
   const uint32_t busy_wait_order = 4;
   const uint32_t base_sleep_us = 10;

   (*iter)++;
   if (*iter < (1u << busy_wait_order)) {
      thrd_yield();
      return;
   }

   const uint32_t shift = util_last_bit(*iter) - busy_wait_order - 1;
   const uint32_t us = base_sleep_us << shift;
   const struct timespec ts = {
      .tv_sec = us / 1000000,
      .tv_nsec = (us % 1000000) * 1000,
   };
   clock_nanosleep(CLOCK_MONOTONIC, 0, &ts, NULL);
}

static int
vkr_ring_thread(void *arg)
{
   struct vkr_ring *ring = arg;
   struct virgl_context *ctx = ring->context;
   char thread_name[16];

   snprintf(thread_name, ARRAY_SIZE(thread_name), "vkr-ring-%d", ctx->ctx_id);
   pipe_thread_setname(thread_name);

   uint64_t last_submit = vkr_ring_now();
   uint32_t relax_iter = 0;
   int ret = 0;
   while (ring->started) {
      bool wait = false;
      uint32_t cmd_size;

      if (vkr_ring_now() >= last_submit + ring->idle_timeout) {
         ring->pending_notify = false;
         vkr_ring_store_status(ring, VKR_RING_STATUS_IDLE);
         wait = ring->cur == vkr_ring_load_tail(ring);
         if (!wait)
            vkr_ring_store_status(ring, 0);
      }

      if (wait) {
         TRACE_SCOPE("ring idle");

         mtx_lock(&ring->mutex);
         if (ring->started && !ring->pending_notify)
            cnd_wait(&ring->cond, &ring->mutex);
         vkr_ring_store_status(ring, 0);
         mtx_unlock(&ring->mutex);

         if (!ring->started)
            break;

         last_submit = vkr_ring_now();
         relax_iter = 0;
      }

      cmd_size = vkr_ring_load_tail(ring) - ring->cur;
      if (cmd_size) {
         if (cmd_size > ring->buffer_size) {
            ret = -EINVAL;
            break;
         }

         vkr_ring_read_buffer(ring, ring->cmd, cmd_size);
         ctx->submit_cmd(ctx, ring->cmd, cmd_size);
         vkr_ring_store_head(ring);

         last_submit = vkr_ring_now();
         relax_iter = 0;
      } else {
         vkr_ring_relax(&relax_iter);
      }
   }

   return ret;
}

void
vkr_ring_start(struct vkr_ring *ring)
{
   int ret;

   assert(!ring->started);
   ring->started = true;
   ret = thrd_create(&ring->thread, vkr_ring_thread, ring);
   if (ret != thrd_success)
      ring->started = false;
}

bool
vkr_ring_stop(struct vkr_ring *ring)
{
   mtx_lock(&ring->mutex);
   if (ring->thread == thrd_current()) {
      mtx_unlock(&ring->mutex);
      return false;
   }
   assert(ring->started);
   ring->started = false;
   cnd_signal(&ring->cond);
   mtx_unlock(&ring->mutex);

   thrd_join(ring->thread, NULL);

   return true;
}

void
vkr_ring_notify(struct vkr_ring *ring)
{
   mtx_lock(&ring->mutex);
   ring->pending_notify = true;
   cnd_signal(&ring->cond);
   mtx_unlock(&ring->mutex);

   {
      TRACE_SCOPE("ring notify done");
   }
}

bool
vkr_ring_write_extra(struct vkr_ring *ring, size_t offset, uint32_t val)
{
   if (offset > ring->extra_size || sizeof(val) > ring->extra_size - offset)
      return false;

   volatile atomic_uint *dst = (void *)((uint8_t *)ring->shared.extra + offset);
   atomic_store_explicit(dst, val, memory_order_release);

   {
      TRACE_SCOPE("ring extra done");
   }

   return true;
}
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`/*`
			`* Copyright 2021 Google LLC`
			`* SPDX-License-Identifier: MIT`
			`*/`

			`#include "vkr_ring.h"`

			`#include <assert.h>`
vkr: set the names for the queue threads and ring threads Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`#include <stdio.h>`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`#include <stdlib.h>`
			`#include <string.h>`
			`#include <time.h>`

vkr: set the names for the queue threads and ring threads Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`#include "os/os_thread.h"`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`#include "util/u_math.h"`
vkr: set the names for the queue threads and ring threads Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`#include "util/u_memory.h"`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`#include "virgl_context.h"`
vkr: add some trace points for the ring Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`#include "virgl_util.h"`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago
			`enum vkr_ring_status_flag {`
			`VKR_RING_STATUS_IDLE = 1u << 0,`
			`};`

			`static void`
			`vkr_ring_store_head(struct vkr_ring *ring)`
			`{`
			`/* the renderer is expected to load the head with memory_order_acquire,`
			`* forming a release-acquire ordering`
			`*/`
			`atomic_store_explicit(ring->shared.head, ring->cur, memory_order_release);`
			`}`

			`static uint32_t`
			`vkr_ring_load_tail(const struct vkr_ring *ring)`
			`{`
			`/* the driver is expected to store the tail with memory_order_release,`
			`* forming a release-acquire ordering`
			`*/`
			`return atomic_load_explicit(ring->shared.tail, memory_order_acquire);`
			`}`

			`static void`
			`vkr_ring_store_status(struct vkr_ring *ring, uint32_t status)`
			`{`
			`atomic_store_explicit(ring->shared.status, status, memory_order_seq_cst);`
			`}`

			`static void`
			`vkr_ring_read_buffer(struct vkr_ring ring, void data, size_t size)`
			`{`
			`const size_t offset = ring->cur & ring->buffer_mask;`
			`assert(size <= ring->buffer_size);`
			`if (offset + size <= ring->buffer_size) {`
			`memcpy(data, (const uint8_t *)ring->shared.buffer + offset, size);`
			`} else {`
			`const size_t s = ring->buffer_size - offset;`
			`memcpy(data, (const uint8_t *)ring->shared.buffer + offset, s);`
			`memcpy((uint8_t *)data + s, ring->shared.buffer, size - s);`
			`}`

			`ring->cur += size;`
			`}`

			`struct vkr_ring *`
			`vkr_ring_create(const struct vkr_ring_layout *layout,`
			`void *shared,`
			`struct virgl_context *ctx,`
			`uint64_t idle_timeout)`
			`{`
			`struct vkr_ring *ring;`
			`int ret;`

			`ring = calloc(1, sizeof(*ring));`
			`if (!ring)`
			`return NULL;`

vkr: format with clang-format clang-format insists on using .clang-format. This commit adds docs/vkr-clang-format as a doc. To use it, $ cd src $ ln -sf ../docs/vkr-clang-format .clang-format $ clang-format -style file -i vkr_* Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`#define ring_attach_shared(member) \`
			`ring->shared.member = (void )((uint8_t )shared + layout->member##_offset)`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`ring_attach_shared(head);`
			`ring_attach_shared(tail);`
			`ring_attach_shared(status);`
			`ring_attach_shared(buffer);`
			`ring_attach_shared(extra);`
			`#undef ring_attach_shared`

			`assert(layout->buffer_size && util_is_power_of_two(layout->buffer_size));`
			`ring->buffer_size = layout->buffer_size;`
			`ring->buffer_mask = layout->buffer_size - 1;`
			`ring->extra_size = layout->extra_size;`

			`/* we will manage head and status, and we expect them to be 0 initially */`
			`if (ring->shared.head \|\| ring->shared.status) {`
			`free(ring);`
			`return NULL;`
			`}`

			`ring->cmd = malloc(ring->buffer_size);`
			`if (!ring->cmd) {`
			`free(ring);`
			`return NULL;`
			`}`

			`ring->context = ctx;`
			`ring->idle_timeout = idle_timeout;`

			`ret = mtx_init(&ring->mutex, mtx_plain);`
			`if (ret != thrd_success) {`
			`free(ring->cmd);`
			`free(ring);`
			`return NULL;`
			`}`
			`ret = cnd_init(&ring->cond);`
			`if (ret != thrd_success) {`
			`mtx_destroy(&ring->mutex);`
			`free(ring->cmd);`
			`free(ring);`
			`return NULL;`
			`}`

			`return ring;`
			`}`

			`void`
			`vkr_ring_destroy(struct vkr_ring *ring)`
			`{`
			`assert(!ring->started);`
			`mtx_destroy(&ring->mutex);`
			`cnd_destroy(&ring->cond);`
			`free(ring->cmd);`
			`free(ring);`
			`}`

			`static uint64_t`
			`vkr_ring_now(void)`
			`{`
			`const uint64_t ns_per_sec = 1000000000llu;`
			`struct timespec now;`
			`if (clock_gettime(CLOCK_MONOTONIC, &now))`
			`return 0;`
			`return ns_per_sec * now.tv_sec + now.tv_nsec;`
			`}`

			`static void`
			`vkr_ring_relax(uint32_t *iter)`
			`{`
			`/* TODO do better */`
			`const uint32_t busy_wait_order = 4;`
			`const uint32_t base_sleep_us = 10;`

			`(*iter)++;`
			`if (*iter < (1u << busy_wait_order)) {`
			`thrd_yield();`
			`return;`
			`}`

			`const uint32_t shift = util_last_bit(*iter) - busy_wait_order - 1;`
			`const uint32_t us = base_sleep_us << shift;`
			`const struct timespec ts = {`
			`.tv_sec = us / 1000000,`
			`.tv_nsec = (us % 1000000) * 1000,`
			`};`
			`clock_nanosleep(CLOCK_MONOTONIC, 0, &ts, NULL);`
			`}`

			`static int`
			`vkr_ring_thread(void *arg)`
			`{`
			`struct vkr_ring *ring = arg;`
			`struct virgl_context *ctx = ring->context;`
vkr: set the names for the queue threads and ring threads Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`char thread_name[16];`

			`snprintf(thread_name, ARRAY_SIZE(thread_name), "vkr-ring-%d", ctx->ctx_id);`
			`pipe_thread_setname(thread_name);`

vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`uint64_t last_submit = vkr_ring_now();`
			`uint32_t relax_iter = 0;`
			`int ret = 0;`
			`while (ring->started) {`
			`bool wait = false;`
			`uint32_t cmd_size;`

			`if (vkr_ring_now() >= last_submit + ring->idle_timeout) {`
			`ring->pending_notify = false;`
			`vkr_ring_store_status(ring, VKR_RING_STATUS_IDLE);`
			`wait = ring->cur == vkr_ring_load_tail(ring);`
			`if (!wait)`
			`vkr_ring_store_status(ring, 0);`
			`}`

			`if (wait) {`
vkr: add some trace points for the ring Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`TRACE_SCOPE("ring idle");`

vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`mtx_lock(&ring->mutex);`
			`if (ring->started && !ring->pending_notify)`
			`cnd_wait(&ring->cond, &ring->mutex);`
			`vkr_ring_store_status(ring, 0);`
			`mtx_unlock(&ring->mutex);`

			`if (!ring->started)`
			`break;`

			`last_submit = vkr_ring_now();`
			`relax_iter = 0;`
			`}`

			`cmd_size = vkr_ring_load_tail(ring) - ring->cur;`
			`if (cmd_size) {`
			`if (cmd_size > ring->buffer_size) {`
			`ret = -EINVAL;`
			`break;`
			`}`

			`vkr_ring_read_buffer(ring, ring->cmd, cmd_size);`
			`ctx->submit_cmd(ctx, ring->cmd, cmd_size);`
			`vkr_ring_store_head(ring);`

			`last_submit = vkr_ring_now();`
			`relax_iter = 0;`
			`} else {`
			`vkr_ring_relax(&relax_iter);`
			`}`
			`}`

			`return ret;`
			`}`

			`void`
			`vkr_ring_start(struct vkr_ring *ring)`
			`{`
			`int ret;`

			`assert(!ring->started);`
			`ring->started = true;`
			`ret = thrd_create(&ring->thread, vkr_ring_thread, ring);`
			`if (ret != thrd_success)`
			`ring->started = false;`
			`}`

			`bool`
			`vkr_ring_stop(struct vkr_ring *ring)`
			`{`
			`mtx_lock(&ring->mutex);`
			`if (ring->thread == thrd_current()) {`
			`mtx_unlock(&ring->mutex);`
			`return false;`
			`}`
			`assert(ring->started);`
			`ring->started = false;`
			`cnd_signal(&ring->cond);`
			`mtx_unlock(&ring->mutex);`

			`thrd_join(ring->thread, NULL);`

			`return true;`
			`}`

			`void`
			`vkr_ring_notify(struct vkr_ring *ring)`
			`{`
			`mtx_lock(&ring->mutex);`
			`ring->pending_notify = true;`
			`cnd_signal(&ring->cond);`
			`mtx_unlock(&ring->mutex);`
vkr: add some trace points for the ring Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago
			`{`
			`TRACE_SCOPE("ring notify done");`
			`}`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`}`

			`bool`
			`vkr_ring_write_extra(struct vkr_ring *ring, size_t offset, uint32_t val)`
			`{`
			`if (offset > ring->extra_size \|\| sizeof(val) > ring->extra_size - offset)`
			`return false;`

vkr: format with clang-format clang-format insists on using .clang-format. This commit adds docs/vkr-clang-format as a doc. To use it, $ cd src $ ln -sf ../docs/vkr-clang-format .clang-format $ clang-format -style file -i vkr_* Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`volatile atomic_uint dst = (void )((uint8_t *)ring->shared.extra + offset);`
vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`atomic_store_explicit(dst, val, memory_order_release);`

vkr: add some trace points for the ring Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Yiwei Zhang <zzyiwei@chromium.org> 3 years ago			`{`
			`TRACE_SCOPE("ring extra done");`
			`}`

vkr: add vkr_ring In addition to virgl_renderer_submit_cmd, vkr_ring can also be used to submit commands. Signed-off-by: Chia-I Wu <olvaffe@gmail.com> Reviewed-by: Ryan Neph <ryanneph@google.com> Reviewed-by: Gert Wollny <gert.wollny@collabora.com> 4 years ago			`return true;`
			`}`