llvm-docs/doxygen/scheduler_8cpp_source.html

 //===-- scheduler.cpp - SYCL Scheduler --------------------------*- C++ -*-===//

 //

 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

 // See https://llvm.org/LICENSE.txt for license information.

 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

 //

 //===----------------------------------------------------------------------===//


 #include "detail/sycl_mem_obj_i.hpp"

 #include <detail/global_handler.hpp>

 #include <detail/graph_impl.hpp>

 #include <sycl/feature_test.hpp>

 #if SYCL_EXT_CODEPLAY_KERNEL_FUSION

 #include <detail/jit_compiler.hpp>

 #endif

 #include <detail/queue_impl.hpp>

 #include <detail/scheduler/scheduler.hpp>

 #include <detail/stream_impl.hpp>

 #include <sycl/device_selector.hpp>


 #include <chrono>

 #include <cstdio>

 #include <memory>

 #include <mutex>

 #include <set>

 #include <thread>

 #include <vector>


 namespace sycl {

 inline namespace _V1 {

 namespace detail {


 bool Scheduler::checkLeavesCompletion(MemObjRecord *Record) {

   for (Command *Cmd : Record->MReadLeaves) {

     if (!(Cmd->getType() == detail::Command::ALLOCA ||

           Cmd->getType() == detail::Command::ALLOCA_SUB_BUF) &&

         !Cmd->getEvent()->isCompleted())

       return false;

   }

   for (Command *Cmd : Record->MWriteLeaves) {

     if (!(Cmd->getType() == detail::Command::ALLOCA ||

           Cmd->getType() == detail::Command::ALLOCA_SUB_BUF) &&

         !Cmd->getEvent()->isCompleted())

       return false;

   }

   return true;

 }


 void Scheduler::waitForRecordToFinish(MemObjRecord *Record,

                                       ReadLockT &GraphReadLock) {

 #ifdef XPTI_ENABLE_INSTRUMENTATION

   // Will contain the list of dependencies for the Release Command

   std::set<Command *> DepCommands;

 #endif

   std::vector<Command *> ToCleanUp;

   for (Command *Cmd : Record->MReadLeaves) {

     EnqueueResultT Res;

     bool Enqueued =

         GraphProcessor::enqueueCommand(Cmd, GraphReadLock, Res, ToCleanUp, Cmd);

     if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

       throw exception(make_error_code(errc::runtime),

                       "Enqueue process failed.");

 #ifdef XPTI_ENABLE_INSTRUMENTATION

     // Capture the dependencies

     DepCommands.insert(Cmd);

 #endif

     GraphProcessor::waitForEvent(Cmd->getEvent(), GraphReadLock, ToCleanUp);

   }

   for (Command *Cmd : Record->MWriteLeaves) {

     EnqueueResultT Res;

     bool Enqueued =

         GraphProcessor::enqueueCommand(Cmd, GraphReadLock, Res, ToCleanUp, Cmd);

     if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

       throw exception(make_error_code(errc::runtime),

                       "Enqueue process failed.");

 #ifdef XPTI_ENABLE_INSTRUMENTATION

     DepCommands.insert(Cmd);

 #endif

     GraphProcessor::waitForEvent(Cmd->getEvent(), GraphReadLock, ToCleanUp);

   }

   for (AllocaCommandBase *AllocaCmd : Record->MAllocaCommands) {

     Command *ReleaseCmd = AllocaCmd->getReleaseCmd();

     EnqueueResultT Res;

     bool Enqueued = GraphProcessor::enqueueCommand(ReleaseCmd, GraphReadLock,

                                                    Res, ToCleanUp, ReleaseCmd);

     if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

       throw exception(make_error_code(errc::runtime),

                       "Enqueue process failed.");

 #ifdef XPTI_ENABLE_INSTRUMENTATION

     // Report these dependencies to the Command so these dependencies can be

     // reported as edges

     ReleaseCmd->resolveReleaseDependencies(DepCommands);

 #endif

     GraphProcessor::waitForEvent(ReleaseCmd->getEvent(), GraphReadLock,

                                  ToCleanUp);

   }

 }


 EventImplPtr Scheduler::addCG(

     std::unique_ptr<detail::CG> CommandGroup, const QueueImplPtr &Queue,

     bool EventNeeded, sycl::detail::pi::PiExtCommandBuffer CommandBuffer,

     const std::vector<sycl::detail::pi::PiExtSyncPoint> &Dependencies) {

   EventImplPtr NewEvent = nullptr;

   const CGType Type = CommandGroup->getType();

   std::vector<Command *> AuxiliaryCmds;

   std::vector<std::shared_ptr<const void>> AuxiliaryResources;

   AuxiliaryResources = CommandGroup->getAuxiliaryResources();

   CommandGroup->clearAuxiliaryResources();


   bool ShouldEnqueue = true;

   {

     WriteLockT Lock = acquireWriteLock();


     Command *NewCmd = nullptr;

     switch (Type) {

     case CGType::UpdateHost:

       NewCmd =

           MGraphBuilder.addCGUpdateHost(std::move(CommandGroup), AuxiliaryCmds);

       NewEvent = NewCmd->getEvent();

       break;

     case CGType::CodeplayHostTask: {

       auto Result = MGraphBuilder.addCG(std::move(CommandGroup), nullptr,

                                         AuxiliaryCmds, EventNeeded);

       NewCmd = Result.NewCmd;

       NewEvent = Result.NewEvent;

       ShouldEnqueue = Result.ShouldEnqueue;

       break;

     }

     default:

       auto Result = MGraphBuilder.addCG(

           std::move(CommandGroup), std::move(Queue), AuxiliaryCmds, EventNeeded,

           CommandBuffer, std::move(Dependencies));


       NewCmd = Result.NewCmd;

       NewEvent = Result.NewEvent;

       ShouldEnqueue = Result.ShouldEnqueue;

     }

     NewEvent->setSubmissionTime();

   }


   if (ShouldEnqueue) {

     enqueueCommandForCG(NewEvent, AuxiliaryCmds);

   }


   if (!AuxiliaryResources.empty())

     registerAuxiliaryResources(NewEvent, std::move(AuxiliaryResources));


   return NewEvent;

 }


 void Scheduler::enqueueCommandForCG(EventImplPtr NewEvent,

                                     std::vector<Command *> &AuxiliaryCmds,

                                     BlockingT Blocking) {

   std::vector<Command *> ToCleanUp;

   {

     ReadLockT Lock = acquireReadLock();


     Command *NewCmd =

         (NewEvent) ? static_cast<Command *>(NewEvent->getCommand()) : nullptr;


     EnqueueResultT Res;

     bool Enqueued;


     auto CleanUp = [&]() {

       if (NewCmd && (NewCmd->MDeps.size() == 0 && NewCmd->MUsers.size() == 0)) {

         if (NewEvent) {

           NewEvent->setCommand(nullptr);

         }

         delete NewCmd;

       }

     };


     for (Command *Cmd : AuxiliaryCmds) {

       Enqueued = GraphProcessor::enqueueCommand(Cmd, Lock, Res, ToCleanUp, Cmd,

                                                 Blocking);

       try {

         if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

           throw exception(make_error_code(errc::runtime),

                           "Auxiliary enqueue process failed.");

       } catch (...) {

         // enqueueCommand() func and if statement above may throw an exception,

         // so destroy required resources to avoid memory leak

         CleanUp();

         std::rethrow_exception(std::current_exception());

       }

     }


     if (NewCmd) {

       // TODO: Check if lazy mode.

       EnqueueResultT Res;

       try {

         bool Enqueued = GraphProcessor::enqueueCommand(

             NewCmd, Lock, Res, ToCleanUp, NewCmd, Blocking);

         if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

           throw exception(make_error_code(errc::runtime),

                           "Enqueue process failed.");

       } catch (...) {

         // enqueueCommand() func and if statement above may throw an exception,

         // so destroy required resources to avoid memory leak

         CleanUp();

         std::rethrow_exception(std::current_exception());

       }

     }

   }

   cleanupCommands(ToCleanUp);

 }


 EventImplPtr Scheduler::addCopyBack(Requirement *Req) {

   std::vector<Command *> AuxiliaryCmds;

   Command *NewCmd = nullptr;

   {

     WriteLockT Lock = acquireWriteLock();

     NewCmd = MGraphBuilder.addCopyBack(Req, AuxiliaryCmds);

     // Command was not created because there were no operations with

     // buffer.

     if (!NewCmd)

       return nullptr;

   }


   std::vector<Command *> ToCleanUp;

   try {

     ReadLockT Lock = acquireReadLock();

     EnqueueResultT Res;

     bool Enqueued;


     for (Command *Cmd : AuxiliaryCmds) {

       Enqueued = GraphProcessor::enqueueCommand(Cmd, Lock, Res, ToCleanUp, Cmd);

       if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

         throw exception(make_error_code(errc::runtime),

                         "Enqueue process failed.");

     }


     Enqueued =

         GraphProcessor::enqueueCommand(NewCmd, Lock, Res, ToCleanUp, NewCmd);

     if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

       throw exception(make_error_code(errc::runtime),

                       "Enqueue process failed.");

   } catch (...) {

     auto WorkerQueue = NewCmd->getEvent()->getWorkerQueue();

     assert(WorkerQueue && "WorkerQueue for CopyBack command must be not null");

     WorkerQueue->reportAsyncException(std::current_exception());

   }

   EventImplPtr NewEvent = NewCmd->getEvent();

   cleanupCommands(ToCleanUp);

   return NewEvent;

 }


 Scheduler &Scheduler::getInstance() {

   return GlobalHandler::instance().getScheduler();

 }


 bool Scheduler::isInstanceAlive() {

   return GlobalHandler::instance().isSchedulerAlive();

 }


 void Scheduler::waitForEvent(const EventImplPtr &Event, bool *Success) {

   ReadLockT Lock = acquireReadLock();

   // It's fine to leave the lock unlocked upon return from waitForEvent as

   // there's no more actions to do here with graph

   std::vector<Command *> ToCleanUp;

   GraphProcessor::waitForEvent(std::move(Event), Lock, ToCleanUp,

                                /*LockTheLock=*/false, Success);

   cleanupCommands(ToCleanUp);

 }


 bool Scheduler::removeMemoryObject(detail::SYCLMemObjI *MemObj,

                                    bool StrictLock) {

   MemObjRecord *Record = MGraphBuilder.getMemObjRecord(MemObj);

   if (!Record)

     // No operations were performed on the mem object

     return true;


   {

     // This only needs a shared mutex as it only involves enqueueing and

     // awaiting for events

     ReadLockT Lock = StrictLock ? ReadLockT(MGraphLock)

                                 : ReadLockT(MGraphLock, std::try_to_lock);

     if (!Lock.owns_lock())

       return false;

     waitForRecordToFinish(Record, Lock);

   }

   {

     WriteLockT Lock = StrictLock ? acquireWriteLock()

                                  : WriteLockT(MGraphLock, std::try_to_lock);

     if (!Lock.owns_lock())

       return false;

     MGraphBuilder.decrementLeafCountersForRecord(Record);

     MGraphBuilder.cleanupCommandsForRecord(Record);

     MGraphBuilder.removeRecordForMemObj(MemObj);

   }

   return true;

 }


 EventImplPtr Scheduler::addHostAccessor(Requirement *Req) {

   std::vector<Command *> AuxiliaryCmds;

   EventImplPtr NewCmdEvent = nullptr;


   {

     WriteLockT Lock = acquireWriteLock();


     Command *NewCmd = MGraphBuilder.addHostAccessor(Req, AuxiliaryCmds);

     if (!NewCmd)

       return nullptr;

     NewCmdEvent = NewCmd->getEvent();

   }


   std::vector<Command *> ToCleanUp;

   {

     ReadLockT Lock = acquireReadLock();

     EnqueueResultT Res;

     bool Enqueued;


     for (Command *Cmd : AuxiliaryCmds) {

       Enqueued = GraphProcessor::enqueueCommand(Cmd, Lock, Res, ToCleanUp, Cmd);

       if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

         throw exception(make_error_code(errc::runtime),

                         "Enqueue process failed.");

     }


     if (Command *NewCmd = static_cast<Command *>(NewCmdEvent->getCommand())) {

       Enqueued =

           GraphProcessor::enqueueCommand(NewCmd, Lock, Res, ToCleanUp, NewCmd);

       if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

         throw exception(make_error_code(errc::runtime),

                         "Enqueue process failed.");

     }

   }


   cleanupCommands(ToCleanUp);

   return NewCmdEvent;

 }


 void Scheduler::releaseHostAccessor(Requirement *Req) {

   Command *const BlockedCmd = Req->MBlockedCmd;


   std::vector<Command *> ToCleanUp;

   {

     ReadLockT Lock = acquireReadLock();


     assert(BlockedCmd && "Can't find appropriate command to unblock");


     BlockedCmd->MEnqueueStatus = EnqueueResultT::SyclEnqueueReady;


     enqueueLeavesOfReqUnlocked(Req, Lock, ToCleanUp);

   }

   cleanupCommands(ToCleanUp);

 }


 void Scheduler::enqueueLeavesOfReqUnlocked(const Requirement *const Req,

                                            ReadLockT &GraphReadLock,

                                            std::vector<Command *> &ToCleanUp) {

   MemObjRecord *Record = Req->MSYCLMemObj->MRecord.get();

   auto EnqueueLeaves = [&ToCleanUp, &GraphReadLock](LeavesCollection &Leaves) {

     for (Command *Cmd : Leaves) {

       EnqueueResultT Res;

       bool Enqueued = GraphProcessor::enqueueCommand(Cmd, GraphReadLock, Res,

                                                      ToCleanUp, Cmd);

       if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

         throw exception(make_error_code(errc::runtime),

                         "Enqueue process failed.");

     }

   };


   EnqueueLeaves(Record->MReadLeaves);

   EnqueueLeaves(Record->MWriteLeaves);

 }


 void Scheduler::enqueueUnblockedCommands(

     const std::vector<EventImplPtr> &ToEnqueue, ReadLockT &GraphReadLock,

     std::vector<Command *> &ToCleanUp) {

   for (auto &Event : ToEnqueue) {

     Command *Cmd = static_cast<Command *>(Event->getCommand());

     if (!Cmd)

       continue;

     EnqueueResultT Res;

     bool Enqueued =

         GraphProcessor::enqueueCommand(Cmd, GraphReadLock, Res, ToCleanUp, Cmd);

     if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

       throw exception(make_error_code(errc::runtime),

                       "Enqueue process failed.");

   }

 }


 void Scheduler::releaseResources(BlockingT Blocking) {

   //  There might be some commands scheduled for post enqueue cleanup that

   //  haven't been freed because of the graph mutex being locked at the time,

   //  clean them up now.

   cleanupCommands({});


   cleanupAuxiliaryResources(Blocking);

   // We need loop since sometimes we may need new objects to be added to

   // deferred mem objects storage during cleanup. Known example is: we cleanup

   // existing deferred mem objects under write lock, during this process we

   // cleanup commands related to this record, command may have last reference to

   // queue_impl, ~queue_impl is called and buffer for assert (which is created

   // with size only so all confitions for deferred release are satisfied) is

   // added to deferred mem obj storage. So we may end up with leak.

   do {

     cleanupDeferredMemObjects(Blocking);

   } while (Blocking == BlockingT::BLOCKING && !isDeferredMemObjectsEmpty());

 }


 MemObjRecord *Scheduler::getMemObjRecord(const Requirement *const Req) {

   return Req->MSYCLMemObj->MRecord.get();

 }


 void Scheduler::cleanupCommands(const std::vector<Command *> &Cmds) {

   cleanupAuxiliaryResources(BlockingT::NON_BLOCKING);

   cleanupDeferredMemObjects(BlockingT::NON_BLOCKING);


   if (Cmds.empty()) {

     std::lock_guard<std::mutex> Lock{MDeferredCleanupMutex};

     if (MDeferredCleanupCommands.empty())

       return;

   }


   WriteLockT Lock(MGraphLock, std::try_to_lock);

   // In order to avoid deadlocks related to blocked commands, defer cleanup if

   // the lock wasn't acquired.

   if (Lock.owns_lock()) {

     for (Command *Cmd : Cmds) {

       MGraphBuilder.cleanupCommand(Cmd);

     }

     std::vector<Command *> DeferredCleanupCommands;

     {

       std::lock_guard<std::mutex> Lock{MDeferredCleanupMutex};

       std::swap(DeferredCleanupCommands, MDeferredCleanupCommands);

     }

     for (Command *Cmd : DeferredCleanupCommands) {

       MGraphBuilder.cleanupCommand(Cmd);

     }


   } else {

     std::lock_guard<std::mutex> Lock{MDeferredCleanupMutex};

     // Full cleanup for fusion placeholder commands is handled by the entry

     // points for fusion (start_fusion, ...). To avoid double free or access to

     // objects after their lifetime, fusion commands should therefore never be

     // added to the deferred command list.

     std::copy_if(Cmds.begin(), Cmds.end(),

                  std::back_inserter(MDeferredCleanupCommands),

                  [](const Command *Cmd) {

                    return Cmd->getType() != Command::CommandType::FUSION;

                  });

   }

 }


 void Scheduler::NotifyHostTaskCompletion(Command *Cmd) {

   // Completing command's event along with unblocking enqueue readiness of

   // empty command may lead to quick deallocation of MThisCmd by some cleanup

   // process. Thus we'll copy deps prior to completing of event and unblocking

   // of empty command.

   // Also, it's possible to have record deallocated prior to enqueue process.

   // Thus we employ read-lock of graph.


   std::vector<Command *> ToCleanUp;

   auto CmdEvent = Cmd->getEvent();

   auto QueueImpl = CmdEvent->getSubmittedQueue();

   assert(QueueImpl && "Submitted queue for host task must not be null");

   {

     ReadLockT Lock = acquireReadLock();


     std::vector<DepDesc> Deps = Cmd->MDeps;

     // Host tasks are cleaned up upon completion rather than enqueuing.

     if (Cmd->MLeafCounter == 0) {

       ToCleanUp.push_back(Cmd);

       Cmd->MMarkedForCleanup = true;

     }

     {

       std::lock_guard<std::mutex> Guard(Cmd->MBlockedUsersMutex);

       // update self-event status

       CmdEvent->setComplete();

     }

     Scheduler::enqueueUnblockedCommands(Cmd->MBlockedUsers, Lock, ToCleanUp);

   }

   QueueImpl->revisitUnenqueuedCommandsState(CmdEvent);


   cleanupCommands(ToCleanUp);

 }


 void Scheduler::deferMemObjRelease(const std::shared_ptr<SYCLMemObjI> &MemObj) {

   {

     std::lock_guard<std::mutex> Lock{MDeferredMemReleaseMutex};

     MDeferredMemObjRelease.push_back(MemObj);

   }

   cleanupDeferredMemObjects(BlockingT::NON_BLOCKING);

 }


 inline bool Scheduler::isDeferredMemObjectsEmpty() {

   std::lock_guard<std::mutex> Lock{MDeferredMemReleaseMutex};

   return MDeferredMemObjRelease.empty();

 }


 void Scheduler::cleanupDeferredMemObjects(BlockingT Blocking) {

   if (isDeferredMemObjectsEmpty())

     return;

   if (Blocking == BlockingT::BLOCKING) {

     std::vector<std::shared_ptr<SYCLMemObjI>> TempStorage;

     {

       std::lock_guard<std::mutex> LockDef{MDeferredMemReleaseMutex};

       MDeferredMemObjRelease.swap(TempStorage);

     }

     // if any objects in TempStorage exist - it is leaving scope and being

     // deleted

   }


   std::vector<std::shared_ptr<SYCLMemObjI>> ObjsReadyToRelease;

   {

     // Lock is needed for checkLeavesCompletion - if walks through Record leaves

     ReadLockT Lock = ReadLockT(MGraphLock, std::try_to_lock);

     if (Lock.owns_lock()) {

       // Not expected that Blocking == true will be used in parallel with

       // adding MemObj to storage, no such scenario.

       std::lock_guard<std::mutex> LockDef{MDeferredMemReleaseMutex};

       auto MemObjIt = MDeferredMemObjRelease.begin();

       while (MemObjIt != MDeferredMemObjRelease.end()) {

         MemObjRecord *Record = MGraphBuilder.getMemObjRecord((*MemObjIt).get());

         if (!checkLeavesCompletion(Record)) {

           MemObjIt++;

           continue;

         }

         ObjsReadyToRelease.push_back(*MemObjIt);

         MemObjIt = MDeferredMemObjRelease.erase(MemObjIt);

       }

     }

   }

   auto ReleaseCandidateIt = ObjsReadyToRelease.begin();

   while (ReleaseCandidateIt != ObjsReadyToRelease.end()) {

     if (!removeMemoryObject(ReleaseCandidateIt->get(), false))

       break;

     ReleaseCandidateIt = ObjsReadyToRelease.erase(ReleaseCandidateIt);

   }

   if (!ObjsReadyToRelease.empty()) {

     std::lock_guard<std::mutex> LockDef{MDeferredMemReleaseMutex};

     MDeferredMemObjRelease.insert(

         MDeferredMemObjRelease.end(),

         std::make_move_iterator(ObjsReadyToRelease.begin()),

         std::make_move_iterator(ObjsReadyToRelease.end()));

   }

 }


 static void registerAuxiliaryResourcesNoLock(

     std::unordered_map<EventImplPtr, std::vector<std::shared_ptr<const void>>>

         &AuxiliaryResources,

     const EventImplPtr &Event,

     std::vector<std::shared_ptr<const void>> &&Resources) {

   std::vector<std::shared_ptr<const void>> &StoredResources =

       AuxiliaryResources[Event];

   StoredResources.insert(StoredResources.end(),

                          std::make_move_iterator(Resources.begin()),

                          std::make_move_iterator(Resources.end()));

 }


 void Scheduler::takeAuxiliaryResources(const EventImplPtr &Dst,

                                        const EventImplPtr &Src) {

   std::unique_lock<std::mutex> Lock{MAuxiliaryResourcesMutex};

   auto Iter = MAuxiliaryResources.find(Src);

   if (Iter == MAuxiliaryResources.end()) {

     return;

   }

   registerAuxiliaryResourcesNoLock(MAuxiliaryResources, Dst,

                                    std::move(Iter->second));

   MAuxiliaryResources.erase(Iter);

 }


 void Scheduler::registerAuxiliaryResources(

     EventImplPtr &Event, std::vector<std::shared_ptr<const void>> Resources) {

   std::unique_lock<std::mutex> Lock{MAuxiliaryResourcesMutex};

   registerAuxiliaryResourcesNoLock(MAuxiliaryResources, Event,

                                    std::move(Resources));

 }


 void Scheduler::cleanupAuxiliaryResources(BlockingT Blocking) {

   std::unique_lock<std::mutex> Lock{MAuxiliaryResourcesMutex};

   for (auto It = MAuxiliaryResources.begin();

        It != MAuxiliaryResources.end();) {

     const EventImplPtr &Event = It->first;

     if (Blocking == BlockingT::BLOCKING) {

       Event->waitInternal();

       It = MAuxiliaryResources.erase(It);

     } else if (Event->isCompleted())

       It = MAuxiliaryResources.erase(It);

     else

       ++It;

   }

 }


 void Scheduler::startFusion(QueueImplPtr Queue) {

   WriteLockT Lock = acquireWriteLock();

   WriteLockT FusionMapLock = acquireFusionWriteLock();

   MGraphBuilder.startFusion(Queue);

 }


 void Scheduler::cleanUpCmdFusion(sycl::detail::queue_impl *Queue) {

   // No graph lock, we might be called because the graph builder is releasing

   // resources.

   WriteLockT FusionMapLock = acquireFusionWriteLock();

   MGraphBuilder.cleanUpCmdFusion(Queue);

 }


 void Scheduler::cancelFusion(QueueImplPtr Queue) {

   std::vector<Command *> ToEnqueue;

   {

     WriteLockT Lock = acquireWriteLock();

     WriteLockT FusionMapLock = acquireFusionWriteLock();

     MGraphBuilder.cancelFusion(Queue, ToEnqueue);

   }

   enqueueCommandForCG(nullptr, ToEnqueue);

 }


 sycl::detail::pi::PiKernel Scheduler::completeSpecConstMaterialization(

     [[maybe_unused]] QueueImplPtr Queue,

     [[maybe_unused]] const RTDeviceBinaryImage *BinImage,

     [[maybe_unused]] const std::string &KernelName,

     [[maybe_unused]] std::vector<unsigned char> &SpecConstBlob) {

 #if SYCL_EXT_CODEPLAY_KERNEL_FUSION

   return detail::jit_compiler::get_instance().materializeSpecConstants(

       Queue, BinImage, KernelName, SpecConstBlob);

 #else  // SYCL_EXT_CODEPLAY_KERNEL_FUSION

   printFusionWarning(

       "Materialization of spec constants not supported by this build");

   return nullptr;

 #endif // SYCL_EXT_CODEPLAY_KERNEL_FUSION

 }


 EventImplPtr Scheduler::completeFusion(QueueImplPtr Queue,

                                        const property_list &PropList) {

   std::vector<Command *> ToEnqueue;

   EventImplPtr FusedEvent;

   {

     WriteLockT Lock = acquireWriteLock();

     WriteLockT FusionMapLock = acquireFusionWriteLock();

     FusedEvent = MGraphBuilder.completeFusion(Queue, ToEnqueue, PropList);

   }

   enqueueCommandForCG(nullptr, ToEnqueue);


   return FusedEvent;

 }


 bool Scheduler::isInFusionMode(QueueIdT queue) {

   ReadLockT Lock = acquireFusionReadLock();

   return MGraphBuilder.isInFusionMode(queue);

 }


 void Scheduler::printFusionWarning(const std::string &Message) {

   if (detail::SYCLConfig<detail::SYCL_RT_WARNING_LEVEL>::get() > 0) {

     std::cerr << "WARNING: " << Message << "\n";

   }

 }


 KernelFusionCommand *Scheduler::isPartOfActiveFusion(Command *Cmd) {

   auto CmdType = Cmd->getType();

   switch (CmdType) {

   case Command::FUSION: {

     auto *FusionCmd = static_cast<KernelFusionCommand *>(Cmd);

     return (FusionCmd->isActive()) ? FusionCmd : nullptr;

   }

   case Command::RUN_CG: {

     auto *CGCmd = static_cast<ExecCGCommand *>(Cmd);

     return (CGCmd->MFusionCmd && CGCmd->MFusionCmd->isActive())

                ? CGCmd->MFusionCmd

                : nullptr;

   }

   default:

     return nullptr;

   }

 }


 EventImplPtr Scheduler::addCommandGraphUpdate(

     ext::oneapi::experimental::detail::exec_graph_impl *Graph,

     std::vector<std::shared_ptr<ext::oneapi::experimental::detail::node_impl>>

         Nodes,

     const QueueImplPtr &Queue, std::vector<Requirement *> Requirements,

     std::vector<detail::EventImplPtr> &Events) {

   std::vector<Command *> AuxiliaryCmds;

   EventImplPtr NewCmdEvent = nullptr;


   {

     WriteLockT Lock = acquireWriteLock();


     Command *NewCmd = MGraphBuilder.addCommandGraphUpdate(

         Graph, Nodes, Queue, Requirements, Events, AuxiliaryCmds);

     if (!NewCmd)

       return nullptr;

     NewCmdEvent = NewCmd->getEvent();

   }


   std::vector<Command *> ToCleanUp;

   {

     ReadLockT Lock = acquireReadLock();

     EnqueueResultT Res;

     bool Enqueued;


     for (Command *Cmd : AuxiliaryCmds) {

       Enqueued = GraphProcessor::enqueueCommand(Cmd, Lock, Res, ToCleanUp, Cmd);

       if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

         throw exception(make_error_code(errc::runtime),

                         "Enqueue process failed.");

     }


     if (Command *NewCmd = static_cast<Command *>(NewCmdEvent->getCommand())) {

       Enqueued =

           GraphProcessor::enqueueCommand(NewCmd, Lock, Res, ToCleanUp, NewCmd);

       if (!Enqueued && EnqueueResultT::SyclEnqueueFailed == Res.MResult)

         throw exception(make_error_code(errc::runtime),

                         "Enqueue process failed.");

     }

   }


   cleanupCommands(ToCleanUp);

   return NewCmdEvent;

 }


 bool CheckEventReadiness(const ContextImplPtr &Context,

                          const EventImplPtr &SyclEventImplPtr) {

   // Events that don't have an initialized context are throwaway events that

   // don't represent actual dependencies. Calling getContextImpl() would set

   // their context, which we wish to avoid as it is expensive.

   // NOP events also don't represent actual dependencies.

   if (SyclEventImplPtr->isDefaultConstructed() || SyclEventImplPtr->isNOP()) {

     return true;

   }

   if (SyclEventImplPtr->isHost()) {

     return SyclEventImplPtr->isCompleted();

   }

   // Cross-context dependencies can't be passed to the backend directly.

   if (SyclEventImplPtr->getContextImpl() != Context)

     return false;


   // A nullptr here means that the commmand does not produce a PI event or it

   // hasn't been enqueued yet.

   return SyclEventImplPtr->getHandleRef() != nullptr;

 }


 bool Scheduler::areEventsSafeForSchedulerBypass(

     const std::vector<sycl::event> &DepEvents, ContextImplPtr Context) {


   return std::all_of(

       DepEvents.begin(), DepEvents.end(), [&Context](const sycl::event &Event) {

         const EventImplPtr &SyclEventImplPtr = detail::getSyclObjImpl(Event);

         return CheckEventReadiness(Context, SyclEventImplPtr);

       });

 }


 bool Scheduler::areEventsSafeForSchedulerBypass(

     const std::vector<EventImplPtr> &DepEvents, ContextImplPtr Context) {


   return std::all_of(DepEvents.begin(), DepEvents.end(),

                      [&Context](const EventImplPtr &SyclEventImplPtr) {

                        return CheckEventReadiness(Context, SyclEventImplPtr);

                      });

 }


 } // namespace detail

 } // namespace _V1

 } // namespace sycl

sycl::_V1::detail::AccessorImplHost
Definition: accessor_impl.hpp:42

sycl::_V1::detail::AccessorImplHost::MSYCLMemObj
detail::SYCLMemObjI * MSYCLMemObj
Definition: accessor_impl.hpp:108

sycl::_V1::detail::AccessorImplHost::MBlockedCmd
Command * MBlockedCmd
Definition: accessor_impl.hpp:117

sycl::_V1::detail::AllocaCommandBase
Base class for memory allocation commands.
Definition: commands.hpp:456

sycl::_V1::detail::AllocaCommandBase::getReleaseCmd
ReleaseCommand * getReleaseCmd()
Definition: commands.hpp:461

sycl::_V1::detail::Command
The Command class represents some action that needs to be performed on one or more memory objects.
Definition: commands.hpp:109

sycl::_V1::detail::Command::resolveReleaseDependencies
void resolveReleaseDependencies(std::set< Command * > &list)
Looks at all the dependencies for the release command and enables instrumentation to report these dep...
Definition: commands.cpp:950

sycl::_V1::detail::Command::MBlockedUsersMutex
std::mutex MBlockedUsersMutex
Definition: commands.hpp:397

sycl::_V1::detail::Command::MMarkedForCleanup
bool MMarkedForCleanup
Indicates that the node will be freed by graph cleanup.
Definition: commands.hpp:389

sycl::_V1::detail::Command::MLeafCounter
unsigned MLeafCounter
Counts the number of memory objects this command is a leaf for.
Definition: commands.hpp:324

sycl::_V1::detail::Command::MUsers
std::unordered_set< Command * > MUsers
Contains list of commands that depend on the command.
Definition: commands.hpp:320

sycl::_V1::detail::Command::MDeps
std::vector< DepDesc > MDeps
Contains list of dependencies(edges)
Definition: commands.hpp:318

sycl::_V1::detail::Command::FUSION
@ FUSION
Definition: commands.hpp:122

sycl::_V1::detail::Command::ALLOCA
@ ALLOCA
Definition: commands.hpp:114

sycl::_V1::detail::Command::RUN_CG
@ RUN_CG
Definition: commands.hpp:112

sycl::_V1::detail::Command::ALLOCA_SUB_BUF
@ ALLOCA_SUB_BUF
Definition: commands.hpp:115

sycl::_V1::detail::Command::MBlockedUsers
std::vector< EventImplPtr > MBlockedUsers
Contains list of commands that depends on the host command explicitly (by depends_on).
Definition: commands.hpp:396

sycl::_V1::detail::Command::MEnqueueStatus
std::atomic< EnqueueResultT::ResultT > MEnqueueStatus
Describes the status of the command.
Definition: commands.hpp:341

sycl::_V1::detail::Command::getEvent
const EventImplPtr & getEvent() const
Definition: commands.hpp:182

sycl::_V1::detail::Command::getType
CommandType getType() const
Definition: commands.hpp:146

sycl::_V1::detail::GlobalHandler::isSchedulerAlive
bool isSchedulerAlive() const
Definition: global_handler.cpp:178

sycl::_V1::detail::GlobalHandler::getScheduler
Scheduler & getScheduler()
Definition: global_handler.cpp:165

sycl::_V1::detail::GlobalHandler::instance
static GlobalHandler & instance()
Definition: global_handler.cpp:132

sycl::_V1::detail::LeavesCollection
A wrapper for CircularBuffer class along with collection for host accessor's EmptyCommands.
Definition: leaves_collection.hpp:38

sycl::_V1::detail::RTDeviceBinaryImage
Definition: device_binary_image.hpp:84

sycl::_V1::detail::SYCLConfig
Definition: config.hpp:111

sycl::_V1::detail::SYCLMemObjI
Definition: sycl_mem_obj_i.hpp:27

sycl::_V1::detail::SYCLMemObjI::MRecord
std::shared_ptr< MemObjRecord > MRecord
Definition: sycl_mem_obj_i.hpp:82

sycl::_V1::detail::Scheduler::GraphBuilder::addCommandGraphUpdate
Command * addCommandGraphUpdate(ext::oneapi::experimental::detail::exec_graph_impl *Graph, std::vector< std::shared_ptr< ext::oneapi::experimental::detail::node_impl >> Nodes, const QueueImplPtr &Queue, std::vector< Requirement * > Requirements, std::vector< detail::EventImplPtr > &Events, std::vector< Command * > &ToEnqueue)
Adds a command buffer update operation to the execution graph.
Definition: graph_builder.cpp:1683

sycl::_V1::detail::Scheduler::GraphBuilder::startFusion
void startFusion(QueueImplPtr Queue)
Definition: graph_builder.cpp:1385

sycl::_V1::detail::Scheduler::GraphBuilder::cleanupCommand
void cleanupCommand(Command *Cmd, bool AllowUnsubmitted=false)
Definition: graph_builder.cpp:1250

sycl::_V1::detail::Scheduler::GraphBuilder::addCGUpdateHost
Command * addCGUpdateHost(std::unique_ptr< detail::CG > CommandGroup, std::vector< Command * > &ToEnqueue)
Registers a command group that updates host memory to the latest state.
Definition: graph_builder.cpp:569

sycl::_V1::detail::Scheduler::GraphBuilder::decrementLeafCountersForRecord
void decrementLeafCountersForRecord(MemObjRecord *Record)
Decrements leaf counters for all leaves of the record.
Definition: graph_builder.cpp:1147

sycl::_V1::detail::Scheduler::GraphBuilder::getMemObjRecord
MemObjRecord * getMemObjRecord(SYCLMemObjI *MemObject)
Definition: graph_builder.cpp:194

sycl::_V1::detail::Scheduler::GraphBuilder::completeFusion
EventImplPtr completeFusion(QueueImplPtr Queue, std::vector< Command * > &ToEnqueue, const property_list &)
Definition: graph_builder.cpp:1532

sycl::_V1::detail::Scheduler::GraphBuilder::addHostAccessor
Command * addHostAccessor(Requirement *Req, std::vector< Command * > &ToEnqueue)
Enqueues a command to create a host accessor.
Definition: graph_builder.cpp:525

sycl::_V1::detail::Scheduler::GraphBuilder::cleanupCommandsForRecord
void cleanupCommandsForRecord(MemObjRecord *Record)
Removes commands that use the given MemObjRecord from the graph.
Definition: graph_builder.cpp:1161

sycl::_V1::detail::Scheduler::GraphBuilder::removeRecordForMemObj
void removeRecordForMemObj(SYCLMemObjI *MemObject)
Removes the MemObjRecord for the memory object passed.
Definition: graph_builder.cpp:1305

sycl::_V1::detail::Scheduler::GraphBuilder::addCopyBack
Command * addCopyBack(Requirement *Req, std::vector< Command * > &ToEnqueue)
Enqueues a command to update memory to the latest state.
Definition: graph_builder.cpp:480

sycl::_V1::detail::Scheduler::GraphBuilder::isInFusionMode
bool isInFusionMode(QueueIdT queue)
Definition: graph_builder.cpp:1675

sycl::_V1::detail::Scheduler::GraphBuilder::addCG
GraphBuildResult addCG(std::unique_ptr< detail::CG > CommandGroup, const QueueImplPtr &Queue, std::vector< Command * > &ToEnqueue, bool EventNeeded, sycl::detail::pi::PiExtCommandBuffer CommandBuffer=nullptr, const std::vector< sycl::detail::pi::PiExtSyncPoint > &Dependencies={})
Registers command group and adds it to the dependency graph.
Definition: graph_builder.cpp:938

sycl::_V1::detail::Scheduler::GraphBuilder::cancelFusion
void cancelFusion(QueueImplPtr Queue, std::vector< Command * > &ToEnqueue)
Definition: graph_builder.cpp:1445

sycl::_V1::detail::Scheduler::GraphBuilder::cleanUpCmdFusion
void cleanUpCmdFusion(sycl::detail::queue_impl *Queue)
Clean up the internal fusion commands held for the given queue.
Definition: graph_builder.cpp:1391

sycl::_V1::detail::Scheduler::GraphProcessor::waitForEvent
static void waitForEvent(const EventImplPtr &Event, ReadLockT &GraphReadLock, std::vector< Command * > &ToCleanUp, bool LockTheLock=true, bool *Success=nullptr)
Waits for the command, associated with Event passed, is completed.
Definition: graph_processor.cpp:24

sycl::_V1::detail::Scheduler::GraphProcessor::enqueueCommand
static bool enqueueCommand(Command *Cmd, ReadLockT &GraphReadLock, EnqueueResultT &EnqueueResult, std::vector< Command * > &ToCleanUp, Command *RootCommand, BlockingT Blocking=NON_BLOCKING)
Enqueues the command and all its dependencies.
Definition: graph_processor.cpp:72

sycl::_V1::detail::Scheduler
DPC++ graph scheduler class.
Definition: scheduler.hpp:366

sycl::_V1::detail::Scheduler::waitForEvent
void waitForEvent(const EventImplPtr &Event, bool *Success=nullptr)
Waits for the event.
Definition: scheduler.cpp:256

sycl::_V1::detail::Scheduler::acquireFusionReadLock
ReadLockT acquireFusionReadLock()
Provides shared access to std::shared_timed_mutex object with deadlock avoidance to the Fusion map.
Definition: scheduler.hpp:548

sycl::_V1::detail::Scheduler::addCopyBack
EventImplPtr addCopyBack(Requirement *Req)
Registers a command group, that copies most recent memory to the memory pointed by the requirement.
Definition: scheduler.cpp:208

sycl::_V1::detail::Scheduler::isDeferredMemObjectsEmpty
bool isDeferredMemObjectsEmpty()
Definition: scheduler.cpp:488

sycl::_V1::detail::Scheduler::enqueueUnblockedCommands
static void enqueueUnblockedCommands(const std::vector< EventImplPtr > &CmdsToEnqueue, ReadLockT &GraphReadLock, std::vector< Command * > &ToCleanUp)
Definition: scheduler.cpp:368

sycl::_V1::detail::Scheduler::acquireReadLock
ReadLockT acquireReadLock()
Provides shared access to std::shared_timed_mutex object with deadlock avoidance.
Definition: scheduler.hpp:544

sycl::_V1::detail::Scheduler::addCG
EventImplPtr addCG(std::unique_ptr< detail::CG > CommandGroup, const QueueImplPtr &Queue, bool EventNeeded, sycl::detail::pi::PiExtCommandBuffer CommandBuffer=nullptr, const std::vector< sycl::detail::pi::PiExtSyncPoint > &Dependencies={})
Registers a command group, and adds it to the dependency graph.
Definition: scheduler.cpp:99

sycl::_V1::detail::Scheduler::addHostAccessor
EventImplPtr addHostAccessor(Requirement *Req)
Adds nodes to the graph, that update the requirement with the pointer to the host memory.
Definition: scheduler.cpp:294

sycl::_V1::detail::Scheduler::MAuxiliaryResources
std::unordered_map< EventImplPtr, std::vector< std::shared_ptr< const void > > > MAuxiliaryResources
Definition: scheduler.hpp:960

sycl::_V1::detail::Scheduler::registerAuxiliaryResources
void registerAuxiliaryResources(EventImplPtr &Event, std::vector< std::shared_ptr< const void >> Resources)
Definition: scheduler.cpp:565

sycl::_V1::detail::Scheduler::cleanupAuxiliaryResources
void cleanupAuxiliaryResources(BlockingT Blocking)
Definition: scheduler.cpp:572

sycl::_V1::detail::Scheduler::WriteLockT
std::unique_lock< RWLockT > WriteLockT
Definition: scheduler.hpp:502

sycl::_V1::detail::Scheduler::completeSpecConstMaterialization
sycl::detail::pi::PiKernel completeSpecConstMaterialization(QueueImplPtr Queue, const RTDeviceBinaryImage *BinImage, const std::string &KernelName, std::vector< unsigned char > &SpecConstBlob)
Definition: scheduler.cpp:610

sycl::_V1::detail::Scheduler::completeFusion
EventImplPtr completeFusion(QueueImplPtr Queue, const property_list &)
Definition: scheduler.cpp:625

sycl::_V1::detail::Scheduler::addCommandGraphUpdate
EventImplPtr addCommandGraphUpdate(ext::oneapi::experimental::detail::exec_graph_impl *Graph, std::vector< std::shared_ptr< ext::oneapi::experimental::detail::node_impl >> Nodes, const QueueImplPtr &Queue, std::vector< Requirement * > Requirements, std::vector< detail::EventImplPtr > &Events)
Adds a command buffer update operation to the execution graph.
Definition: scheduler.cpp:668

sycl::_V1::detail::Scheduler::cleanupDeferredMemObjects
void cleanupDeferredMemObjects(BlockingT Blocking)
Definition: scheduler.cpp:493

sycl::_V1::detail::Scheduler::enqueueLeavesOfReqUnlocked
static void enqueueLeavesOfReqUnlocked(const Requirement *const Req, ReadLockT &GraphReadLock, std::vector< Command * > &ToCleanUp)
Definition: scheduler.cpp:349

sycl::_V1::detail::Scheduler::enqueueCommandForCG
void enqueueCommandForCG(EventImplPtr NewEvent, std::vector< Command * > &AuxilaryCmds, BlockingT Blocking=NON_BLOCKING)
Definition: scheduler.cpp:151

sycl::_V1::detail::Scheduler::MDeferredCleanupMutex
std::mutex MDeferredCleanupMutex
Definition: scheduler.hpp:954

sycl::_V1::detail::Scheduler::isInFusionMode
bool isInFusionMode(QueueIdT Queue)
Definition: scheduler.cpp:639

sycl::_V1::detail::Scheduler::MGraphBuilder
GraphBuilder MGraphBuilder
Definition: scheduler.hpp:949

sycl::_V1::detail::Scheduler::cancelFusion
void cancelFusion(QueueImplPtr Queue)
Definition: scheduler.cpp:600

sycl::_V1::detail::Scheduler::ReadLockT
std::shared_lock< RWLockT > ReadLockT
Definition: scheduler.hpp:501

sycl::_V1::detail::Scheduler::MDeferredMemObjRelease
std::vector< std::shared_ptr< SYCLMemObjI > > MDeferredMemObjRelease
Definition: scheduler.hpp:956

sycl::_V1::detail::Scheduler::startFusion
void startFusion(QueueImplPtr Queue)
Definition: scheduler.cpp:587

sycl::_V1::detail::Scheduler::checkLeavesCompletion
bool checkLeavesCompletion(MemObjRecord *Record)
Definition: scheduler.cpp:33

sycl::_V1::detail::Scheduler::getMemObjRecord
static MemObjRecord * getMemObjRecord(const Requirement *const Req)
Definition: scheduler.cpp:403

sycl::_V1::detail::Scheduler::releaseHostAccessor
void releaseHostAccessor(Requirement *Req)
Unblocks operations with the memory object.
Definition: scheduler.cpp:333

sycl::_V1::detail::Scheduler::waitForRecordToFinish
void waitForRecordToFinish(MemObjRecord *Record, ReadLockT &GraphReadLock)
This function waits on all of the graph leaves which somehow use the memory object which is represent...
Definition: scheduler.cpp:49

sycl::_V1::detail::Scheduler::MDeferredMemReleaseMutex
std::mutex MDeferredMemReleaseMutex
Definition: scheduler.hpp:957

sycl::_V1::detail::Scheduler::getInstance
static Scheduler & getInstance()
Definition: scheduler.cpp:248

sycl::_V1::detail::Scheduler::cleanUpCmdFusion
void cleanUpCmdFusion(sycl::detail::queue_impl *Queue)
Definition: scheduler.cpp:593

sycl::_V1::detail::Scheduler::MAuxiliaryResourcesMutex
std::mutex MAuxiliaryResourcesMutex
Definition: scheduler.hpp:961

sycl::_V1::detail::Scheduler::isInstanceAlive
static bool isInstanceAlive()
Definition: scheduler.cpp:252

sycl::_V1::detail::Scheduler::takeAuxiliaryResources
void takeAuxiliaryResources(const EventImplPtr &Dst, const EventImplPtr &Src)
Assign Src's auxiliary resources to Dst.
Definition: scheduler.cpp:553

sycl::_V1::detail::Scheduler::cleanupCommands
void cleanupCommands(const std::vector< Command * > &Cmds)
Definition: scheduler.cpp:407

sycl::_V1::detail::Scheduler::NotifyHostTaskCompletion
void NotifyHostTaskCompletion(Command *Cmd)
Definition: scheduler.cpp:447

sycl::_V1::detail::Scheduler::MGraphLock
RWLockT MGraphLock
Definition: scheduler.hpp:950

sycl::_V1::detail::Scheduler::acquireWriteLock
WriteLockT acquireWriteLock()
Provides exclusive access to std::shared_timed_mutex object with deadlock avoidance.
Definition: scheduler.hpp:506

sycl::_V1::detail::Scheduler::removeMemoryObject
bool removeMemoryObject(detail::SYCLMemObjI *MemObj, bool StrictLock=true)
Removes buffer from the graph.
Definition: scheduler.cpp:266

sycl::_V1::detail::Scheduler::acquireFusionWriteLock
WriteLockT acquireFusionWriteLock()
Provides exclusive access to std::shared_timed_mutex object with deadlock avoidance to the Fusion map...
Definition: scheduler.hpp:525

sycl::_V1::detail::Scheduler::MDeferredCleanupCommands
std::vector< Command * > MDeferredCleanupCommands
Definition: scheduler.hpp:953

sycl::_V1::detail::Scheduler::deferMemObjRelease
void deferMemObjRelease(const std::shared_ptr< detail::SYCLMemObjI > &MemObj)
Definition: scheduler.cpp:480

sycl::_V1::detail::Scheduler::releaseResources
void releaseResources(BlockingT Blocking=BlockingT::BLOCKING)
Definition: scheduler.cpp:384

sycl::_V1::detail::Scheduler::areEventsSafeForSchedulerBypass
static bool areEventsSafeForSchedulerBypass(const std::vector< sycl::event > &DepEvents, ContextImplPtr Context)
Definition: scheduler.cpp:734

sycl::_V1::detail::jit_compiler::materializeSpecConstants
sycl::detail::pi::PiKernel materializeSpecConstants(QueueImplPtr Queue, const RTDeviceBinaryImage *BinImage, const std::string &KernelName, const std::vector< unsigned char > &SpecConstBlob)

sycl::_V1::detail::jit_compiler::get_instance
static jit_compiler & get_instance()
Definition: jit_compiler.hpp:51

sycl::event
An event object can be used to synchronize memory transfers, enqueues of kernels and signaling barrie...
Definition: event.hpp:44

sycl::_V1::exception
Definition: exception.hpp:77

sycl::_V1::ext::oneapi::experimental::detail::exec_graph_impl
Class representing the implementation of command_graph<executable>.
Definition: graph_impl.hpp:1296

sycl::_V1::property_list
Objects of the property_list class are containers for the SYCL properties.
Definition: property_list.hpp:30

sycl::_V1::queue
Encapsulates a single SYCL queue which schedules kernels on a SYCL device.
Definition: queue.hpp:110

device_selector.hpp

global_handler.hpp

graph_impl.hpp

jit_compiler.hpp

std::cerr
__SYCL_EXTERN_STREAM_ATTRS ostream cerr
Linked to standard error (unbuffered)

sycl::_V1::detail::CheckEventReadiness
bool CheckEventReadiness(const ContextImplPtr &Context, const EventImplPtr &SyclEventImplPtr)
Definition: scheduler.cpp:713

sycl::_V1::detail::BlockingT
BlockingT
Definition: commands.hpp:61

sycl::_V1::detail::NON_BLOCKING
@ NON_BLOCKING
Definition: commands.hpp:61

sycl::_V1::detail::BLOCKING
@ BLOCKING
Definition: commands.hpp:61

sycl::_V1::detail::QueueIdT
std::hash< std::shared_ptr< detail::queue_impl > >::result_type QueueIdT
Definition: scheduler.hpp:191

sycl::_V1::detail::registerAuxiliaryResourcesNoLock
static void registerAuxiliaryResourcesNoLock(std::unordered_map< EventImplPtr, std::vector< std::shared_ptr< const void >>> &AuxiliaryResources, const EventImplPtr &Event, std::vector< std::shared_ptr< const void >> &&Resources)
Definition: scheduler.cpp:541

sycl::_V1::detail::ContextImplPtr
std::shared_ptr< sycl::detail::context_impl > ContextImplPtr
Definition: event_impl.hpp:32

sycl::_V1::detail::EventImplPtr
std::shared_ptr< event_impl > EventImplPtr
Definition: handler.hpp:184

sycl::_V1::detail::CGType
CGType
Type of the command group.
Definition: cg_types.hpp:41

sycl::_V1::detail::CGType::UpdateHost
@ UpdateHost

sycl::_V1::detail::CGType::CodeplayHostTask
@ CodeplayHostTask

sycl::_V1::detail::QueueImplPtr
std::shared_ptr< sycl::detail::queue_impl > QueueImplPtr
Definition: helpers.hpp:46

sycl::_V1::errc::runtime
@ runtime

sycl::_V1::make_error_code
std::error_code make_error_code(sycl::errc E) noexcept
Constructs an error code using e and sycl_category()
Definition: exception.cpp:64

sycl
Definition: access.hpp:18

queue_impl.hpp

scheduler.hpp

all_of
bool all_of(const simd_mask< _Tp, _Abi > &) noexcept

stream_impl.hpp

_pi_ext_command_buffer
Definition: pi_cuda.hpp:81

_pi_kernel
Definition: pi_cuda.hpp:73

sycl::_V1::detail::EnqueueResultT
Result of command enqueueing.
Definition: commands.hpp:64

sycl::_V1::detail::EnqueueResultT::MResult
ResultT MResult
Indicates the result of enqueueing.
Definition: commands.hpp:75

sycl::_V1::detail::EnqueueResultT::SyclEnqueueReady
@ SyclEnqueueReady
Definition: commands.hpp:66

sycl::_V1::detail::EnqueueResultT::SyclEnqueueFailed
@ SyclEnqueueFailed
Definition: commands.hpp:69

sycl::_V1::detail::MemObjRecord
Memory Object Record.
Definition: scheduler.hpp:202

sycl::_V1::detail::MemObjRecord::MWriteLeaves
LeavesCollection MWriteLeaves
Definition: scheduler.hpp:214

sycl::_V1::detail::MemObjRecord::MAllocaCommands
std::vector< AllocaCommandBase * > MAllocaCommands
Definition: scheduler.hpp:208

sycl::_V1::detail::MemObjRecord::MReadLeaves
LeavesCollection MReadLeaves
Definition: scheduler.hpp:211

sycl_mem_obj_i.hpp