llvm-docs/clang_doxygen/DeviceOffload_8cpp_source.html

 //===---------- DeviceOffload.cpp - Device Offloading------------*- C++ -*-===//

 //

 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

 // See https://llvm.org/LICENSE.txt for license information.

 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

 //

 //===----------------------------------------------------------------------===//

 //

 // This file implements offloading to CUDA devices.

 //

 //===----------------------------------------------------------------------===//


 #include "DeviceOffload.h"


 #include "clang/Basic/TargetOptions.h"

 #include "clang/CodeGen/ModuleBuilder.h"

 #include "clang/Frontend/CompilerInstance.h"


 #include "llvm/IR/LegacyPassManager.h"

 #include "llvm/MC/TargetRegistry.h"

 #include "llvm/Target/TargetMachine.h"


 namespace clang {


 IncrementalCUDADeviceParser::IncrementalCUDADeviceParser(

     Interpreter &Interp, std::unique_ptr<CompilerInstance> Instance,

     IncrementalParser &HostParser, llvm::LLVMContext &LLVMCtx,

     llvm::IntrusiveRefCntPtr<llvm::vfs::InMemoryFileSystem> FS,

     llvm::Error &Err)

     : IncrementalParser(Interp, std::move(Instance), LLVMCtx, Err),

       HostParser(HostParser), VFS(FS) {

   if (Err)

     return;

   StringRef Arch = CI->getTargetOpts().CPU;

   if (!Arch.starts_with("sm_") || Arch.substr(3).getAsInteger(10, SMVersion)) {

     Err = llvm::joinErrors(std::move(Err), llvm::make_error<llvm::StringError>(

                                                "Invalid CUDA architecture",

                                                llvm::inconvertibleErrorCode()));

     return;

   }

 }


 llvm::Expected<PartialTranslationUnit &>

 IncrementalCUDADeviceParser::Parse(llvm::StringRef Input) {

   auto PTU = IncrementalParser::Parse(Input);

   if (!PTU)

     return PTU.takeError();


   auto PTX = GeneratePTX();

   if (!PTX)

     return PTX.takeError();


   auto Err = GenerateFatbinary();

   if (Err)

     return std::move(Err);


   std::string FatbinFileName =

       "/incr_module_" + std::to_string(PTUs.size()) + ".fatbin";

   VFS->addFile(FatbinFileName, 0,

                llvm::MemoryBuffer::getMemBuffer(

                    llvm::StringRef(FatbinContent.data(), FatbinContent.size()),

                    "", false));


   HostParser.getCI()->getCodeGenOpts().CudaGpuBinaryFileName = FatbinFileName;


   FatbinContent.clear();


   return PTU;

 }


 llvm::Expected<llvm::StringRef> IncrementalCUDADeviceParser::GeneratePTX() {

   auto &PTU = PTUs.back();

   std::string Error;


   const llvm::Target *Target = llvm::TargetRegistry::lookupTarget(

       PTU.TheModule->getTargetTriple(), Error);

   if (!Target)

     return llvm::make_error<llvm::StringError>(std::move(Error),

                                                std::error_code());

   llvm::TargetOptions TO = llvm::TargetOptions();

   llvm::TargetMachine *TargetMachine = Target->createTargetMachine(

       PTU.TheModule->getTargetTriple(), getCI()->getTargetOpts().CPU, "", TO,

       llvm::Reloc::Model::PIC_);

   PTU.TheModule->setDataLayout(TargetMachine->createDataLayout());


   PTXCode.clear();

   llvm::raw_svector_ostream dest(PTXCode);


   llvm::legacy::PassManager PM;

   if (TargetMachine->addPassesToEmitFile(PM, dest, nullptr,

                                          llvm::CodeGenFileType::AssemblyFile)) {

     return llvm::make_error<llvm::StringError>(

         "NVPTX backend cannot produce PTX code.",

         llvm::inconvertibleErrorCode());

   }


   if (!PM.run(*PTU.TheModule))

     return llvm::make_error<llvm::StringError>("Failed to emit PTX code.",

                                                llvm::inconvertibleErrorCode());


   PTXCode += '\0';

   while (PTXCode.size() % 8)

     PTXCode += '\0';

   return PTXCode.str();

 }


 llvm::Error IncrementalCUDADeviceParser::GenerateFatbinary() {

   enum FatBinFlags {

     AddressSize64 = 0x01,

     HasDebugInfo = 0x02,

     ProducerCuda = 0x04,

     HostLinux = 0x10,

     HostMac = 0x20,

     HostWindows = 0x40

   };


   struct FatBinInnerHeader {

     uint16_t Kind;             // 0x00

     uint16_t unknown02;        // 0x02

     uint32_t HeaderSize;       // 0x04

     uint32_t DataSize;         // 0x08

     uint32_t unknown0c;        // 0x0c

     uint32_t CompressedSize;   // 0x10

     uint32_t SubHeaderSize;    // 0x14

     uint16_t VersionMinor;     // 0x18

     uint16_t VersionMajor;     // 0x1a

     uint32_t CudaArch;         // 0x1c

     uint32_t unknown20;        // 0x20

     uint32_t unknown24;        // 0x24

     uint32_t Flags;            // 0x28

     uint32_t unknown2c;        // 0x2c

     uint32_t unknown30;        // 0x30

     uint32_t unknown34;        // 0x34

     uint32_t UncompressedSize; // 0x38

     uint32_t unknown3c;        // 0x3c

     uint32_t unknown40;        // 0x40

     uint32_t unknown44;        // 0x44

     FatBinInnerHeader(uint32_t DataSize, uint32_t CudaArch, uint32_t Flags)

         : Kind(1 /*PTX*/), unknown02(0x0101), HeaderSize(sizeof(*this)),

           DataSize(DataSize), unknown0c(0), CompressedSize(0),

           SubHeaderSize(HeaderSize - 8), VersionMinor(2), VersionMajor(4),

           CudaArch(CudaArch), unknown20(0), unknown24(0), Flags(Flags),

           unknown2c(0), unknown30(0), unknown34(0), UncompressedSize(0),

           unknown3c(0), unknown40(0), unknown44(0) {}

   };


   struct FatBinHeader {

     uint32_t Magic;      // 0x00

     uint16_t Version;    // 0x04

     uint16_t HeaderSize; // 0x06

     uint32_t DataSize;   // 0x08

     uint32_t unknown0c;  // 0x0c

   public:

     FatBinHeader(uint32_t DataSize)

         : Magic(0xba55ed50), Version(1), HeaderSize(sizeof(*this)),

           DataSize(DataSize), unknown0c(0) {}

   };


   FatBinHeader OuterHeader(sizeof(FatBinInnerHeader) + PTXCode.size());

   FatbinContent.append((char *)&OuterHeader,

                        ((char *)&OuterHeader) + OuterHeader.HeaderSize);


   FatBinInnerHeader InnerHeader(PTXCode.size(), SMVersion,

                                 FatBinFlags::AddressSize64 |

                                     FatBinFlags::HostLinux);

   FatbinContent.append((char *)&InnerHeader,

                        ((char *)&InnerHeader) + InnerHeader.HeaderSize);


   FatbinContent.append(PTXCode.begin(), PTXCode.end());


   return llvm::Error::success();

 }


 IncrementalCUDADeviceParser::~IncrementalCUDADeviceParser() {}


 } // namespace clang

CompilerInstance.h

DeviceOffload.h

Target
llvm::MachO::Target Target
Definition: MachO.h:50

ModuleBuilder.h

TargetOptions.h
Defines the clang::TargetOptions class.

clang::CodeGenOptions::CudaGpuBinaryFileName
std::string CudaGpuBinaryFileName
Name of file passed with -fcuda-include-gpubinary option to forward to CUDA runtime back-end for inco...
Definition: CodeGenOptions.h:317

clang::CompilerInstance::getCodeGenOpts
CodeGenOptions & getCodeGenOpts()
Definition: CompilerInstance.h:283

clang::IncrementalCUDADeviceParser::FatbinContent
llvm::SmallVector< char, 1024 > FatbinContent
Definition: DeviceOffload.h:45

clang::IncrementalCUDADeviceParser::PTXCode
llvm::SmallString< 1024 > PTXCode
Definition: DeviceOffload.h:44

clang::IncrementalCUDADeviceParser::IncrementalCUDADeviceParser
IncrementalCUDADeviceParser(Interpreter &Interp, std::unique_ptr< CompilerInstance > Instance, IncrementalParser &HostParser, llvm::LLVMContext &LLVMCtx, llvm::IntrusiveRefCntPtr< llvm::vfs::InMemoryFileSystem > VFS, llvm::Error &Err)
Definition: DeviceOffload.cpp:25

clang::IncrementalCUDADeviceParser::HostParser
IncrementalParser & HostParser
Definition: DeviceOffload.h:42

clang::IncrementalCUDADeviceParser::Parse
llvm::Expected< PartialTranslationUnit & > Parse(llvm::StringRef Input) override
Parses incremental input by creating an in-memory file.
Definition: DeviceOffload.cpp:44

clang::IncrementalCUDADeviceParser::VFS
llvm::IntrusiveRefCntPtr< llvm::vfs::InMemoryFileSystem > VFS
Definition: DeviceOffload.h:46

clang::IncrementalCUDADeviceParser::GeneratePTX
llvm::Expected< llvm::StringRef > GeneratePTX()
Definition: DeviceOffload.cpp:71

clang::IncrementalCUDADeviceParser::~IncrementalCUDADeviceParser
~IncrementalCUDADeviceParser()
Definition: DeviceOffload.cpp:174

clang::IncrementalCUDADeviceParser::GenerateFatbinary
llvm::Error GenerateFatbinary()
Definition: DeviceOffload.cpp:107

clang::IncrementalCUDADeviceParser::SMVersion
int SMVersion
Definition: DeviceOffload.h:43

clang::IncrementalParser
Provides support for incremental compilation.
Definition: IncrementalParser.h:40

clang::IncrementalParser::PTUs
std::list< PartialTranslationUnit > PTUs
List containing every information about every incrementally parsed piece of code.
Definition: IncrementalParser.h:59

clang::IncrementalParser::getCI
CompilerInstance * getCI()
Definition: IncrementalParser.h:73

clang::IncrementalParser::Parse
virtual llvm::Expected< PartialTranslationUnit & > Parse(llvm::StringRef Input)
Parses incremental input by creating an in-memory file.
Definition: IncrementalParser.cpp:306

clang::IncrementalParser::CI
std::unique_ptr< CompilerInstance > CI
Compiler instance performing the incremental compilation.
Definition: IncrementalParser.h:46

clang::Interpreter
Provides top-level interfaces for incremental compilation and execution.
Definition: Interpreter.h:91

llvm::Expected
Definition: LLVM.h:37

llvm::IntrusiveRefCntPtr< llvm::vfs::InMemoryFileSystem >

clang::ObjCPropertyAttribute::Kind
Kind
Definition: DeclObjCCommon.h:22

clang
The JSON file list parser is used to communicate input to InstallAPI.
Definition: CalledOnceCheck.h:17

clang::CudaArch
CudaArch
Definition: Cuda.h:54

std
Definition: Format.h:5433