doxygen/html/fpga_8h_source.html

 // Copyright (C) 2020-2021 Intel Corporation

 // SPDX-License-Identifier: Apache-2.0


 #ifndef __FPGA_H__

 #define __FPGA_H__


 #include <atomic>

 #include <condition_variable>

 #include <deque>

 #include <future>

 #include <memory>

 #include <mutex>

 #include <thread>

 #include <unordered_map>

 #include <vector>


 #include "CL/opencl.h"


 namespace intel {

 namespace hexl {

 namespace fpga {


 __extension__ typedef unsigned __int128 fpga_uint128_t;

 typedef struct {

     uint64_t modulus;

     uint64_t len;

     uint64_t barr_lo;

 } moduli_info_t;


 struct Object {

 public:

     Object();

     virtual ~Object() = default;


     bool ready_;

     int id_;

     static unsigned int g_wid_;

 };


 struct Object_NTT : public Object {

     explicit Object_NTT(uint64_t* coeff_poly,

                         const uint64_t* root_of_unity_powers,

                         const uint64_t* precon_root_of_unity_powers,

                         uint64_t coeff_modulus, uint64_t n);


     uint64_t* coeff_poly_;

     const uint64_t* root_of_unity_powers_;

     const uint64_t* precon_root_of_unity_powers_;

     uint64_t coeff_modulus_;

     uint64_t n_;

 };


 struct Object_INTT : public Object {

     explicit Object_INTT(uint64_t* coeff_poly,

                          const uint64_t* inv_root_of_unity_powers,

                          const uint64_t* precon_inv_root_of_unity_powers,

                          uint64_t coeff_modulus, uint64_t inv_n,

                          uint64_t inv_n_w, uint64_t n);


     uint64_t* coeff_poly_;

     const uint64_t* inv_root_of_unity_powers_;

     const uint64_t* precon_inv_root_of_unity_powers_;

     uint64_t coeff_modulus_;

     uint64_t inv_n_;

     uint64_t inv_n_w_;

     uint64_t n_;

 };

 struct Object_DyadicMultiply : public Object {

     explicit Object_DyadicMultiply(uint64_t* results, const uint64_t* operand1,

                                    const uint64_t* operand2, uint64_t n,

                                    const uint64_t* moduli, uint64_t n_moduli);


     uint64_t* results_;

     const uint64_t* operand1_;

     const uint64_t* operand2_;

     uint64_t n_;

     const uint64_t* moduli_;

     uint64_t n_moduli_;

 };

 class Buffer {

 public:

     Buffer(uint64_t capacity, uint64_t n_batch_dyadic_multiply,

            uint64_t n_batch_ntt, uint64_t n_batch_intt)

         : capacity_(capacity),

           n_batch_dyadic_multiply_(n_batch_dyadic_multiply),

           n_batch_ntt_(n_batch_ntt),

           n_batch_intt_(n_batch_intt),

           total_worksize_DyadicMultiply_(1),

           num_DyadicMultiply_(0),

           total_worksize_NTT_(1),

           num_NTT_(0),

           total_worksize_INTT_(1),

           num_INTT_(0) {}


     void push(Object* obj);

     Object* front();

     std::vector<Object*> pop();


     uint64_t size();


     uint64_t get_worksize_DyadicMultiply() const {

         return total_worksize_DyadicMultiply_;

     }

     uint64_t get_worksize_NTT() const { return total_worksize_NTT_; }

     uint64_t get_worksize_INTT() const { return total_worksize_INTT_; }


     void set_worksize_DyadicMultiply(uint64_t ws) {

         total_worksize_DyadicMultiply_ = ws;

         num_DyadicMultiply_ = total_worksize_DyadicMultiply_;

     }

     void set_worksize_NTT(uint64_t ws) {

         total_worksize_NTT_ = ws;

         num_NTT_ = total_worksize_NTT_;

     }

     void set_worksize_INTT(uint64_t ws) {

         total_worksize_INTT_ = ws;

         num_INTT_ = total_worksize_INTT_;

     }


 private:

     uint64_t get_worksize_int_DyadicMultiply() const {

         return ((num_DyadicMultiply_ > n_batch_dyadic_multiply_)

                     ? n_batch_dyadic_multiply_

                     : num_DyadicMultiply_);

     }


     uint64_t get_worksize_int_NTT() const {

         return ((num_NTT_ > n_batch_ntt_) ? n_batch_ntt_ : num_NTT_);

     }


     uint64_t get_worksize_int_INTT() const {

         return ((num_INTT_ > n_batch_intt_) ? n_batch_intt_ : num_INTT_);

     }


     void update_work_size(uint64_t ws) { num_DyadicMultiply_ -= ws; }

     void update_DyadicMultiply_work_size(uint64_t ws) {

         num_DyadicMultiply_ -= ws;

     }

     void update_NTT_work_size(uint64_t ws) { num_NTT_ -= ws; }

     void update_INTT_work_size(uint64_t ws) { num_INTT_ -= ws; }


     std::mutex mu_;

     std::mutex mu_size_;

     std::condition_variable cond_;

     std::deque<Object*> buffer_;

     const uint64_t capacity_;

     const uint64_t n_batch_dyadic_multiply_;

     const uint64_t n_batch_ntt_;

     const uint64_t n_batch_intt_;


     uint64_t total_worksize_DyadicMultiply_;

     uint64_t num_DyadicMultiply_;


     uint64_t total_worksize_NTT_;

     uint64_t num_NTT_;


     uint64_t total_worksize_INTT_;

     uint64_t num_INTT_;

 };

 struct FPGAObject {

     FPGAObject(const cl_context& context, uint64_t n_batch);

     virtual ~FPGAObject() = default;

     virtual void fill_in_data(const std::vector<Object*>& objs) = 0;

     virtual void fill_out_data(uint64_t* results) = 0;


     void recycle();


     const cl_context& context_;

     int tag_;

     uint64_t n_batch_;


     std::vector<Object*> in_objs_;


     static std::atomic<int> g_tag_;

 };


 struct FPGAObject_NTT : public FPGAObject {

     explicit FPGAObject_NTT(const cl_context& context, uint64_t coeff_count,

                             uint64_t batch_size);

     ~FPGAObject_NTT();

     void fill_in_data(const std::vector<Object*>& objs) override;

     void fill_out_data(uint64_t* coeff_poly) override;


     uint64_t* coeff_poly_in_svm_;

     uint64_t* root_of_unity_powers_in_svm_;

     uint64_t* precon_root_of_unity_powers_in_svm_;

     uint64_t* coeff_modulus_in_svm_;

     uint64_t n_;

 };


 struct FPGAObject_INTT : public FPGAObject {

     explicit FPGAObject_INTT(const cl_context& context, uint64_t coeff_count,

                              uint64_t batch_size);

     ~FPGAObject_INTT();

     void fill_in_data(const std::vector<Object*>& objs) override;

     void fill_out_data(uint64_t* coeff_poly) override;


     uint64_t* coeff_poly_in_svm_;

     uint64_t* inv_root_of_unity_powers_in_svm_;

     uint64_t* precon_inv_root_of_unity_powers_in_svm_;

     uint64_t* coeff_modulus_in_svm_;

     uint64_t* inv_n_in_svm_;

     uint64_t* inv_n_w_in_svm_;

     uint64_t n_;

 };


 struct FPGAObject_DyadicMultiply : public FPGAObject {

     explicit FPGAObject_DyadicMultiply(const cl_context& context,

                                        uint64_t coeff_size,

                                        uint32_t modulus_size,

                                        uint64_t batch_size);

     ~FPGAObject_DyadicMultiply();

     void fill_in_data(const std::vector<Object*>& objs) override;

     void fill_out_data(uint64_t* results) override;


     uint64_t* operand1_in_svm_;

     uint64_t* operand2_in_svm_;

     moduli_info_t* moduli_info_;

     uint64_t n_;

     uint64_t n_moduli_;

     cl_mem operands_in_ddr_;

     cl_mem results_out_ddr_;

 };

 typedef enum { NONE = 0, EMU, FPGA } DEV_TYPE;

 class Device {

 public:

     Device(const cl_device_id& device, Buffer& buffer,

            std::shared_future<bool> exit_signal, uint64_t coeff_size,

            uint32_t modulus_size, uint64_t batch_size_dyadic_multiply,

            uint64_t batch_size_ntt, uint64_t batch_size_intt, uint32_t debug);

     ~Device();


     void run();


 private:

     enum { CREDIT = 8 };


     enum class kernel_t { INTEGRATED, DYADIC_MULTIPLY, NTT, INTT };

     void process_blocking_api();

     bool process_input(int index);

     bool process_output();


     bool process_output_dyadic_multiply();

     bool process_output_NTT();

     bool process_output_INTT();


     void enqueue_input_data(FPGAObject* fpga_obj);

     void enqueue_input_data_dyadic_multiply(

         FPGAObject_DyadicMultiply* fpga_obj);

     void enqueue_input_data_NTT(FPGAObject_NTT* fpga_obj);

     void enqueue_input_data_INTT(FPGAObject_INTT* fpga_obj);


     int device_id() { return id_; }


     kernel_t get_kernel_type();

     std::string get_bitstream_name();


     const cl_device_id& device_;

     Buffer& buffer_;

     unsigned int credit_;

     std::shared_future<bool> future_exit_;

     int id_;

     static int device_id_;

     kernel_t kernel_type_;


     std::vector<FPGAObject*> fpgaObjects_;


     cl_context context_;

     cl_program program_;


     // DYADIC_MULTIPLY section

     cl_command_queue dyadic_multiply_input_queue_;

     cl_command_queue dyadic_multiply_output_queue_;

     cl_kernel dyadic_multiply_input_fifo_kernel_;

     cl_kernel dyadic_multiply_output_fifo_nb_kernel_;


     uint64_t* dyadic_multiply_results_out_svm_;

     int* dyadic_multiply_tag_out_svm_;

     int* dyadic_multiply_results_out_valid_svm_;

     //


     // NTT section

     cl_command_queue ntt_load_queue_;

     cl_command_queue ntt_store_queue_;

     cl_kernel ntt_load_kernel_;

     cl_kernel ntt_store_kernel_;


     uint64_t* NTT_coeff_poly_svm_;


     // INTT section

     cl_command_queue intt_INTT_queue_;

     cl_command_queue intt_load_queue_;

     cl_command_queue intt_store_queue_;

     cl_kernel intt_INTT_kernel_;

     cl_kernel intt_load_kernel_;

     cl_kernel intt_store_kernel_;


     uint64_t* INTT_coeff_poly_svm_;

     //


     uint32_t debug_;


     static const std::unordered_map<std::string, kernel_t> kernels;

 };

 class DevicePool {

 public:

     DevicePool(int choice, Buffer& buffer, std::future<bool>& exit_signal,

                uint64_t coeff_size, uint32_t modulus_size,

                uint64_t batch_size_dyadic_multiply, uint64_t batch_size_ntt,

                uint64_t batch_size_intt, uint32_t debug);

     ~DevicePool();


 private:

     DevicePool(const DevicePool& d) = delete;

     DevicePool& operator=(const DevicePool& d) = delete;


     cl_platform_id platform_;

     cl_uint device_count_;

     cl_device_id* cl_devices_;

     Device** devices_;

     std::shared_future<bool> future_exit_;


     std::vector<std::thread> runners_;

 };

 void attach_fpga_pooling();

 void detach_fpga_pooling();


 }  // namespace fpga

 }  // namespace hexl

 }  // namespace intel


 #endif

intel::hexl::fpga::Object_DyadicMultiply::n_moduli_
uint64_t n_moduli_
Definition: fpga.h:126

intel::hexl::fpga::FPGAObject_DyadicMultiply::n_
uint64_t n_
Definition: fpga.h:358

intel::hexl::fpga::moduli_info_t::barr_lo
uint64_t barr_lo
Definition: fpga.h:33

intel::hexl::fpga::Device::~Device
~Device()

intel::hexl::fpga::NONE
Definition: fpga.h:367

intel::hexl::fpga::Object_DyadicMultiply::n_
uint64_t n_
Definition: fpga.h:124

intel::hexl::fpga::FPGAObject::recycle
void recycle()

intel::hexl::fpga::FPGAObject::~FPGAObject
virtual ~FPGAObject()=default

intel::hexl::fpga::FPGAObject_NTT
Struct FPGAObject_NTT stores the NTT blob of objects to be transfered to the FPGA.
Definition: fpga.h:282

intel::hexl::fpga::Buffer::size
uint64_t size()

intel::hexl::fpga::moduli_info_t::len
uint64_t len
Definition: fpga.h:32

intel::hexl::fpga::Object_INTT::inv_root_of_unity_powers_
const uint64_t * inv_root_of_unity_powers_
Definition: fpga.h:99

intel::hexl::fpga::EMU
Definition: fpga.h:367

intel::hexl::fpga::Object_DyadicMultiply::Object_DyadicMultiply
Object_DyadicMultiply(uint64_t *results, const uint64_t *operand1, const uint64_t *operand2, uint64_t n, const uint64_t *moduli, uint64_t n_moduli)

intel::hexl::fpga::FPGAObject
Parent Struct FPGAObject stores the blob of objects to be transfered to the FPGA. ...
Definition: fpga.h:250

intel::hexl::fpga::FPGAObject_DyadicMultiply::n_moduli_
uint64_t n_moduli_
Definition: fpga.h:359

intel::hexl::fpga::FPGAObject_NTT::coeff_modulus_in_svm_
uint64_t * coeff_modulus_in_svm_
Definition: fpga.h:292

intel::hexl::fpga::Object_DyadicMultiply::operand1_
const uint64_t * operand1_
Definition: fpga.h:122

intel::hexl::fpga::Object_DyadicMultiply
struct Object_DyadicMultiply Stores the parameters for the multiplication
Definition: fpga.h:116

intel::hexl::fpga::Device
Class Device.
Definition: fpga.h:385

intel::hexl::fpga::FPGAObject_INTT::FPGAObject_INTT
FPGAObject_INTT(const cl_context &context, uint64_t coeff_count, uint64_t batch_size)

intel::hexl::fpga::FPGAObject::FPGAObject
FPGAObject(const cl_context &context, uint64_t n_batch)

intel::hexl::fpga::FPGAObject_INTT::inv_n_in_svm_
uint64_t * inv_n_in_svm_
Definition: fpga.h:324

intel::hexl::fpga::attach_fpga_pooling
void attach_fpga_pooling()
attach_fpga_pooling Attach a device to this thread

intel::hexl::fpga::FPGAObject_NTT::~FPGAObject_NTT
~FPGAObject_NTT()

intel::hexl::fpga::FPGAObject::fill_in_data
virtual void fill_in_data(const std::vector< Object * > &objs)=0

intel::hexl::fpga::Object_INTT::coeff_poly_
uint64_t * coeff_poly_
Definition: fpga.h:98

intel::hexl::fpga::FPGAObject_NTT::fill_in_data
void fill_in_data(const std::vector< Object * > &objs) override

intel::hexl::fpga::Object
Struct Object.
Definition: fpga.h:44

intel::hexl::fpga::Buffer
Struct Buffer Structure containing information for the polynomial operations.
Definition: fpga.h:155

intel::hexl::fpga::DEV_TYPE
DEV_TYPE
enum DEV_TYPE Lists the available device mode: CPU, emulation mode, FPGA
Definition: fpga.h:367

intel::hexl::fpga::Object::g_wid_
static unsigned int g_wid_
Definition: fpga.h:51

intel::hexl::fpga::Object::~Object
virtual ~Object()=default

intel::hexl::fpga::Object_NTT::precon_root_of_unity_powers_
const uint64_t * precon_root_of_unity_powers_
Definition: fpga.h:72

intel::hexl::fpga::Device::Device
Device(const cl_device_id &device, Buffer &buffer, std::shared_future< bool > exit_signal, uint64_t coeff_size, uint32_t modulus_size, uint64_t batch_size_dyadic_multiply, uint64_t batch_size_ntt, uint64_t batch_size_intt, uint32_t debug)

intel::hexl::fpga::FPGAObject_INTT::n_
uint64_t n_
Definition: fpga.h:326

intel::hexl::fpga::Object::ready_
bool ready_
Definition: fpga.h:49

intel::hexl::fpga::Object_DyadicMultiply::results_
uint64_t * results_
Definition: fpga.h:121

intel::hexl::fpga::FPGAObject_INTT::coeff_modulus_in_svm_
uint64_t * coeff_modulus_in_svm_
Definition: fpga.h:323

intel::hexl::fpga::Object_INTT::Object_INTT
Object_INTT(uint64_t *coeff_poly, const uint64_t *inv_root_of_unity_powers, const uint64_t *precon_inv_root_of_unity_powers, uint64_t coeff_modulus, uint64_t inv_n, uint64_t inv_n_w, uint64_t n)

intel::hexl::fpga::Object::Object
Object()

intel::hexl::fpga::Device::kernel_t::INTT

intel::hexl::fpga::FPGAObject_DyadicMultiply::operand2_in_svm_
uint64_t * operand2_in_svm_
Definition: fpga.h:356

intel::hexl::fpga::Buffer::set_worksize_INTT
void set_worksize_INTT(uint64_t ws)
Definition: fpga.h:190

intel::hexl::fpga::FPGAObject_DyadicMultiply
Struct FPGAObject_DyadicMultiply Stores the multiplication blob of objects to be transfered to the FP...
Definition: fpga.h:346

intel::hexl::fpga::FPGAObject_INTT::fill_out_data
void fill_out_data(uint64_t *coeff_poly) override

intel::hexl::fpga::FPGAObject_DyadicMultiply::operand1_in_svm_
uint64_t * operand1_in_svm_
Definition: fpga.h:355

intel::hexl::fpga::Buffer::get_worksize_NTT
uint64_t get_worksize_NTT() const
Definition: fpga.h:179

intel::hexl::fpga::moduli_info_t
Struct moduli_info_t.
Definition: fpga.h:30

intel::hexl::fpga::DevicePool::~DevicePool
~DevicePool()

intel::hexl::fpga::Object_NTT::coeff_modulus_
uint64_t coeff_modulus_
Definition: fpga.h:73

intel::hexl::fpga::FPGAObject::tag_
int tag_
Definition: fpga.h:259

intel::hexl::fpga::moduli_info_t::modulus
uint64_t modulus
Definition: fpga.h:31

intel::hexl::fpga::FPGAObject_DyadicMultiply::results_out_ddr_
cl_mem results_out_ddr_
Definition: fpga.h:361

intel::hexl::fpga::FPGAObject_INTT::fill_in_data
void fill_in_data(const std::vector< Object * > &objs) override

intel::hexl::fpga::FPGAObject_DyadicMultiply::moduli_info_
moduli_info_t * moduli_info_
Definition: fpga.h:357

intel::hexl::fpga::Object_NTT::n_
uint64_t n_
Definition: fpga.h:74

intel::hexl::fpga::FPGAObject_INTT::inv_root_of_unity_powers_in_svm_
uint64_t * inv_root_of_unity_powers_in_svm_
Definition: fpga.h:321

intel::hexl::fpga::Object::id_
int id_
Definition: fpga.h:50

intel::hexl::fpga::Object_INTT::coeff_modulus_
uint64_t coeff_modulus_
Definition: fpga.h:101

intel::hexl::fpga::Buffer::get_worksize_INTT
uint64_t get_worksize_INTT() const
Definition: fpga.h:180

intel::hexl::fpga::Object_INTT::inv_n_
uint64_t inv_n_
Definition: fpga.h:102

intel::hexl::fpga::FPGAObject_DyadicMultiply::~FPGAObject_DyadicMultiply
~FPGAObject_DyadicMultiply()

intel::hexl::fpga::Buffer::set_worksize_DyadicMultiply
void set_worksize_DyadicMultiply(uint64_t ws)
Definition: fpga.h:182

intel::hexl::fpga::FPGAObject_NTT::n_
uint64_t n_
Definition: fpga.h:293

intel::hexl::fpga::Object_NTT
Struct Object NTT Stores the Number Theoretic Transform parameters.
Definition: fpga.h:64

intel::hexl::fpga::FPGAObject::n_batch_
uint64_t n_batch_
Definition: fpga.h:260

intel::hexl::fpga::FPGAObject_NTT::root_of_unity_powers_in_svm_
uint64_t * root_of_unity_powers_in_svm_
Definition: fpga.h:290

intel::hexl::fpga::FPGAObject_INTT::coeff_poly_in_svm_
uint64_t * coeff_poly_in_svm_
Definition: fpga.h:320

intel::hexl::fpga::Buffer::pop
std::vector< Object * > pop()

intel::hexl::fpga::Object_INTT::inv_n_w_
uint64_t inv_n_w_
Definition: fpga.h:103

intel::hexl::fpga::Buffer::front
Object * front()

intel::hexl::fpga::FPGAObject::g_tag_
static std::atomic< int > g_tag_
Definition: fpga.h:264

intel::hexl::fpga::FPGAObject_NTT::coeff_poly_in_svm_
uint64_t * coeff_poly_in_svm_
Definition: fpga.h:289

intel::hexl::fpga::FPGAObject_NTT::fill_out_data
void fill_out_data(uint64_t *coeff_poly) override

intel::hexl::fpga::Object_DyadicMultiply::operand2_
const uint64_t * operand2_
Definition: fpga.h:123

intel::hexl::fpga::Object_NTT::Object_NTT
Object_NTT(uint64_t *coeff_poly, const uint64_t *root_of_unity_powers, const uint64_t *precon_root_of_unity_powers, uint64_t coeff_modulus, uint64_t n)

intel::hexl::fpga::Device::kernel_t::INTEGRATED

intel::hexl::fpga::FPGAObject_NTT::precon_root_of_unity_powers_in_svm_
uint64_t * precon_root_of_unity_powers_in_svm_
Definition: fpga.h:291

intel::hexl::fpga::FPGAObject_DyadicMultiply::operands_in_ddr_
cl_mem operands_in_ddr_
Definition: fpga.h:360

intel::hexl::fpga::FPGAObject::context_
const cl_context & context_
Definition: fpga.h:258

intel::hexl::fpga::Buffer::push
void push(Object *obj)

intel::hexl::fpga::FPGA
Definition: fpga.h:367

intel::hexl::fpga::Object_INTT::n_
uint64_t n_
Definition: fpga.h:104

intel::hexl::fpga::Object_NTT::coeff_poly_
uint64_t * coeff_poly_
Definition: fpga.h:70

intel::hexl::fpga::FPGAObject_INTT::~FPGAObject_INTT
~FPGAObject_INTT()

intel::hexl::fpga::Device::run
void run()

intel::hexl::fpga::FPGAObject_DyadicMultiply::fill_out_data
void fill_out_data(uint64_t *results) override

intel::hexl::fpga::Object_DyadicMultiply::moduli_
const uint64_t * moduli_
Definition: fpga.h:125

intel::hexl::fpga::DevicePool::DevicePool
DevicePool(int choice, Buffer &buffer, std::future< bool > &exit_signal, uint64_t coeff_size, uint32_t modulus_size, uint64_t batch_size_dyadic_multiply, uint64_t batch_size_ntt, uint64_t batch_size_intt, uint32_t debug)

intel::hexl::fpga::DevicePool
Class DevicePool.
Definition: fpga.h:480

intel::hexl::fpga::Object_INTT::precon_inv_root_of_unity_powers_
const uint64_t * precon_inv_root_of_unity_powers_
Definition: fpga.h:100

intel::hexl::fpga::detach_fpga_pooling
void detach_fpga_pooling()
detach_fpga_pooling Detach a device from this thread

intel::hexl::fpga::Object_INTT
Struct Object INTT Stores the Inverse Number Theoretic Transform parameters.
Definition: fpga.h:91

intel::hexl::fpga::FPGAObject_DyadicMultiply::FPGAObject_DyadicMultiply
FPGAObject_DyadicMultiply(const cl_context &context, uint64_t coeff_size, uint32_t modulus_size, uint64_t batch_size)

intel::hexl::fpga::FPGAObject_INTT::inv_n_w_in_svm_
uint64_t * inv_n_w_in_svm_
Definition: fpga.h:325

intel::hexl::fpga::FPGAObject_INTT
Struct FPGAObject_INTT stores the INTT blob of objects to be transfered to the FPGA.
Definition: fpga.h:313

intel::hexl::fpga::Buffer::set_worksize_NTT
void set_worksize_NTT(uint64_t ws)
Definition: fpga.h:186

intel::hexl::fpga::FPGAObject::fill_out_data
virtual void fill_out_data(uint64_t *results)=0

intel::hexl::fpga::Object_NTT::root_of_unity_powers_
const uint64_t * root_of_unity_powers_
Definition: fpga.h:71

intel::hexl::fpga::FPGAObject_DyadicMultiply::fill_in_data
void fill_in_data(const std::vector< Object * > &objs) override

intel::hexl::fpga::Buffer::Buffer
Buffer(uint64_t capacity, uint64_t n_batch_dyadic_multiply, uint64_t n_batch_ntt, uint64_t n_batch_intt)
Definition: fpga.h:157

intel::hexl::fpga::Buffer::get_worksize_DyadicMultiply
uint64_t get_worksize_DyadicMultiply() const
Definition: fpga.h:176

intel::hexl::fpga::fpga_uint128_t
__extension__ typedef unsigned __int128 fpga_uint128_t
Definition: fpga.h:23

intel::hexl::fpga::Device::kernel_t::DYADIC_MULTIPLY

intel::hexl::fpga::Device::kernel_t::NTT

intel::hexl::fpga::FPGAObject_INTT::precon_inv_root_of_unity_powers_in_svm_
uint64_t * precon_inv_root_of_unity_powers_in_svm_
Definition: fpga.h:322

intel::hexl::fpga::FPGAObject::in_objs_
std::vector< Object * > in_objs_
Definition: fpga.h:262

intel::hexl::fpga::FPGAObject_NTT::FPGAObject_NTT
FPGAObject_NTT(const cl_context &context, uint64_t coeff_count, uint64_t batch_size)