llvm-docs/doxygen/vector_8hpp_source.html

 //==---------------- vector.hpp --- Implements sycl::vec -------------------==//

 //

 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

 // See https://llvm.org/LICENSE.txt for license information.

 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

 //

 //===----------------------------------------------------------------------===//


 #pragma once


 // Check if Clang's ext_vector_type attribute is available. Host compiler

 // may not be Clang, and Clang may not be built with the extension.

 #ifdef __clang__

 #ifndef __has_extension

 #define __has_extension(x) 0

 #endif

 #ifdef __HAS_EXT_VECTOR_TYPE__

 #error "Undefine __HAS_EXT_VECTOR_TYPE__ macro"

 #endif

 #if __has_extension(attribute_ext_vector_type)

 #define __HAS_EXT_VECTOR_TYPE__

 #endif

 #endif // __clang__


 #if !defined(__HAS_EXT_VECTOR_TYPE__) && defined(__SYCL_DEVICE_ONLY__)

 #error "SYCL device compiler is built without ext_vector_type support"

 #endif


 #if defined(__SYCL_DEVICE_ONLY__)

 #define __SYCL_USE_EXT_VECTOR_TYPE__

 #endif


 #include <sycl/access/access.hpp>              // for decorated, address_space

 #include <sycl/aliases.hpp>                    // for half, cl_char, cl_int

 #include <sycl/detail/common.hpp>              // for ArrayCreator, RepeatV...

 #include <sycl/detail/defines_elementary.hpp>  // for __SYCL2020_DEPRECATED

 #include <sycl/detail/generic_type_lists.hpp>  // for vector_basic_list

 #include <sycl/detail/generic_type_traits.hpp> // for is_sigeninteger, is_s...

 #include <sycl/detail/memcpy.hpp>              // for memcpy

 #include <sycl/detail/type_list.hpp>           // for is_contained

 #include <sycl/detail/type_traits.hpp>         // for is_floating_point

 #include <sycl/detail/vector_convert.hpp>      // for convertImpl

 #include <sycl/detail/vector_traits.hpp>       // for vector_alignment

 #include <sycl/half_type.hpp>                  // for StorageT, half, Vec16...


 #include <sycl/ext/oneapi/bfloat16.hpp> // bfloat16


 #include <array>       // for array

 #include <assert.h>    // for assert

 #include <cstddef>     // for size_t, NULL, byte

 #include <cstdint>     // for uint8_t, int16_t, int...

 #include <functional>  // for divides, multiplies

 #include <iterator>    // for pair

 #include <ostream>     // for operator<<, basic_ost...

 #include <type_traits> // for enable_if_t, is_same

 #include <utility>     // for index_sequence, make_...


 namespace sycl {

 inline namespace _V1 {


 struct elem {

   static constexpr int x = 0;

   static constexpr int y = 1;

   static constexpr int z = 2;

   static constexpr int w = 3;

   static constexpr int r = 0;

   static constexpr int g = 1;

   static constexpr int b = 2;

   static constexpr int a = 3;

   static constexpr int s0 = 0;

   static constexpr int s1 = 1;

   static constexpr int s2 = 2;

   static constexpr int s3 = 3;

   static constexpr int s4 = 4;

   static constexpr int s5 = 5;

   static constexpr int s6 = 6;

   static constexpr int s7 = 7;

   static constexpr int s8 = 8;

   static constexpr int s9 = 9;

   static constexpr int sA = 10;

   static constexpr int sB = 11;

   static constexpr int sC = 12;

   static constexpr int sD = 13;

   static constexpr int sE = 14;

   static constexpr int sF = 15;

 };


 namespace detail {

 // select_apply_cl_t selects from T8/T16/T32/T64 basing on

 // sizeof(_IN).  expected to handle scalar types in _IN.

 template <typename _IN, typename T8, typename T16, typename T32, typename T64>

 using select_apply_cl_t = std::conditional_t<

     sizeof(_IN) == 1, T8,

     std::conditional_t<sizeof(_IN) == 2, T16,

                        std::conditional_t<sizeof(_IN) == 4, T32, T64>>>;


 template <typename T> struct vec_helper {

   using RetType = T;

   static constexpr RetType get(T value) { return value; }

   static constexpr RetType set(T value) { return value; }

 };

 template <> struct vec_helper<bool> {

   using RetType = select_apply_cl_t<bool, std::int8_t, std::int16_t,

                                     std::int32_t, std::int64_t>;

   static constexpr RetType get(bool value) { return value; }

   static constexpr RetType set(bool value) { return value; }

 };


 template <> struct vec_helper<sycl::ext::oneapi::bfloat16> {

   using RetType = sycl::ext::oneapi::bfloat16;

   using BFloat16StorageT = sycl::ext::oneapi::detail::Bfloat16StorageT;

   static constexpr RetType get(BFloat16StorageT value) {

 #if defined(__SYCL_BITCAST_IS_CONSTEXPR)

     return sycl::bit_cast<RetType>(value);

 #else

     // awkward workaround. sycl::bit_cast isn't constexpr in older GCC

     // C++20 will give us both std::bit_cast and constexpr reinterpet for void*

     // but neither available yet.

     union {

       sycl::ext::oneapi::bfloat16 bf16;

       sycl::ext::oneapi::detail::Bfloat16StorageT storage;

     } result = {};

     result.storage = value;

     return result.bf16;

 #endif

   }


   static constexpr RetType get(RetType value) { return value; }


   static constexpr BFloat16StorageT set(RetType value) {

 #if defined(__SYCL_BITCAST_IS_CONSTEXPR)

     return sycl::bit_cast<BFloat16StorageT>(value);

 #else

     union {

       sycl::ext::oneapi::bfloat16 bf16;

       sycl::ext::oneapi::detail::Bfloat16StorageT storage;

     } result = {};

     result.bf16 = value;

     return result.storage;

 #endif

   }

 };


 #if (!defined(_HAS_STD_BYTE) || _HAS_STD_BYTE != 0)

 template <> struct vec_helper<std::byte> {

   using RetType = std::uint8_t;

   static constexpr RetType get(std::byte value) { return (RetType)value; }

   static constexpr RetType set(std::byte value) { return (RetType)value; }

   static constexpr std::byte get(std::uint8_t value) {

     return (std::byte)value;

   }

   static constexpr std::byte set(std::uint8_t value) {

     return (std::byte)value;

   }

 };

 #endif


 template <typename VecT, typename OperationLeftT, typename OperationRightT,

           template <typename> class OperationCurrentT, int... Indexes>

 class SwizzleOp;


 template <typename T, int N, typename V = void> struct VecStorage;


 // Element type for relational operator return value.

 template <typename DataT>

 using rel_t = typename std::conditional_t<

     sizeof(DataT) == sizeof(opencl::cl_char), opencl::cl_char,

     typename std::conditional_t<

         sizeof(DataT) == sizeof(opencl::cl_short), opencl::cl_short,

         typename std::conditional_t<

             sizeof(DataT) == sizeof(opencl::cl_int), opencl::cl_int,

             typename std::conditional_t<sizeof(DataT) ==

                                             sizeof(opencl::cl_long),

                                         opencl::cl_long, bool>>>>;


 // Special type indicating that SwizzleOp should just read value from vector -

 // not trying to perform any operations. Should not be called.

 template <typename T> class GetOp {

 public:

   using DataT = T;

   DataT getValue(size_t) const { return (DataT)0; }

   DataT operator()(DataT, DataT) { return (DataT)0; }

 };


 // Forward declarations

 template <typename TransformedArgType, int Dims, typename KernelType>

 class RoundedRangeKernel;

 template <typename TransformedArgType, int Dims, typename KernelType>

 class RoundedRangeKernelWithKH;


 // Vectors of size 1 are handled separately and therefore 1 is not included in

 // the check below.

 constexpr bool isValidVectorSize(int N) {

   return N == 2 || N == 3 || N == 4 || N == 8 || N == 16;

 }

 template <typename T, int N, typename V> struct VecStorage {

   static_assert(

       isValidVectorSize(N) || N == 1,

       "Incorrect number of elements for sycl::vec: only 1, 2, 3, 4, 8 "

       "or 16 are supported");

   static_assert(!std::is_same_v<V, void>, "Incorrect data type for sycl::vec");

 };


 #ifdef __SYCL_DEVICE_ONLY__

 // device always has ext vector support, but for huge vectors

 // we switch to std::array, so that we can use a smaller alignment (64)

 // this is to support MSVC, which has a max of 64 for direct params.

 template <typename T, int N> struct VecStorageImpl {

   static constexpr size_t Num = (N == 3) ? 4 : N;

   static constexpr size_t Sz = Num * sizeof(T);

   using DataType =

       typename std::conditional<Sz <= 64, T __attribute__((ext_vector_type(N))),

                                 std::array<T, Num>>::type;

   using VectorDataType = T __attribute__((ext_vector_type(N)));

 };

 #else  // __SYCL_DEVICE_ONLY__

 template <typename T, int N> struct VecStorageImpl {

   using DataType = std::array<T, (N == 3) ? 4 : N>;

 };

 #endif // __SYCL_DEVICE_ONLY__


 // Single element bool

 template <> struct VecStorage<bool, 1, void> {

   using DataType = bool;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType = bool;

 #endif // __SYCL_DEVICE_ONLY__

 };


 // Multiple element bool

 template <int N>

 struct VecStorage<bool, N, typename std::enable_if_t<isValidVectorSize(N)>> {

   using DataType =

       typename VecStorageImpl<select_apply_cl_t<bool, std::int8_t, std::int16_t,

                                                 std::int32_t, std::int64_t>,

                               N>::DataType;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType =

       typename VecStorageImpl<select_apply_cl_t<bool, std::int8_t, std::int16_t,

                                                 std::int32_t, std::int64_t>,

                               N>::VectorDataType;

 #endif // __SYCL_DEVICE_ONLY__

 };


 #if (!defined(_HAS_STD_BYTE) || _HAS_STD_BYTE != 0)

 // Single element byte. Multiple elements will propagate through a later

 // specialization.

 template <> struct VecStorage<std::byte, 1, void> {

   using DataType = std::int8_t;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType = std::int8_t;

 #endif // __SYCL_DEVICE_ONLY__

 };

 #endif // (!defined(_HAS_STD_BYTE) || _HAS_STD_BYTE != 0)


 // Single element signed integers

 template <typename T>

 struct VecStorage<T, 1, typename std::enable_if_t<is_sigeninteger_v<T>>> {

   using DataType = T;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType = DataType;

 #endif // __SYCL_DEVICE_ONLY__

 };


 // Single element unsigned integers

 template <typename T>

 struct VecStorage<T, 1, typename std::enable_if_t<is_sugeninteger_v<T>>> {

   using DataType = T;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType = DataType;

 #endif // __SYCL_DEVICE_ONLY__

 };


 // Single element floating-point (except half/bfloat16)

 template <typename T>

 struct VecStorage<

     T, 1,

     typename std::enable_if_t<!is_half_or_bf16_v<T> && is_sgenfloat_v<T>>> {

   using DataType = T;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType = DataType;

 #endif // __SYCL_DEVICE_ONLY__

 };

 // Multiple elements signed/unsigned integers and floating-point (except

 // half/bfloat16)

 template <typename T, int N>

 struct VecStorage<

     T, N,

     typename std::enable_if_t<isValidVectorSize(N) &&

                               (is_sgeninteger_v<T> ||

                                (is_sgenfloat_v<T> && !is_half_or_bf16_v<T>))>> {

   using DataType =

       typename VecStorageImpl<typename VecStorage<T, 1>::DataType, N>::DataType;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType =

       typename VecStorageImpl<typename VecStorage<T, 1>::DataType,

                               N>::VectorDataType;

 #endif // __SYCL_DEVICE_ONLY__

 };


 // Single element half

 template <> struct VecStorage<half, 1, void> {

   using DataType = sycl::detail::half_impl::VecElemT;

 #ifdef __SYCL_DEVICE_ONLY__

   using VectorDataType = sycl::detail::half_impl::VecElemT;

 #endif // __SYCL_DEVICE_ONLY__

 };


 // Multiple elements half

 #if defined(__SYCL_DEVICE_ONLY__)

 #define __SYCL_DEFINE_HALF_VECSTORAGE(Num)                                     \

   template <> struct VecStorage<half, Num, void> {                             \

     using DataType = sycl::detail::half_impl::Vec##Num##StorageT;              \

     using VectorDataType = sycl::detail::half_impl::Vec##Num##StorageT;        \

   };

 #else // defined(__SYCL_DEVICE_ONLY__)

 #define __SYCL_DEFINE_HALF_VECSTORAGE(Num)                                     \

   template <> struct VecStorage<half, Num, void> {                             \

     using DataType = sycl::detail::half_impl::Vec##Num##StorageT;              \

   };

 #endif // defined(__SYCL_DEVICE_ONLY__)


 __SYCL_DEFINE_HALF_VECSTORAGE(2)

 __SYCL_DEFINE_HALF_VECSTORAGE(3)

 __SYCL_DEFINE_HALF_VECSTORAGE(4)

 __SYCL_DEFINE_HALF_VECSTORAGE(8)

 __SYCL_DEFINE_HALF_VECSTORAGE(16)

 #undef __SYCL_DEFINE_HALF_VECSTORAGE


 // Single element bfloat16

 template <> struct VecStorage<sycl::ext::oneapi::bfloat16, 1, void> {

   using DataType = sycl::ext::oneapi::detail::Bfloat16StorageT;

   // using VectorDataType = sycl::ext::oneapi::bfloat16;

   using VectorDataType = sycl::ext::oneapi::detail::Bfloat16StorageT;

 };

 // Multiple elements bfloat16

 #define __SYCL_DEFINE_BF16_VECSTORAGE(Num)                                     \

   template <> struct VecStorage<sycl::ext::oneapi::bfloat16, Num, void> {      \

     using DataType = sycl::ext::oneapi::detail::bf16::Vec##Num##StorageT;      \

     using VectorDataType =                                                     \

         sycl::ext::oneapi::detail::bf16::Vec##Num##StorageT;                   \

   };

 __SYCL_DEFINE_BF16_VECSTORAGE(2)

 __SYCL_DEFINE_BF16_VECSTORAGE(3)

 __SYCL_DEFINE_BF16_VECSTORAGE(4)

 __SYCL_DEFINE_BF16_VECSTORAGE(8)

 __SYCL_DEFINE_BF16_VECSTORAGE(16)

 #undef __SYCL_DEFINE_BF16_VECSTORAGE

 } // namespace detail


 template <typename T> using vec_data = detail::vec_helper<T>;


 template <typename T>

 using vec_data_t = typename detail::vec_helper<T>::RetType;


 template <typename Type, int NumElements> class vec {

   using DataT = Type;


   // This represent type of underlying value. There should be only one field

   // in the class, so vec<float, 16> should be equal to float16 in memory.

   using DataType = typename detail::VecStorage<DataT, NumElements>::DataType;


 #ifdef __SYCL_DEVICE_ONLY__

   static constexpr bool IsHostHalf = false;

 #else

   static constexpr bool IsHostHalf =

       std::is_same_v<DataT, sycl::detail::half_impl::half>;

 #endif


   static constexpr bool IsBfloat16 =

       std::is_same_v<DataT, sycl::ext::oneapi::bfloat16>;


   static constexpr size_t AdjustedNum = (NumElements == 3) ? 4 : NumElements;

   static constexpr size_t Sz = sizeof(DataT) * AdjustedNum;

   static constexpr bool IsSizeGreaterThanMaxAlign =

       (Sz > detail::MaxVecAlignment);


   // TODO: There is no support for vector half type on host yet.

   // Also, when Sz is greater than alignment, we use std::array instead of

   // vector extension. This is for MSVC compatibility, which has a max alignment

   // of 64 for direct params. If we drop MSVC, we can have alignment the same as

   // size and use vector extensions for all sizes.

   static constexpr bool IsUsingArrayOnDevice =

       (IsHostHalf || IsBfloat16 || IsSizeGreaterThanMaxAlign);


 #if defined(__SYCL_DEVICE_ONLY__)

   static constexpr bool NativeVec = NumElements > 1 && !IsUsingArrayOnDevice;

   static constexpr bool IsUsingArrayOnHost = false; // not compiling for host.

 #else

   static constexpr bool NativeVec = false;

   static constexpr bool IsUsingArrayOnHost = true; // host always std::array.

 #endif


   static constexpr int getNumElements() { return NumElements; }


   // SizeChecker is needed for vec(const argTN &... args) ctor to validate args.

   template <int Counter, int MaxValue, class...>

   struct SizeChecker : std::conditional_t<Counter == MaxValue, std::true_type,

                                           std::false_type> {};


   template <int Counter, int MaxValue, typename DataT_, class... tail>

   struct SizeChecker<Counter, MaxValue, DataT_, tail...>

       : std::conditional_t<Counter + 1 <= MaxValue,

                            SizeChecker<Counter + 1, MaxValue, tail...>,

                            std::false_type> {};


   // Utility trait for creating an std::array from an vector argument.

   template <typename DataT_, typename T, std::size_t... Is>

   static constexpr std::array<DataT_, sizeof...(Is)>

   VecToArray(const vec<T, sizeof...(Is)> &V, std::index_sequence<Is...>) {

     return {static_cast<DataT_>(V.getValue(Is))...};

   }

   template <typename DataT_, typename T, int N, typename T2, typename T3,

             template <typename> class T4, int... T5, std::size_t... Is>

   static constexpr std::array<DataT_, sizeof...(Is)>

   VecToArray(const detail::SwizzleOp<vec<T, N>, T2, T3, T4, T5...> &V,

              std::index_sequence<Is...>) {

     return {static_cast<DataT_>(V.getValue(Is))...};

   }

   template <typename DataT_, typename T, int N, typename T2, typename T3,

             template <typename> class T4, int... T5, std::size_t... Is>

   static constexpr std::array<DataT_, sizeof...(Is)>

   VecToArray(const detail::SwizzleOp<const vec<T, N>, T2, T3, T4, T5...> &V,

              std::index_sequence<Is...>) {

     return {static_cast<DataT_>(V.getValue(Is))...};

   }

   template <typename DataT_, typename T, int N>

   static constexpr std::array<DataT_, N>

   FlattenVecArgHelper(const vec<T, N> &A) {

     return VecToArray<DataT_>(A, std::make_index_sequence<N>());

   }

   template <typename DataT_, typename T, int N, typename T2, typename T3,

             template <typename> class T4, int... T5>

   static constexpr std::array<DataT_, sizeof...(T5)> FlattenVecArgHelper(

       const detail::SwizzleOp<vec<T, N>, T2, T3, T4, T5...> &A) {

     return VecToArray<DataT_>(A, std::make_index_sequence<sizeof...(T5)>());

   }

   template <typename DataT_, typename T, int N, typename T2, typename T3,

             template <typename> class T4, int... T5>

   static constexpr std::array<DataT_, sizeof...(T5)> FlattenVecArgHelper(

       const detail::SwizzleOp<const vec<T, N>, T2, T3, T4, T5...> &A) {

     return VecToArray<DataT_>(A, std::make_index_sequence<sizeof...(T5)>());

   }

   template <typename DataT_, typename T>

   static constexpr auto FlattenVecArgHelper(const T &A) {

     return std::array<DataT_, 1>{vec_data<DataT_>::get(static_cast<DataT_>(A))};

   }

   template <typename DataT_, typename T> struct FlattenVecArg {

     constexpr auto operator()(const T &A) const {

       return FlattenVecArgHelper<DataT_>(A);

     }

   };


   // Alias for shortening the vec arguments to array converter.

   template <typename DataT_, typename... ArgTN>

   using VecArgArrayCreator =

       detail::ArrayCreator<DataT_, FlattenVecArg, ArgTN...>;


 #define __SYCL_ALLOW_VECTOR_SIZES(num_elements)                                \

   template <int Counter, int MaxValue, typename DataT_, class... tail>         \

   struct SizeChecker<Counter, MaxValue, vec<DataT_, num_elements>, tail...>    \

       : std::conditional_t<                                                    \

             Counter + (num_elements) <= MaxValue,                              \

             SizeChecker<Counter + (num_elements), MaxValue, tail...>,          \

             std::false_type> {};                                               \

   template <int Counter, int MaxValue, typename DataT_, typename T2,           \

             typename T3, template <typename> class T4, int... T5,              \

             class... tail>                                                     \

   struct SizeChecker<                                                          \

       Counter, MaxValue,                                                       \

       detail::SwizzleOp<vec<DataT_, num_elements>, T2, T3, T4, T5...>,         \

       tail...>                                                                 \

       : std::conditional_t<                                                    \

             Counter + sizeof...(T5) <= MaxValue,                               \

             SizeChecker<Counter + sizeof...(T5), MaxValue, tail...>,           \

             std::false_type> {};                                               \

   template <int Counter, int MaxValue, typename DataT_, typename T2,           \

             typename T3, template <typename> class T4, int... T5,              \

             class... tail>                                                     \

   struct SizeChecker<                                                          \

       Counter, MaxValue,                                                       \

       detail::SwizzleOp<const vec<DataT_, num_elements>, T2, T3, T4, T5...>,   \

       tail...>                                                                 \

       : std::conditional_t<                                                    \

             Counter + sizeof...(T5) <= MaxValue,                               \

             SizeChecker<Counter + sizeof...(T5), MaxValue, tail...>,           \

             std::false_type> {};


   __SYCL_ALLOW_VECTOR_SIZES(1)

   __SYCL_ALLOW_VECTOR_SIZES(2)

   __SYCL_ALLOW_VECTOR_SIZES(3)

   __SYCL_ALLOW_VECTOR_SIZES(4)

   __SYCL_ALLOW_VECTOR_SIZES(8)

   __SYCL_ALLOW_VECTOR_SIZES(16)

 #undef __SYCL_ALLOW_VECTOR_SIZES


   // TypeChecker is needed for vec(const argTN &... args) ctor to validate args.

   template <typename T, typename DataT_>

   struct TypeChecker : std::is_convertible<T, DataT_> {};

 #define __SYCL_ALLOW_VECTOR_TYPES(num_elements)                                \

   template <typename DataT_>                                                   \

   struct TypeChecker<vec<DataT_, num_elements>, DataT_> : std::true_type {};   \

   template <typename DataT_, typename T2, typename T3,                         \

             template <typename> class T4, int... T5>                           \

   struct TypeChecker<                                                          \

       detail::SwizzleOp<vec<DataT_, num_elements>, T2, T3, T4, T5...>, DataT_> \

       : std::true_type {};                                                     \

   template <typename DataT_, typename T2, typename T3,                         \

             template <typename> class T4, int... T5>                           \

   struct TypeChecker<                                                          \

       detail::SwizzleOp<const vec<DataT_, num_elements>, T2, T3, T4, T5...>,   \

       DataT_> : std::true_type {};


   __SYCL_ALLOW_VECTOR_TYPES(1)

   __SYCL_ALLOW_VECTOR_TYPES(2)

   __SYCL_ALLOW_VECTOR_TYPES(3)

   __SYCL_ALLOW_VECTOR_TYPES(4)

   __SYCL_ALLOW_VECTOR_TYPES(8)

   __SYCL_ALLOW_VECTOR_TYPES(16)

 #undef __SYCL_ALLOW_VECTOR_TYPES


   template <int... Indexes>

   using Swizzle =

       detail::SwizzleOp<vec, detail::GetOp<DataT>, detail::GetOp<DataT>,

                         detail::GetOp, Indexes...>;


   template <int... Indexes>

   using ConstSwizzle =

       detail::SwizzleOp<const vec, detail::GetOp<DataT>, detail::GetOp<DataT>,

                         detail::GetOp, Indexes...>;


   // Shortcuts for args validation in vec(const argTN &... args) ctor.

   template <typename... argTN>

   using EnableIfSuitableTypes = typename std::enable_if_t<

       std::conjunction_v<TypeChecker<argTN, DataT>...>>;


   template <typename... argTN>

   using EnableIfSuitableNumElements =

       typename std::enable_if_t<SizeChecker<0, NumElements, argTN...>::value>;


   template <size_t... Is>

   constexpr vec(const std::array<vec_data_t<DataT>, NumElements> &Arr,

                 std::index_sequence<Is...>)

       : m_Data{([&](vec_data_t<DataT> v) constexpr {

           if constexpr (std::is_same_v<sycl::ext::oneapi::bfloat16, DataT>)

             return v.value;

           else

             return vec_data_t<DataT>(static_cast<DataT>(v));

         })(Arr[Is])...} {}


 public:

   using element_type = DataT;

   using value_type = DataT;

   using rel_t = detail::rel_t<DataT>;

 #ifdef __SYCL_DEVICE_ONLY__

   using vector_t =

       typename detail::VecStorage<DataT, NumElements>::VectorDataType;

 #endif // __SYCL_DEVICE_ONLY__


   vec() = default;


   constexpr vec(const vec &Rhs) = default;

   constexpr vec(vec &&Rhs) = default;


   constexpr vec &operator=(const vec &Rhs) = default;


   // W/o this, things like "vec<char,*> = vec<signed char, *>" doesn't work.

   template <typename Ty = DataT>

   typename std::enable_if_t<!std::is_same_v<Ty, rel_t> &&

                                 std::is_convertible_v<vec_data_t<Ty>, rel_t>,

                             vec &>

   operator=(const vec<rel_t, NumElements> &Rhs) {

     *this = Rhs.template as<vec>();

     return *this;

   }


 #ifdef __SYCL_USE_EXT_VECTOR_TYPE__

   template <typename T = void>

   using EnableIfNotHostHalf = typename std::enable_if_t<!IsHostHalf, T>;


   template <typename T = void>

   using EnableIfHostHalf = typename std::enable_if_t<IsHostHalf, T>;


   template <typename T = void>

   using EnableIfUsingArrayOnDevice =

       typename std::enable_if_t<IsUsingArrayOnDevice, T>;


   template <typename T = void>

   using EnableIfNotUsingArrayOnDevice =

       typename std::enable_if_t<!IsUsingArrayOnDevice, T>;

 #endif // __SYCL_USE_EXT_VECTOR_TYPE__


   template <typename T = void>

   using EnableIfUsingArray =

       typename std::enable_if_t<IsUsingArrayOnDevice || IsUsingArrayOnHost, T>;


   template <typename T = void>

   using EnableIfNotUsingArray =

       typename std::enable_if_t<!IsUsingArrayOnDevice && !IsUsingArrayOnHost,

                                 T>;


 #ifdef __SYCL_USE_EXT_VECTOR_TYPE__


   template <typename Ty = DataT>

   explicit constexpr vec(const EnableIfNotUsingArrayOnDevice<Ty> &arg)

       : m_Data{DataType(vec_data<Ty>::get(arg))} {}


   template <typename Ty = DataT>

   typename std::enable_if_t<

       std::is_fundamental_v<vec_data_t<Ty>> ||

           detail::is_half_or_bf16_v<typename std::remove_const_t<Ty>>,

       vec &>

   operator=(const EnableIfNotUsingArrayOnDevice<Ty> &Rhs) {

     m_Data = (DataType)vec_data<Ty>::get(Rhs);

     return *this;

   }


   template <typename Ty = DataT>

   explicit constexpr vec(const EnableIfUsingArrayOnDevice<Ty> &arg)

       : vec{detail::RepeatValue<NumElements>(

                 static_cast<vec_data_t<DataT>>(arg)),

             std::make_index_sequence<NumElements>()} {}


   template <typename Ty = DataT>

   typename std::enable_if_t<

       std::is_fundamental_v<vec_data_t<Ty>> ||

           detail::is_half_or_bf16_v<typename std::remove_const_t<Ty>>,

       vec &>

   operator=(const EnableIfUsingArrayOnDevice<Ty> &Rhs) {

     for (int i = 0; i < NumElements; ++i) {

       setValue(i, Rhs);

     }

     return *this;

   }

 #else  // __SYCL_USE_EXT_VECTOR_TYPE__

   explicit constexpr vec(const DataT &arg)

       : vec{detail::RepeatValue<NumElements>(

                 static_cast<vec_data_t<DataT>>(arg)),

             std::make_index_sequence<NumElements>()} {}


   template <typename Ty = DataT>

   typename std::enable_if_t<

       std::is_fundamental_v<vec_data_t<Ty>> ||

           detail::is_half_or_bf16_v<typename std::remove_const_t<Ty>>,

       vec &>

   operator=(const DataT &Rhs) {

     for (int i = 0; i < NumElements; ++i) {

       setValue(i, Rhs);

     }

     return *this;

   }

 #endif // __SYCL_USE_EXT_VECTOR_TYPE__


 #ifdef __SYCL_USE_EXT_VECTOR_TYPE__

   // Optimized naive constructors with NumElements of DataT values.

   // We don't expect compilers to optimize vararg recursive functions well.


   // Helper type to make specific constructors available only for specific

   // number of elements.

   template <int IdxNum, typename T = void>

   using EnableIfMultipleElems = typename std::enable_if_t<

       std::is_convertible_v<T, DataT> && NumElements == IdxNum, DataT>;

   template <typename Ty = DataT>

   constexpr vec(const EnableIfMultipleElems<2, Ty> Arg0,

                 const EnableIfNotUsingArrayOnDevice<Ty> Arg1)

       : m_Data{vec_data<Ty>::get(Arg0), vec_data<Ty>::get(Arg1)} {}

   template <typename Ty = DataT>

   constexpr vec(const EnableIfMultipleElems<3, Ty> Arg0,

                 const EnableIfNotUsingArrayOnDevice<Ty> Arg1, const DataT Arg2)

       : m_Data{vec_data<Ty>::get(Arg0), vec_data<Ty>::get(Arg1),

                vec_data<Ty>::get(Arg2)} {}

   template <typename Ty = DataT>

   constexpr vec(const EnableIfMultipleElems<4, Ty> Arg0,

                 const EnableIfNotUsingArrayOnDevice<Ty> Arg1, const DataT Arg2,

                 const Ty Arg3)

       : m_Data{vec_data<Ty>::get(Arg0), vec_data<Ty>::get(Arg1),

                vec_data<Ty>::get(Arg2), vec_data<Ty>::get(Arg3)} {}

   template <typename Ty = DataT>

   constexpr vec(const EnableIfMultipleElems<8, Ty> Arg0,

                 const EnableIfNotUsingArrayOnDevice<Ty> Arg1, const DataT Arg2,

                 const DataT Arg3, const DataT Arg4, const DataT Arg5,

                 const DataT Arg6, const DataT Arg7)

       : m_Data{vec_data<Ty>::get(Arg0), vec_data<Ty>::get(Arg1),

                vec_data<Ty>::get(Arg2), vec_data<Ty>::get(Arg3),

                vec_data<Ty>::get(Arg4), vec_data<Ty>::get(Arg5),

                vec_data<Ty>::get(Arg6), vec_data<Ty>::get(Arg7)} {}

   template <typename Ty = DataT>

   constexpr vec(const EnableIfMultipleElems<16, Ty> Arg0,

                 const EnableIfNotUsingArrayOnDevice<Ty> Arg1, const DataT Arg2,

                 const DataT Arg3, const DataT Arg4, const DataT Arg5,

                 const DataT Arg6, const DataT Arg7, const DataT Arg8,

                 const DataT Arg9, const DataT ArgA, const DataT ArgB,

                 const DataT ArgC, const DataT ArgD, const DataT ArgE,

                 const DataT ArgF)

       : m_Data{vec_data<Ty>::get(Arg0), vec_data<Ty>::get(Arg1),

                vec_data<Ty>::get(Arg2), vec_data<Ty>::get(Arg3),

                vec_data<Ty>::get(Arg4), vec_data<Ty>::get(Arg5),

                vec_data<Ty>::get(Arg6), vec_data<Ty>::get(Arg7),

                vec_data<Ty>::get(Arg8), vec_data<Ty>::get(Arg9),

                vec_data<Ty>::get(ArgA), vec_data<Ty>::get(ArgB),

                vec_data<Ty>::get(ArgC), vec_data<Ty>::get(ArgD),

                vec_data<Ty>::get(ArgE), vec_data<Ty>::get(ArgF)} {}

 #endif // __SYCL_USE_EXT_VECTOR_TYPE__


   // Constructor from values of base type or vec of base type. Checks that

   // base types are match and that the NumElements == sum of lengths of args.

   template <typename... argTN, typename = EnableIfSuitableTypes<argTN...>,

             typename = EnableIfSuitableNumElements<argTN...>>

   constexpr vec(const argTN &...args)

       : vec{VecArgArrayCreator<vec_data_t<DataT>, argTN...>::Create(args...),

             std::make_index_sequence<NumElements>()} {}


 #ifdef __SYCL_DEVICE_ONLY__

   template <typename vector_t_ = vector_t,

             typename =

                 typename std::enable_if_t<std::is_same_v<vector_t_, vector_t> &&

                                           !std::is_same_v<vector_t_, DataT>>>

   constexpr vec(vector_t openclVector) {

     if constexpr (!IsUsingArrayOnDevice) {

       m_Data = openclVector;

     } else {

       m_Data = bit_cast<DataType>(openclVector);

     }

   }


   operator vector_t() const {

     if constexpr (!IsUsingArrayOnDevice) {

       return m_Data;

     } else {

       auto ptr = bit_cast<const vector_t *>((&m_Data)->data());

       return *ptr;

     }

   }

 #endif // __SYCL_DEVICE_ONLY__


   // Available only when: NumElements == 1

   template <int N = NumElements>

   operator typename std::enable_if_t<N == 1, DataT>() const {

     return vec_data<DataT>::get(m_Data);

   }


   __SYCL2020_DEPRECATED("get_count() is deprecated, please use size() instead")

   static constexpr size_t get_count() { return size(); }

   static constexpr size_t size() noexcept { return NumElements; }

   __SYCL2020_DEPRECATED(

       "get_size() is deprecated, please use byte_size() instead")

   static constexpr size_t get_size() { return byte_size(); }

   static constexpr size_t byte_size() noexcept { return sizeof(m_Data); }


   // convertImpl can't be called with the same From and To types and therefore

   // we need this version of convert which is mostly no-op.

   template <typename convertT,

             rounding_mode roundingMode = rounding_mode::automatic>

   std::enable_if_t<

       std::is_same_v<vec_data_t<DataT>, vec_data_t<convertT>> ||

           std::is_same_v<detail::ConvertToOpenCLType_t<vec_data_t<DataT>>,

                          detail::ConvertToOpenCLType_t<vec_data_t<convertT>>>,

       vec<convertT, NumElements>>

   convert() const {

     static_assert(std::is_integral_v<vec_data_t<convertT>> ||

                       detail::is_floating_point<convertT>::value,

                   "Unsupported convertT");

     if constexpr (!std::is_same_v<DataT, convertT>) {

       // Dummy conversion for cases like vec<signed char> -> vec<char>

       vec<convertT, NumElements> Result;

       for (size_t I = 0; I < NumElements; ++I)

         Result.setValue(I, static_cast<convertT>(getValue(I)));


       return Result;

     } else {

       // No conversion necessary

       return *this;

     }

   }


   template <typename convertT,

             rounding_mode roundingMode = rounding_mode::automatic>

   std::enable_if_t<

       !std::is_same_v<vec_data_t<DataT>, vec_data_t<convertT>> &&

           !std::is_same_v<detail::ConvertToOpenCLType_t<vec_data_t<DataT>>,

                           detail::ConvertToOpenCLType_t<vec_data_t<convertT>>>,

       vec<convertT, NumElements>>

   convert() const {

     static_assert(std::is_integral_v<vec_data_t<convertT>> ||

                       detail::is_floating_point<convertT>::value,

                   "Unsupported convertT");

     using T = vec_data_t<DataT>;

     using R = vec_data_t<convertT>;

     using OpenCLT = detail::ConvertToOpenCLType_t<T>;

     using OpenCLR = detail::ConvertToOpenCLType_t<R>;

     vec<convertT, NumElements> Result;


 #if defined(__SYCL_DEVICE_ONLY__)

     using OpenCLVecT = OpenCLT __attribute__((ext_vector_type(NumElements)));

     using OpenCLVecR = OpenCLR __attribute__((ext_vector_type(NumElements)));

     // Whole vector conversion can only be done, if:

     constexpr bool canUseNativeVectorConvert =

 #ifdef __NVPTX__

         // - we are not on CUDA, see intel/llvm#11840

         false &&

 #endif

         // - both vectors are represented using native vector types;

         NativeVec && vec<convertT, NumElements>::NativeVec &&

         // - vec storage has an equivalent OpenCL native vector it is implicitly

         //   convertible to. There are some corner cases where it is not the

         //   case with char, long and long long types.

         std::is_convertible_v<decltype(m_Data), OpenCLVecT> &&

         std::is_convertible_v<decltype(Result.m_Data), OpenCLVecR> &&

         // - it is not a signed to unsigned (or vice versa) conversion

         //   see comments within 'convertImpl' for more details;

         !detail::is_sint_to_from_uint<T, R>::value &&

         // - destination type is not bool. bool is stored as integer under the

         //   hood and therefore conversion to bool looks like conversion between

         //   two integer types. Since bit pattern for true and false is not

         //   defined, there is no guarantee that integer conversion yields

         //   right results here;

         !std::is_same_v<convertT, bool>;

     if constexpr (canUseNativeVectorConvert) {

       Result.m_Data = detail::convertImpl<T, R, roundingMode, NumElements,

                                           OpenCLVecT, OpenCLVecR>(m_Data);

     } else

 #endif // defined(__SYCL_DEVICE_ONLY__)

     {

       // Otherwise, we fallback to per-element conversion:

       for (size_t I = 0; I < NumElements; ++I) {

         Result.setValue(

             I, vec_data<convertT>::get(

                    detail::convertImpl<T, R, roundingMode, 1, OpenCLT, OpenCLR>(

                        vec_data<DataT>::get(getValue(I)))));

       }

     }


     return Result;

   }


   template <typename asT> asT as() const {

     static_assert((sizeof(*this) == sizeof(asT)),

                   "The new SYCL vec type must have the same storage size in "

                   "bytes as this SYCL vec");

     static_assert(

         detail::is_contained<asT, detail::gtl::vector_basic_list>::value ||

             detail::is_contained<asT, detail::gtl::vector_bool_list>::value,

         "asT must be SYCL vec of a different element type and "

         "number of elements specified by asT");

     asT Result;

     detail::memcpy(&Result.m_Data, &m_Data, sizeof(decltype(Result.m_Data)));

     return Result;

   }


   template <int... SwizzleIndexes> Swizzle<SwizzleIndexes...> swizzle() {

     return this;

   }


   template <int... SwizzleIndexes>

   ConstSwizzle<SwizzleIndexes...> swizzle() const {

     return this;

   }


   // ext_vector_type is used as an underlying type for sycl::vec on device.

   // The problem is that for clang vector types the return of operator[] is a

   // temporary and not a reference to the element in the vector. In practice

   // reinterpret_cast<DataT *>(&m_Data)[i]; is working. According to

   // http://llvm.org/docs/GetElementPtr.html#can-gep-index-into-vector-elements

   // this is not disallowed now. But could probably be disallowed in the future.

   // That is why tests are added to check that behavior of the compiler has

   // not changed.

   //

   // Implement operator [] in the same way for host and device.

   // TODO: change host side implementation when underlying type for host side

   // will be changed to std::array.

   // NOTE: aliasing the incompatible types of bfloat16 may lead to problems if

   // aggressively optimized. Specializing with noinline to avoid as workaround.


   template <typename T = DataT>

   typename std::enable_if_t<!std::is_same_v<T, sycl::ext::oneapi::bfloat16>,

                             const DataT &>

   operator[](int i) const {

     return reinterpret_cast<const DataT *>(&m_Data)[i];

   }


   template <typename T = DataT>

   typename std::enable_if_t<!std::is_same_v<T, sycl::ext::oneapi::bfloat16>,

                             DataT &>

   operator[](int i) {

     return reinterpret_cast<DataT *>(&m_Data)[i];

   }


 #ifdef _MSC_VER

 #define __SYCL_NOINLINE_BF16 __declspec(noinline)

 #else

 #define __SYCL_NOINLINE_BF16 __attribute__((noinline))

 #endif


   template <typename T = DataT>

   __SYCL_NOINLINE_BF16

       typename std::enable_if_t<std::is_same_v<T, sycl::ext::oneapi::bfloat16>,

                                 const DataT &>

       operator[](int i) const {

     return reinterpret_cast<const DataT *>(&m_Data)[i];

   }


   template <typename T = DataT>

   __SYCL_NOINLINE_BF16

       typename std::enable_if_t<std::is_same_v<T, sycl::ext::oneapi::bfloat16>,

                                 DataT &>

       operator[](int i) {

     return reinterpret_cast<DataT *>(&m_Data)[i];

   }


 #undef __SYCL_NOINLINE_BF16


   // Begin hi/lo, even/odd, xyzw, and rgba swizzles.

 private:

   // Indexer used in the swizzles.def

   // Currently it is defined as a template struct. Replacing it with a constexpr

   // function would activate a bug in MSVC that is fixed only in v19.20.

   // Until then MSVC does not recognize such constexpr functions as const and

   // thus does not let using them in template parameters inside swizzle.def.

   template <int Index> struct Indexer {

     static constexpr int value = Index;

   };


 public:

 #ifdef __SYCL_ACCESS_RETURN

 #error "Undefine __SYCL_ACCESS_RETURN macro"

 #endif

 #define __SYCL_ACCESS_RETURN this

 #include "swizzles.def"

 #undef __SYCL_ACCESS_RETURN

   // End of hi/lo, even/odd, xyzw, and rgba swizzles.


   template <access::address_space Space, access::decorated DecorateAddress>

   void load(size_t Offset, multi_ptr<const DataT, Space, DecorateAddress> Ptr) {

     for (int I = 0; I < NumElements; I++) {

       setValue(I, *multi_ptr<const DataT, Space, DecorateAddress>(

                       Ptr + Offset * NumElements + I));

     }

   }

   template <access::address_space Space, access::decorated DecorateAddress>

   void load(size_t Offset, multi_ptr<DataT, Space, DecorateAddress> Ptr) {

     multi_ptr<const DataT, Space, DecorateAddress> ConstPtr(Ptr);

     load(Offset, ConstPtr);

   }

   template <int Dimensions, access::mode Mode,

             access::placeholder IsPlaceholder, access::target Target,

             typename PropertyListT>

   void

   load(size_t Offset,

        accessor<DataT, Dimensions, Mode, Target, IsPlaceholder, PropertyListT>

            Acc) {

     multi_ptr<const DataT, detail::TargetToAS<Target>::AS,

               access::decorated::yes>

         MultiPtr(Acc);

     load(Offset, MultiPtr);

   }

   template <access::address_space Space, access::decorated DecorateAddress>

   void store(size_t Offset,

              multi_ptr<DataT, Space, DecorateAddress> Ptr) const {

     for (int I = 0; I < NumElements; I++) {

       *multi_ptr<DataT, Space, DecorateAddress>(Ptr + Offset * NumElements +

                                                 I) = getValue(I);

     }

   }

   template <int Dimensions, access::mode Mode,

             access::placeholder IsPlaceholder, access::target Target,

             typename PropertyListT>

   void

   store(size_t Offset,

         accessor<DataT, Dimensions, Mode, Target, IsPlaceholder, PropertyListT>

             Acc) {

     multi_ptr<DataT, detail::TargetToAS<Target>::AS, access::decorated::yes>

         MultiPtr(Acc);

     store(Offset, MultiPtr);

   }


   void ConvertToDataT() {

     for (size_t i = 0; i < NumElements; ++i) {

       DataT tmp = getValue(i);

       setValue(i, tmp);

     }

   }


 #ifdef __SYCL_BINOP

 #error "Undefine __SYCL_BINOP macro"

 #endif


 #ifdef __SYCL_USE_EXT_VECTOR_TYPE__

 #define __SYCL_BINOP(BINOP, OPASSIGN, CONVERT)                                 \

   friend vec operator BINOP(const vec &Lhs, const vec &Rhs) {                  \

     vec Ret;                                                                   \

     if constexpr (IsUsingArrayOnDevice) {                                      \

       for (size_t I = 0; I < NumElements; ++I) {                               \

         Ret.setValue(I, (Lhs.getValue(I) BINOP Rhs.getValue(I)));              \

       }                                                                        \

     } else {                                                                   \

       Ret.m_Data = Lhs.m_Data BINOP Rhs.m_Data;                                \

       if constexpr (std::is_same_v<Type, bool> && CONVERT) {                   \

         Ret.ConvertToDataT();                                                  \

       }                                                                        \

     }                                                                          \

     return Ret;                                                                \

   }                                                                            \

   friend vec operator BINOP(const vec &Lhs, const DataT &Rhs) {                \

     return Lhs BINOP vec(Rhs);                                                 \

   }                                                                            \

   friend vec operator BINOP(const DataT &Lhs, const vec &Rhs) {                \

     return vec(Lhs) BINOP Rhs;                                                 \

   }                                                                            \

   friend vec &operator OPASSIGN(vec & Lhs, const vec & Rhs) {                  \

     Lhs = Lhs BINOP Rhs;                                                       \

     return Lhs;                                                                \

   }                                                                            \

   template <int Num = NumElements>                                             \

   friend typename std::enable_if_t<Num != 1, vec &> operator OPASSIGN(         \

       vec & Lhs, const DataT & Rhs) {                                          \

     Lhs = Lhs BINOP vec(Rhs);                                                  \

     return Lhs;                                                                \

   }


 #else // __SYCL_USE_EXT_VECTOR_TYPE__


 #define __SYCL_BINOP(BINOP, OPASSIGN, CONVERT)                                 \

   friend vec operator BINOP(const vec &Lhs, const vec &Rhs) {                  \

     vec Ret{};                                                                 \

     if constexpr (NativeVec)                                                   \

       Ret.m_Data = Lhs.m_Data BINOP Rhs.m_Data;                                \

     else                                                                       \

       for (size_t I = 0; I < NumElements; ++I)                                 \

         Ret.setValue(I, (DataT)(vec_data<DataT>::get(Lhs.getValue(             \

                             I)) BINOP vec_data<DataT>::get(Rhs.getValue(I)))); \

     return Ret;                                                                \

   }                                                                            \

   friend vec operator BINOP(const vec &Lhs, const DataT &Rhs) {                \

     return Lhs BINOP vec(Rhs);                                                 \

   }                                                                            \

   friend vec operator BINOP(const DataT &Lhs, const vec &Rhs) {                \

     return vec(Lhs) BINOP Rhs;                                                 \

   }                                                                            \

   friend vec &operator OPASSIGN(vec & Lhs, const vec & Rhs) {                  \

     Lhs = Lhs BINOP Rhs;                                                       \

     return Lhs;                                                                \

   }                                                                            \

   template <int Num = NumElements>                                             \

   friend typename std::enable_if_t<Num != 1, vec &> operator OPASSIGN(         \

       vec & Lhs, const DataT & Rhs) {                                          \

     Lhs = Lhs BINOP vec(Rhs);                                                  \

     return Lhs;                                                                \

   }


 #endif // __SYCL_USE_EXT_VECTOR_TYPE__


   __SYCL_BINOP(+, +=, true)

   __SYCL_BINOP(-, -=, true)

   __SYCL_BINOP(*, *=, false)

   __SYCL_BINOP(/, /=, false)


   // TODO: The following OPs are available only when: DataT != cl_float &&

   // DataT != cl_double && DataT != cl_half

   __SYCL_BINOP(%, %=, false)

   __SYCL_BINOP(|, |=, false)

   __SYCL_BINOP(&, &=, false)

   __SYCL_BINOP(^, ^=, false)

   __SYCL_BINOP(>>, >>=, false)

   __SYCL_BINOP(<<, <<=, true)

 #undef __SYCL_BINOP

 #undef __SYCL_BINOP_HELP


   // Note: vec<>/SwizzleOp logical value is 0/-1 logic, as opposed to 0/1 logic.

   // As far as CTS validation is concerned, 0/-1 logic also applies when

   // NumElements is equal to one, which is somewhat inconsistent with being

   // transparent with scalar data.

   // TODO: Determine if vec<, NumElements=1> is needed at all, remove this

   // inconsistency if not by disallowing one-element vectors (as in OpenCL)


 #ifdef __SYCL_RELLOGOP

 #error "Undefine __SYCL_RELLOGOP macro"

 #endif

 // Use __SYCL_DEVICE_ONLY__ macro because cast to OpenCL vector type is defined

 // by SYCL device compiler only.

 #ifdef __SYCL_DEVICE_ONLY__

 #define __SYCL_RELLOGOP(RELLOGOP)                                              \

   friend vec<rel_t, NumElements> operator RELLOGOP(const vec & Lhs,            \

                                                    const vec & Rhs) {          \

     vec<rel_t, NumElements> Ret{};                                             \

     /* This special case is needed since there are no standard operator||   */ \

     /* or operator&& functions for std::array.                              */ \

     if constexpr (IsUsingArrayOnDevice &&                                      \

                   (std::string_view(#RELLOGOP) == "||" ||                      \

                    std::string_view(#RELLOGOP) == "&&")) {                     \

       for (size_t I = 0; I < NumElements; ++I) {                               \

         /* We cannot use SetValue here as the operator is not a friend of*/    \

         /* Ret on Windows. */                                                  \

         Ret[I] = static_cast<rel_t>(-(vec_data<DataT>::get(                    \

             Lhs.getValue(I)) RELLOGOP vec_data<DataT>::get(Rhs.getValue(I)))); \

       }                                                                        \

     } else {                                                                   \

       Ret = vec<rel_t, NumElements>(                                           \

           (typename vec<rel_t, NumElements>::vector_t)(                        \

               Lhs.m_Data RELLOGOP Rhs.m_Data));                                \

       if (NumElements == 1) /*Scalar 0/1 logic was applied, invert*/           \

         Ret *= -1;                                                             \

     }                                                                          \

     return Ret;                                                                \

   }                                                                            \

   friend vec<rel_t, NumElements> operator RELLOGOP(const vec & Lhs,            \

                                                    const DataT & Rhs) {        \

     return Lhs RELLOGOP vec(Rhs);                                              \

   }                                                                            \

   friend vec<rel_t, NumElements> operator RELLOGOP(const DataT & Lhs,          \

                                                    const vec & Rhs) {          \

     return vec(Lhs) RELLOGOP Rhs;                                              \

   }


 #else

 #define __SYCL_RELLOGOP(RELLOGOP)                                              \

   friend vec<rel_t, NumElements> operator RELLOGOP(const vec & Lhs,            \

                                                    const vec & Rhs) {          \

     vec<rel_t, NumElements> Ret{};                                             \

     for (size_t I = 0; I < NumElements; ++I) {                                 \

       /* We cannot use SetValue here as the operator is not a friend of*/      \

       /* Ret on Windows. */                                                    \

       Ret[I] = static_cast<rel_t>(-(vec_data<DataT>::get(                      \

           Lhs.getValue(I)) RELLOGOP vec_data<DataT>::get(Rhs.getValue(I))));   \

     }                                                                          \

     return Ret;                                                                \

   }                                                                            \

   friend vec<rel_t, NumElements> operator RELLOGOP(const vec & Lhs,            \

                                                    const DataT & Rhs) {        \

     return Lhs RELLOGOP vec(Rhs);                                              \

   }                                                                            \

   friend vec<rel_t, NumElements> operator RELLOGOP(const DataT & Lhs,          \

                                                    const vec & Rhs) {          \

     return vec(Lhs) RELLOGOP Rhs;                                              \

   }

 #endif


   __SYCL_RELLOGOP(==)

   __SYCL_RELLOGOP(!=)

   __SYCL_RELLOGOP(>)

   __SYCL_RELLOGOP(<)

   __SYCL_RELLOGOP(>=)

   __SYCL_RELLOGOP(<=)

   // TODO: limit to integral types.

   __SYCL_RELLOGOP(&&)

   __SYCL_RELLOGOP(||)

 #undef __SYCL_RELLOGOP


 #ifdef __SYCL_UOP

 #error "Undefine __SYCL_UOP macro"

 #endif

 #define __SYCL_UOP(UOP, OPASSIGN)                                              \

   friend vec &operator UOP(vec & Rhs) {                                        \

     Rhs OPASSIGN vec_data<DataT>::get(1);                                      \

     return Rhs;                                                                \

   }                                                                            \

   friend vec operator UOP(vec &Lhs, int) {                                     \

     vec Ret(Lhs);                                                              \

     Lhs OPASSIGN vec_data<DataT>::get(1);                                      \

     return Ret;                                                                \

   }


   __SYCL_UOP(++, +=)

   __SYCL_UOP(--, -=)

 #undef __SYCL_UOP


   // operator~() available only when: dataT != float && dataT != double

   // && dataT != half

   friend vec operator~(const vec &Rhs) {

     if constexpr (IsUsingArrayOnDevice || IsUsingArrayOnHost) {

       vec Ret{};

       for (size_t I = 0; I < NumElements; ++I) {

         Ret.setValue(I, ~Rhs.getValue(I));

       }

       return Ret;

     } else {

       vec Ret{(typename vec::DataType) ~Rhs.m_Data};

       if constexpr (std::is_same_v<Type, bool>) {

         Ret.ConvertToDataT();

       }

       return Ret;

     }

   }


   // operator!

   friend vec<detail::rel_t<DataT>, NumElements> operator!(const vec &Rhs) {

     if constexpr (IsUsingArrayOnDevice || IsUsingArrayOnHost) {

       vec Ret{};

       for (size_t I = 0; I < NumElements; ++I) {

 #if (!defined(_HAS_STD_BYTE) || _HAS_STD_BYTE != 0)

         // std::byte neither supports ! unary op or casting, so special handling

         // is needed. And, worse, Windows has a conflict with 'byte'.

         if constexpr (std::is_same_v<std::byte, DataT>) {

           Ret.setValue(I, std::byte{!vec_data<DataT>::get(Rhs.getValue(I))});

         } else

 #endif // (!defined(_HAS_STD_BYTE) || _HAS_STD_BYTE != 0)

         {

           Ret.setValue(I, !vec_data<DataT>::get(Rhs.getValue(I)));

         }

       }

       return Ret.template as<vec<detail::rel_t<DataT>, NumElements>>();

     } else {

       return vec{(typename vec<DataT, NumElements>::DataType) !Rhs.m_Data}

           .template as<vec<detail::rel_t<DataT>, NumElements>>();

     }

   }


   // operator +

   friend vec operator+(const vec &Lhs) {

     if constexpr (IsUsingArrayOnDevice || IsUsingArrayOnHost) {

       vec Ret{};

       for (size_t I = 0; I < NumElements; ++I)

         Ret.setValue(

             I, vec_data<DataT>::get(+vec_data<DataT>::get(Lhs.getValue(I))));

       return Ret;

     } else {

       return vec{+Lhs.m_Data};

     }

   }


   // operator -

   friend vec operator-(const vec &Lhs) {

     namespace oneapi = sycl::ext::oneapi;

     vec Ret{};

     if constexpr (IsBfloat16 && NumElements == 1) {

       oneapi::bfloat16 v = oneapi::detail::bitsToBfloat16(Lhs.m_Data);

       oneapi::bfloat16 w = -v;

       Ret.m_Data = oneapi::detail::bfloat16ToBits(w);

     } else if constexpr (IsBfloat16) {

       for (size_t I = 0; I < NumElements; I++) {

         oneapi::bfloat16 v = oneapi::detail::bitsToBfloat16(Lhs.m_Data[I]);

         oneapi::bfloat16 w = -v;

         Ret.m_Data[I] = oneapi::detail::bfloat16ToBits(w);

       }

     } else if constexpr (IsUsingArrayOnDevice || IsUsingArrayOnHost) {

       for (size_t I = 0; I < NumElements; ++I)

         Ret.setValue(

             I, vec_data<DataT>::get(-vec_data<DataT>::get(Lhs.getValue(I))));

       return Ret;

     } else {

       Ret = vec{-Lhs.m_Data};

       if constexpr (std::is_same_v<Type, bool>) {

         Ret.ConvertToDataT();

       }

       return Ret;

     }

   }


   // OP is: &&, ||

   // vec<RET, NumElements> operatorOP(const vec<DataT, NumElements> &Rhs) const;

   // vec<RET, NumElements> operatorOP(const DataT &Rhs) const;


   // OP is: ==, !=, <, >, <=, >=

   // vec<RET, NumElements> operatorOP(const vec<DataT, NumElements> &Rhs) const;

   // vec<RET, NumElements> operatorOP(const DataT &Rhs) const;

 private:

   // Generic method that execute "Operation" on underlying values.


 #ifdef __SYCL_USE_EXT_VECTOR_TYPE__

   template <template <typename> class Operation,

             typename Ty = vec<DataT, NumElements>>

   vec<DataT, NumElements>

   operatorHelper(const EnableIfNotUsingArrayOnDevice<Ty> &Rhs) const {

     vec<DataT, NumElements> Result;

     Operation<DataType> Op;

     Result.m_Data = Op(m_Data, Rhs.m_Data);

     return Result;

   }


   template <template <typename> class Operation,

             typename Ty = vec<DataT, NumElements>>

   vec<DataT, NumElements>

   operatorHelper(const EnableIfUsingArrayOnDevice<Ty> &Rhs) const {

     vec<DataT, NumElements> Result;

     Operation<DataT> Op;

     for (size_t I = 0; I < NumElements; ++I) {

       Result.setValue(I, Op(Rhs.getValue(I), getValue(I)));

     }

     return Result;

   }

 #else  // __SYCL_USE_EXT_VECTOR_TYPE__

   template <template <typename> class Operation>

   vec<DataT, NumElements>

   operatorHelper(const vec<DataT, NumElements> &Rhs) const {

     vec<DataT, NumElements> Result;

     Operation<DataT> Op;

     for (size_t I = 0; I < NumElements; ++I) {

       Result.setValue(I, Op(Rhs.getValue(I), getValue(I)));

     }

     return Result;

   }

 #endif // __SYCL_USE_EXT_VECTOR_TYPE__


   // setValue and getValue should be able to operate on different underlying

   // types: enum cl_float#N , builtin vector float#N, builtin type float.

   // These versions are for N > 1.

 #ifdef __SYCL_USE_EXT_VECTOR_TYPE__

   template <int Num = NumElements, typename Ty = int,

             typename = typename std::enable_if_t<1 != Num>>

   constexpr void setValue(EnableIfNotHostHalf<Ty> Index, const DataT &Value,

                           int) {

     m_Data[Index] = vec_data<DataT>::set(Value);

   }


   template <int Num = NumElements, typename Ty = int,

             typename = typename std::enable_if_t<1 != Num>>

   constexpr DataT getValue(EnableIfNotHostHalf<Ty> Index, int) const {

     return vec_data<DataT>::get(m_Data[Index]);

   }


   template <int Num = NumElements, typename Ty = int,

             typename = typename std::enable_if_t<1 != Num>>

   constexpr void setValue(EnableIfHostHalf<Ty> Index, const DataT &Value, int) {

     m_Data.s[Index] = vec_data<DataT>::set(Value);

   }


   template <int Num = NumElements, typename Ty = int,

             typename = typename std::enable_if_t<1 != Num>>

   constexpr DataT getValue(EnableIfHostHalf<Ty> Index, int) const {

     return vec_data<DataT>::get(m_Data.s[Index]);

   }

 #else  // __SYCL_USE_EXT_VECTOR_TYPE__

   template <int Num = NumElements,

             typename = typename std::enable_if_t<1 != Num>>

   constexpr void setValue(int Index, const DataT &Value, int) {

     m_Data[Index] = vec_data<DataT>::set(Value);

   }


   template <int Num = NumElements,

             typename = typename std::enable_if_t<1 != Num>>

   constexpr DataT getValue(int Index, int) const {

     return vec_data<DataT>::get(m_Data[Index]);

   }

 #endif // __SYCL_USE_EXT_VECTOR_TYPE__


   // N==1 versions, used by host and device. Shouldn't trailing type be int?

   template <int Num = NumElements,

             typename = typename std::enable_if_t<1 == Num>>

   constexpr void setValue(int, const DataT &Value, float) {

     m_Data = vec_data<DataT>::set(Value);

   }


   template <int Num = NumElements,

             typename = typename std::enable_if_t<1 == Num>>

   DataT getValue(int, float) const {

     return vec_data<DataT>::get(m_Data);

   }


   // setValue and getValue.

   // The "api" functions used by BINOP etc.  These versions just dispatch

   // using additional int or float arg to disambiguate vec<1> vs. vec<N>

   // Special proxies as specialization is not allowed in class scope.

   constexpr void setValue(int Index, const DataT &Value) {

     if (NumElements == 1)

       setValue(Index, Value, 0);

     else

       setValue(Index, Value, 0.f);

   }


   DataT getValue(int Index) const {

     return (NumElements == 1) ? getValue(Index, 0) : getValue(Index, 0.f);

   }


   // fields


   // Alignment is the same as size, to a maximum size of 64.

   // detail::vector_alignment will return that value.

   alignas(detail::vector_alignment<DataT, NumElements>::value) DataType m_Data;


   // friends

   template <typename T1, typename T2, typename T3, template <typename> class T4,

             int... T5>

   friend class detail::SwizzleOp;

   template <typename T1, int T2> friend class vec;

 };


 #ifdef __cpp_deduction_guides

 // all compilers supporting deduction guides also support fold expressions

 template <class T, class... U,

           class = std::enable_if_t<(std::is_same_v<T, U> && ...)>>

 vec(T, U...) -> vec<T, sizeof...(U) + 1>;

 #endif


 namespace detail {


 // Special type for working SwizzleOp with scalars, stores a scalar and gives

 // the scalar at any index. Provides interface is compatible with SwizzleOp

 // operations

 template <typename T> class GetScalarOp {

 public:

   using DataT = T;

   GetScalarOp(DataT Data) : m_Data(Data) {}

   DataT getValue(size_t) const { return m_Data; }


 private:

   DataT m_Data;

 };


 template <typename T> struct EqualTo {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs == Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct NotEqualTo {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs != Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct GreaterEqualTo {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs >= Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct LessEqualTo {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs <= Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct GreaterThan {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs > Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct LessThan {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs < Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct LogicalAnd {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs && Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct LogicalOr {

   constexpr rel_t<T> operator()(const T &Lhs, const T &Rhs) const {

     return (Lhs || Rhs) ? -1 : 0;

   }

 };


 template <typename T> struct RShift {

   constexpr T operator()(const T &Lhs, const T &Rhs) const {

     return Lhs >> Rhs;

   }

 };


 template <typename T> struct LShift {

   constexpr T operator()(const T &Lhs, const T &Rhs) const {

     return Lhs << Rhs;

   }

 };


 // SwizzleOP represents expression templates that operate on vec.

 // Actual computation performed on conversion or assignment operators.

 template <typename VecT, typename OperationLeftT, typename OperationRightT,

           template <typename> class OperationCurrentT, int... Indexes>

 class SwizzleOp {

   using DataT = typename VecT::element_type;

   // Certain operators return a vector with a different element type. Also, the

   // left and right operand types may differ. CommonDataT selects a result type

   // based on these types to ensure that the result value can be represented.

   //

   // Example 1:

   //   sycl::vec<unsigned char, 4> vec{...};

   //   auto result = 300u + vec.x();

   //

   // CommonDataT is std::common_type_t<OperationLeftT, OperationRightT> since

   // it's larger than unsigned char.

   //

   // Example 2:

   //   sycl::vec<bool, 1> vec{...};

   //   auto result = vec.template swizzle<sycl::elem::s0>() && vec;

   //

   // CommonDataT is DataT since operator&& returns a vector with element type

   // int8_t, which is larger than bool.

   //

   // Example 3:

   //   sycl::vec<std::byte, 4> vec{...}; auto swlo = vec.lo();

   //   auto result = swlo == swlo;

   //

   // CommonDataT is DataT since operator== returns a vector with element type

   // int8_t, which is the same size as std::byte. std::common_type_t<DataT, ...>

   // can't be used here since there's no type that int8_t and std::byte can both

   // be implicitly converted to.

   using OpLeftDataT = typename OperationLeftT::DataT;

   using OpRightDataT = typename OperationRightT::DataT;

   using CommonDataT = std::conditional_t<

       sizeof(DataT) >= sizeof(std::common_type_t<OpLeftDataT, OpRightDataT>),

       DataT, std::common_type_t<OpLeftDataT, OpRightDataT>>;

   static constexpr int getNumElements() { return sizeof...(Indexes); }


   using rel_t = detail::rel_t<DataT>;

   using vec_t = vec<DataT, sizeof...(Indexes)>;

   using vec_rel_t = vec<rel_t, sizeof...(Indexes)>;


   template <typename OperationRightT_,

             template <typename> class OperationCurrentT_, int... Idx_>

   using NewLHOp = SwizzleOp<VecT,

                             SwizzleOp<VecT, OperationLeftT, OperationRightT,

                                       OperationCurrentT, Indexes...>,

                             OperationRightT_, OperationCurrentT_, Idx_...>;


   template <typename OperationRightT_,

             template <typename> class OperationCurrentT_, int... Idx_>

   using NewRelOp = SwizzleOp<vec<rel_t, VecT::getNumElements()>,

                              SwizzleOp<VecT, OperationLeftT, OperationRightT,

                                        OperationCurrentT, Indexes...>,

                              OperationRightT_, OperationCurrentT_, Idx_...>;


   template <typename OperationLeftT_,

             template <typename> class OperationCurrentT_, int... Idx_>

   using NewRHOp = SwizzleOp<VecT, OperationLeftT_,

                             SwizzleOp<VecT, OperationLeftT, OperationRightT,

                                       OperationCurrentT, Indexes...>,

                             OperationCurrentT_, Idx_...>;


   template <int IdxNum, typename T = void>

   using EnableIfOneIndex = typename std::enable_if_t<

       1 == IdxNum && SwizzleOp::getNumElements() == IdxNum, T>;


   template <int IdxNum, typename T = void>

   using EnableIfMultipleIndexes = typename std::enable_if_t<

       1 != IdxNum && SwizzleOp::getNumElements() == IdxNum, T>;


   template <typename T>

   using EnableIfScalarType = typename std::enable_if_t<

       std::is_convertible_v<DataT, T> &&

       (std::is_fundamental_v<vec_data_t<T>> ||

        detail::is_half_or_bf16_v<typename std::remove_const_t<T>>)>;


   template <typename T>

   using EnableIfNoScalarType = typename std::enable_if_t<

       !std::is_convertible_v<DataT, T> ||

       !(std::is_fundamental_v<vec_data_t<T>> ||

         detail::is_half_or_bf16_v<typename std::remove_const_t<T>>)>;


   template <int... Indices>

   using Swizzle =

       SwizzleOp<VecT, GetOp<DataT>, GetOp<DataT>, GetOp, Indices...>;


   template <int... Indices>

   using ConstSwizzle =

       SwizzleOp<const VecT, GetOp<DataT>, GetOp<DataT>, GetOp, Indices...>;


 public:

   using element_type = DataT;

   using value_type = DataT;


 #ifdef __SYCL_DEVICE_ONLY__

   using vector_t = typename vec_t::vector_t;

 #endif // __SYCL_DEVICE_ONLY__


   const DataT &operator[](int i) const {

     std::array<int, getNumElements()> Idxs{Indexes...};

     return (*m_Vector)[Idxs[i]];

   }


   template <typename _T = VecT>

   std::enable_if_t<!std::is_const_v<_T>, DataT> &operator[](int i) {

     std::array<int, getNumElements()> Idxs{Indexes...};

     return (*m_Vector)[Idxs[i]];

   }


   __SYCL2020_DEPRECATED("get_count() is deprecated, please use size() instead")

   size_t get_count() const { return size(); }

   static constexpr size_t size() noexcept { return getNumElements(); }


   template <int Num = getNumElements()>

   __SYCL2020_DEPRECATED(

       "get_size() is deprecated, please use byte_size() instead")

   size_t get_size() const {

     return byte_size<Num>();

   }


   template <int Num = getNumElements()> size_t byte_size() const noexcept {

     return sizeof(DataT) * (Num == 3 ? 4 : Num);

   }


   template <typename T, int IdxNum = getNumElements(),

             typename = EnableIfOneIndex<IdxNum>,

             typename = EnableIfScalarType<T>>

   operator T() const {

     return getValue(0);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   friend NewRHOp<GetScalarOp<T>, std::multiplies, Indexes...>

   operator*(const T &Lhs, const SwizzleOp &Rhs) {

     return NewRHOp<GetScalarOp<T>, std::multiplies, Indexes...>(

         Rhs.m_Vector, GetScalarOp<T>(Lhs), Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   friend NewRHOp<GetScalarOp<T>, std::plus, Indexes...>

   operator+(const T &Lhs, const SwizzleOp &Rhs) {

     return NewRHOp<GetScalarOp<T>, std::plus, Indexes...>(

         Rhs.m_Vector, GetScalarOp<T>(Lhs), Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   friend NewRHOp<GetScalarOp<T>, std::divides, Indexes...>

   operator/(const T &Lhs, const SwizzleOp &Rhs) {

     return NewRHOp<GetScalarOp<T>, std::divides, Indexes...>(

         Rhs.m_Vector, GetScalarOp<T>(Lhs), Rhs);

   }


   // TODO: Check that Rhs arg is suitable.

 #ifdef __SYCL_OPASSIGN

 #error "Undefine __SYCL_OPASSIGN macro."

 #endif

 #define __SYCL_OPASSIGN(OPASSIGN, OP)                                          \

   SwizzleOp &operator OPASSIGN(const DataT & Rhs) {                            \

     operatorHelper<OP>(vec_t(Rhs));                                            \

     return *this;                                                              \

   }                                                                            \

   template <typename RhsOperation>                                             \

   SwizzleOp &operator OPASSIGN(const RhsOperation & Rhs) {                     \

     operatorHelper<OP>(Rhs);                                                   \

     return *this;                                                              \

   }


   __SYCL_OPASSIGN(+=, std::plus)

   __SYCL_OPASSIGN(-=, std::minus)

   __SYCL_OPASSIGN(*=, std::multiplies)

   __SYCL_OPASSIGN(/=, std::divides)

   __SYCL_OPASSIGN(%=, std::modulus)

   __SYCL_OPASSIGN(&=, std::bit_and)

   __SYCL_OPASSIGN(|=, std::bit_or)

   __SYCL_OPASSIGN(^=, std::bit_xor)

   __SYCL_OPASSIGN(>>=, RShift)

   __SYCL_OPASSIGN(<<=, LShift)

 #undef __SYCL_OPASSIGN


 #ifdef __SYCL_UOP

 #error "Undefine __SYCL_UOP macro"

 #endif

 #define __SYCL_UOP(UOP, OPASSIGN)                                              \

   SwizzleOp &operator UOP() {                                                  \

     *this OPASSIGN static_cast<DataT>(1);                                      \

     return *this;                                                              \

   }                                                                            \

   vec_t operator UOP(int) {                                                    \

     vec_t Ret = *this;                                                         \

     *this OPASSIGN static_cast<DataT>(1);                                      \

     return Ret;                                                                \

   }


   __SYCL_UOP(++, +=)

   __SYCL_UOP(--, -=)

 #undef __SYCL_UOP


   template <typename T = DataT>

   friend typename std::enable_if_t<

       std::is_same_v<T, DataT> && std::is_integral_v<vec_data_t<T>>, vec_t>

   operator~(const SwizzleOp &Rhs) {

     vec_t Tmp = Rhs;

     return ~Tmp;

   }


   friend vec_rel_t operator!(const SwizzleOp &Rhs) {

     vec_t Tmp = Rhs;

     return !Tmp;

   }


   friend vec_t operator+(const SwizzleOp &Rhs) {

     vec_t Tmp = Rhs;

     return +Tmp;

   }


   friend vec_t operator-(const SwizzleOp &Rhs) {

     vec_t Tmp = Rhs;

     return -Tmp;

   }


 // scalar BINOP vec<>

 // scalar BINOP SwizzleOp

 // vec<> BINOP SwizzleOp

 #ifdef __SYCL_BINOP

 #error "Undefine __SYCL_BINOP macro"

 #endif

 #define __SYCL_BINOP(BINOP)                                                    \

   friend vec_t operator BINOP(const DataT &Lhs, const SwizzleOp &Rhs) {        \

     vec_t Tmp = Rhs;                                                           \

     return Lhs BINOP Tmp;                                                      \

   }                                                                            \

   friend vec_t operator BINOP(const SwizzleOp &Lhs, const DataT &Rhs) {        \

     vec_t Tmp = Lhs;                                                           \

     return Tmp BINOP Rhs;                                                      \

   }                                                                            \

   friend vec_t operator BINOP(const vec_t &Lhs, const SwizzleOp &Rhs) {        \

     vec_t Tmp = Rhs;                                                           \

     return Lhs BINOP Tmp;                                                      \

   }                                                                            \

   friend vec_t operator BINOP(const SwizzleOp &Lhs, const vec_t &Rhs) {        \

     vec_t Tmp = Lhs;                                                           \

     return Tmp BINOP Rhs;                                                      \

   }


   __SYCL_BINOP(+)

   __SYCL_BINOP(-)

   __SYCL_BINOP(*)

   __SYCL_BINOP(/)

   __SYCL_BINOP(%)

   __SYCL_BINOP(&)

   __SYCL_BINOP(|)

   __SYCL_BINOP(^)

   __SYCL_BINOP(>>)

   __SYCL_BINOP(<<)

 #undef __SYCL_BINOP


 // scalar RELLOGOP vec<>

 // scalar RELLOGOP SwizzleOp

 // vec<> RELLOGOP SwizzleOp

 #ifdef __SYCL_RELLOGOP

 #error "Undefine __SYCL_RELLOGOP macro"

 #endif

 #define __SYCL_RELLOGOP(RELLOGOP)                                              \

   friend vec_rel_t operator RELLOGOP(const DataT &Lhs, const SwizzleOp &Rhs) { \

     vec_t Tmp = Rhs;                                                           \

     return Lhs RELLOGOP Tmp;                                                   \

   }                                                                            \

   friend vec_rel_t operator RELLOGOP(const SwizzleOp &Lhs, const DataT &Rhs) { \

     vec_t Tmp = Lhs;                                                           \

     return Tmp RELLOGOP Rhs;                                                   \

   }                                                                            \

   friend vec_rel_t operator RELLOGOP(const vec_t &Lhs, const SwizzleOp &Rhs) { \

     vec_t Tmp = Rhs;                                                           \

     return Lhs RELLOGOP Tmp;                                                   \

   }                                                                            \

   friend vec_rel_t operator RELLOGOP(const SwizzleOp &Lhs, const vec_t &Rhs) { \

     vec_t Tmp = Lhs;                                                           \

     return Tmp RELLOGOP Rhs;                                                   \

   }


   __SYCL_RELLOGOP(==)

   __SYCL_RELLOGOP(!=)

   __SYCL_RELLOGOP(>)

   __SYCL_RELLOGOP(<)

   __SYCL_RELLOGOP(>=)

   __SYCL_RELLOGOP(<=)

   // TODO: limit to integral types.

   __SYCL_RELLOGOP(&&)

   __SYCL_RELLOGOP(||)

 #undef __SYCL_RELLOGOP


   template <int IdxNum = getNumElements(),

             typename = EnableIfMultipleIndexes<IdxNum>>

   SwizzleOp &operator=(const vec<DataT, IdxNum> &Rhs) {

     std::array<int, IdxNum> Idxs{Indexes...};

     for (size_t I = 0; I < Idxs.size(); ++I) {

       m_Vector->setValue(Idxs[I], Rhs.getValue(I));

     }

     return *this;

   }


   template <int IdxNum = getNumElements(), typename = EnableIfOneIndex<IdxNum>>

   SwizzleOp &operator=(const DataT &Rhs) {

     std::array<int, IdxNum> Idxs{Indexes...};

     m_Vector->setValue(Idxs[0], Rhs);

     return *this;

   }


   template <int IdxNum = getNumElements(),

             EnableIfMultipleIndexes<IdxNum, bool> = true>

   SwizzleOp &operator=(const DataT &Rhs) {

     std::array<int, IdxNum> Idxs{Indexes...};

     for (auto Idx : Idxs) {

       m_Vector->setValue(Idx, Rhs);

     }

     return *this;

   }


   template <int IdxNum = getNumElements(), typename = EnableIfOneIndex<IdxNum>>

   SwizzleOp &operator=(DataT &&Rhs) {

     std::array<int, IdxNum> Idxs{Indexes...};

     m_Vector->setValue(Idxs[0], Rhs);

     return *this;

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::multiplies, Indexes...>

   operator*(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::multiplies, Indexes...>(

         m_Vector, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::multiplies, Indexes...>

   operator*(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::multiplies, Indexes...>(m_Vector, *this,

                                                               Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::plus, Indexes...> operator+(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::plus, Indexes...>(m_Vector, *this,

                                                           GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::plus, Indexes...>

   operator+(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::plus, Indexes...>(m_Vector, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::minus, Indexes...>

   operator-(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::minus, Indexes...>(m_Vector, *this,

                                                            GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::minus, Indexes...>

   operator-(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::minus, Indexes...>(m_Vector, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::divides, Indexes...>

   operator/(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::divides, Indexes...>(

         m_Vector, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::divides, Indexes...>

   operator/(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::divides, Indexes...>(m_Vector, *this,

                                                            Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::modulus, Indexes...>

   operator%(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::modulus, Indexes...>(

         m_Vector, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::modulus, Indexes...>

   operator%(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::modulus, Indexes...>(m_Vector, *this,

                                                            Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::bit_and, Indexes...>

   operator&(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::bit_and, Indexes...>(

         m_Vector, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::bit_and, Indexes...>

   operator&(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::bit_and, Indexes...>(m_Vector, *this,

                                                            Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::bit_or, Indexes...>

   operator|(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::bit_or, Indexes...>(

         m_Vector, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::bit_or, Indexes...>

   operator|(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::bit_or, Indexes...>(m_Vector, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, std::bit_xor, Indexes...>

   operator^(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, std::bit_xor, Indexes...>(

         m_Vector, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, std::bit_xor, Indexes...>

   operator^(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, std::bit_xor, Indexes...>(m_Vector, *this,

                                                            Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, RShift, Indexes...> operator>>(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, RShift, Indexes...>(m_Vector, *this,

                                                        GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, RShift, Indexes...>

   operator>>(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, RShift, Indexes...>(m_Vector, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewLHOp<GetScalarOp<T>, LShift, Indexes...> operator<<(const T &Rhs) const {

     return NewLHOp<GetScalarOp<T>, LShift, Indexes...>(m_Vector, *this,

                                                        GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewLHOp<RhsOperation, LShift, Indexes...>

   operator<<(const RhsOperation &Rhs) const {

     return NewLHOp<RhsOperation, LShift, Indexes...>(m_Vector, *this, Rhs);

   }


   template <

       typename T1, typename T2, typename T3, template <typename> class T4,

       int... T5,

       typename = typename std::enable_if_t<sizeof...(T5) == getNumElements()>>

   SwizzleOp &operator=(const SwizzleOp<T1, T2, T3, T4, T5...> &Rhs) {

     std::array<int, getNumElements()> Idxs{Indexes...};

     for (size_t I = 0; I < Idxs.size(); ++I) {

       m_Vector->setValue(Idxs[I], Rhs.getValue(I));

     }

     return *this;

   }


   template <

       typename T1, typename T2, typename T3, template <typename> class T4,

       int... T5,

       typename = typename std::enable_if_t<sizeof...(T5) == getNumElements()>>

   SwizzleOp &operator=(SwizzleOp<T1, T2, T3, T4, T5...> &&Rhs) {

     std::array<int, getNumElements()> Idxs{Indexes...};

     for (size_t I = 0; I < Idxs.size(); ++I) {

       m_Vector->setValue(Idxs[I], Rhs.getValue(I));

     }

     return *this;

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, EqualTo, Indexes...> operator==(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, EqualTo, Indexes...>(NULL, *this,

                                                          GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, EqualTo, Indexes...>

   operator==(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, EqualTo, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, NotEqualTo, Indexes...>

   operator!=(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, NotEqualTo, Indexes...>(

         NULL, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, NotEqualTo, Indexes...>

   operator!=(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, NotEqualTo, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, GreaterEqualTo, Indexes...>

   operator>=(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, GreaterEqualTo, Indexes...>(

         NULL, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, GreaterEqualTo, Indexes...>

   operator>=(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, GreaterEqualTo, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, LessEqualTo, Indexes...>

   operator<=(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, LessEqualTo, Indexes...>(

         NULL, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, LessEqualTo, Indexes...>

   operator<=(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, LessEqualTo, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, GreaterThan, Indexes...>

   operator>(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, GreaterThan, Indexes...>(

         NULL, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, GreaterThan, Indexes...>

   operator>(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, GreaterThan, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, LessThan, Indexes...> operator<(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, LessThan, Indexes...>(NULL, *this,

                                                           GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, LessThan, Indexes...>

   operator<(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, LessThan, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, LogicalAnd, Indexes...>

   operator&&(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, LogicalAnd, Indexes...>(

         NULL, *this, GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, LogicalAnd, Indexes...>

   operator&&(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, LogicalAnd, Indexes...>(NULL, *this, Rhs);

   }


   template <typename T, typename = EnableIfScalarType<T>>

   NewRelOp<GetScalarOp<T>, LogicalOr, Indexes...>

   operator||(const T &Rhs) const {

     return NewRelOp<GetScalarOp<T>, LogicalOr, Indexes...>(NULL, *this,

                                                            GetScalarOp<T>(Rhs));

   }


   template <typename RhsOperation,

             typename = EnableIfNoScalarType<RhsOperation>>

   NewRelOp<RhsOperation, LogicalOr, Indexes...>

   operator||(const RhsOperation &Rhs) const {

     return NewRelOp<RhsOperation, LogicalOr, Indexes...>(NULL, *this, Rhs);

   }


   // Begin hi/lo, even/odd, xyzw, and rgba swizzles.

 private:

   // Indexer used in the swizzles.def.

   // Currently it is defined as a template struct. Replacing it with a constexpr

   // function would activate a bug in MSVC that is fixed only in v19.20.

   // Until then MSVC does not recognize such constexpr functions as const and

   // thus does not let using them in template parameters inside swizzle.def.

   template <int Index> struct Indexer {

     static constexpr int IDXs[sizeof...(Indexes)] = {Indexes...};

     static constexpr int value = IDXs[Index >= getNumElements() ? 0 : Index];

   };


 public:

 #ifdef __SYCL_ACCESS_RETURN

 #error "Undefine __SYCL_ACCESS_RETURN macro"

 #endif

 #define __SYCL_ACCESS_RETURN m_Vector

 #include "swizzles.def"

 #undef __SYCL_ACCESS_RETURN

   // End of hi/lo, even/odd, xyzw, and rgba swizzles.


   // Leave store() interface to automatic conversion to vec<>.

   // Load to vec_t and then assign to swizzle.

   template <access::address_space Space, access::decorated DecorateAddress>

   void load(size_t offset, multi_ptr<DataT, Space, DecorateAddress> ptr) {

     vec_t Tmp;

     Tmp.template load(offset, ptr);

     *this = Tmp;

   }


   template <typename convertT, rounding_mode roundingMode>

   vec<convertT, sizeof...(Indexes)> convert() const {

     // First materialize the swizzle to vec_t and then apply convert() to it.

     vec_t Tmp = *this;

     return Tmp.template convert<convertT, roundingMode>();

   }


   template <typename asT> asT as() const {

     // First materialize the swizzle to vec_t and then apply as() to it.

     vec_t Tmp = *this;

     static_assert((sizeof(Tmp) == sizeof(asT)),

                   "The new SYCL vec type must have the same storage size in "

                   "bytes as this SYCL swizzled vec");

     static_assert(

         detail::is_contained<asT, detail::gtl::vector_basic_list>::value ||

             detail::is_contained<asT, detail::gtl::vector_bool_list>::value,

         "asT must be SYCL vec of a different element type and "

         "number of elements specified by asT");

     return Tmp.template as<asT>();

   }


 private:

   SwizzleOp(const SwizzleOp &Rhs)

       : m_Vector(Rhs.m_Vector), m_LeftOperation(Rhs.m_LeftOperation),

         m_RightOperation(Rhs.m_RightOperation) {}


   SwizzleOp(VecT *Vector, OperationLeftT LeftOperation,

             OperationRightT RightOperation)

       : m_Vector(Vector), m_LeftOperation(LeftOperation),

         m_RightOperation(RightOperation) {}


   SwizzleOp(VecT *Vector) : m_Vector(Vector) {}


   SwizzleOp(SwizzleOp &&Rhs)

       : m_Vector(Rhs.m_Vector), m_LeftOperation(std::move(Rhs.m_LeftOperation)),

         m_RightOperation(std::move(Rhs.m_RightOperation)) {}


   // Either performing CurrentOperation on results of left and right operands

   // or reading values from actual vector. Perform implicit type conversion when

   // the number of elements == 1


   template <int IdxNum = getNumElements()>

   CommonDataT getValue(EnableIfOneIndex<IdxNum, size_t> Index) const {

     if (std::is_same_v<OperationCurrentT<DataT>, GetOp<DataT>>) {

       std::array<int, getNumElements()> Idxs{Indexes...};

       return m_Vector->getValue(Idxs[Index]);

     }

     auto Op = OperationCurrentT<vec_data_t<CommonDataT>>();

     return vec_data<CommonDataT>::get(

         Op(vec_data<CommonDataT>::get(m_LeftOperation.getValue(Index)),

            vec_data<CommonDataT>::get(m_RightOperation.getValue(Index))));

   }


   template <int IdxNum = getNumElements()>

   DataT getValue(EnableIfMultipleIndexes<IdxNum, size_t> Index) const {

     if (std::is_same_v<OperationCurrentT<DataT>, GetOp<DataT>>) {

       std::array<int, getNumElements()> Idxs{Indexes...};

       return m_Vector->getValue(Idxs[Index]);

     }

     auto Op = OperationCurrentT<vec_data_t<DataT>>();

     return vec_data<DataT>::get(

         Op(vec_data<DataT>::get(m_LeftOperation.getValue(Index)),

            vec_data<DataT>::get(m_RightOperation.getValue(Index))));

   }


   template <template <typename> class Operation, typename RhsOperation>

   void operatorHelper(const RhsOperation &Rhs) {

     Operation<vec_data_t<DataT>> Op;

     std::array<int, getNumElements()> Idxs{Indexes...};

     for (size_t I = 0; I < Idxs.size(); ++I) {

       DataT Res = vec_data<DataT>::get(

           Op(vec_data<DataT>::get(m_Vector->getValue(Idxs[I])),

              vec_data<DataT>::get(Rhs.getValue(I))));

       m_Vector->setValue(Idxs[I], Res);

     }

   }


   // fields

   VecT *m_Vector;


   OperationLeftT m_LeftOperation;

   OperationRightT m_RightOperation;


   // friends

   template <typename T1, int T2> friend class sycl::vec;


   template <typename T1, typename T2, typename T3, template <typename> class T4,

             int... T5>

   friend class SwizzleOp;

 };

 } // namespace detail

 } // namespace _V1

 } // namespace sycl

access.hpp

aliases.hpp

bfloat16.hpp

sycl::_V1::detail::GetOp
Definition: vector.hpp:178

sycl::_V1::detail::GetOp::DataT
T DataT
Definition: vector.hpp:180

sycl::_V1::detail::GetOp::operator()
DataT operator()(DataT, DataT)
Definition: vector.hpp:182

sycl::_V1::detail::GetOp::getValue
DataT getValue(size_t) const
Definition: vector.hpp:181

sycl::_V1::detail::half_impl::half
Definition: half_type.hpp:276

sycl::_V1::ext::oneapi::bfloat16
Definition: bfloat16.hpp:51

sycl::vec
class sycl::vec ///////////////////////// Provides a cross-patform vector class template that works e...
Definition: vector_preview.hpp:361

common.hpp

defines_elementary.hpp

generic_type_lists.hpp

generic_type_traits.hpp

half_type.hpp

memcpy.hpp

std
Definition: accessor.hpp:2960

sycl::_V1::detail::half_impl::VecElemT
half VecElemT
Definition: half_type.hpp:262

sycl::_V1::detail::select_apply_cl_t
std::conditional_t< sizeof(_IN)==1, T8, std::conditional_t< sizeof(_IN)==2, T16, std::conditional_t< sizeof(_IN)==4, T32, T64 > >> select_apply_cl_t
Definition: vector.hpp:95

sycl::_V1::detail::rel_t
typename std::conditional_t< sizeof(DataT)==sizeof(opencl::cl_char), opencl::cl_char, typename std::conditional_t< sizeof(DataT)==sizeof(opencl::cl_short), opencl::cl_short, typename std::conditional_t< sizeof(DataT)==sizeof(opencl::cl_int), opencl::cl_int, typename std::conditional_t< sizeof(DataT)==sizeof(opencl::cl_long), opencl::cl_long, bool > >> > rel_t
Definition: vector.hpp:174

sycl::_V1::detail::isValidVectorSize
constexpr bool isValidVectorSize(int N)
Definition: vector.hpp:193

sycl::_V1::detail::int64_t
conditional< sizeof(long)==8, long, long long >::type int64_t
Definition: kernel_desc.hpp:35

sycl::_V1::detail::__attribute__
__attribute__((destructor(110))) static void syclUnload()
Definition: global_handler.cpp:366

sycl::_V1::detail::MaxVecAlignment
constexpr size_t MaxVecAlignment
Definition: vector_traits.hpp:21

sycl::_V1::ext::intel::experimental::byte
unsigned char byte
Definition: online_compiler.hpp:22

sycl::_V1::ext::oneapi::detail::Bfloat16StorageT
uint16_t Bfloat16StorageT
Definition: bfloat16.hpp:29

sycl::_V1::opencl::cl_int
std::int32_t cl_int
Definition: aliases.hpp:134

sycl::_V1::opencl::cl_char
std::int8_t cl_char
Definition: aliases.hpp:130

sycl::_V1::opencl::cl_short
std::int16_t cl_short
Definition: aliases.hpp:132

sycl::_V1::opencl::cl_long
std::int64_t cl_long
Definition: aliases.hpp:136

sycl::_V1::byte
unsigned char byte
Definition: image.hpp:107

sycl::_V1::vec_data_t
typename detail::vec_helper< T >::RetType vec_data_t
Definition: vector.hpp:354

sycl::_V1::vec_data
detail::vec_helper< T > vec_data
Definition: vector.hpp:351

sycl
Definition: access.hpp:18

sycl::_V1::detail::VecStorageImpl
Definition: vector.hpp:217

sycl::_V1::detail::VecStorageImpl::DataType
std::array< T,(N==3) ? 4 :N > DataType
Definition: vector.hpp:218

sycl::_V1::detail::VecStorage< T, 1, typename std::enable_if_t< is_sigeninteger_v< T > > >::DataType
T DataType
Definition: vector.hpp:259

sycl::_V1::detail::VecStorage< T, 1, typename std::enable_if_t< is_sugeninteger_v< T > > >::DataType
T DataType
Definition: vector.hpp:268

sycl::_V1::detail::VecStorage< T, 1, typename std::enable_if_t<!is_half_or_bf16_v< T > &&is_sgenfloat_v< T > > >::DataType
T DataType
Definition: vector.hpp:279

sycl::_V1::detail::VecStorage< T, N, typename std::enable_if_t< isValidVectorSize(N) &&(is_sgeninteger_v< T >||(is_sgenfloat_v< T > &&!is_half_or_bf16_v< T >))> >::DataType
typename VecStorageImpl< typename VecStorage< T, 1 >::DataType, N >::DataType DataType
Definition: vector.hpp:293

sycl::_V1::detail::VecStorage< bool, 1, void >::DataType
bool DataType
Definition: vector.hpp:224

sycl::_V1::detail::VecStorage< bool, N, typename std::enable_if_t< isValidVectorSize(N)> >::DataType
typename VecStorageImpl< select_apply_cl_t< bool, std::int8_t, std::int16_t, std::int32_t, std::int64_t >, N >::DataType DataType
Definition: vector.hpp:236

sycl::_V1::detail::VecStorage< std::byte, 1, void >::DataType
std::int8_t DataType
Definition: vector.hpp:249

sycl::_V1::detail::VecStorage< sycl::ext::oneapi::bfloat16, 1, void >::DataType
sycl::ext::oneapi::detail::Bfloat16StorageT DataType
Definition: vector.hpp:332

sycl::_V1::detail::VecStorage< sycl::ext::oneapi::bfloat16, 1, void >::VectorDataType
sycl::ext::oneapi::detail::Bfloat16StorageT VectorDataType
Definition: vector.hpp:334

sycl::_V1::detail::VecStorage
Definition: vector_preview.hpp:196

sycl::_V1::detail::vec_helper< bool >::set
static constexpr RetType set(bool value)
Definition: vector.hpp:106

sycl::_V1::detail::vec_helper< bool >::RetType
select_apply_cl_t< bool, std::int8_t, std::int16_t, std::int32_t, std::int64_t > RetType
Definition: vector.hpp:104

sycl::_V1::detail::vec_helper< bool >::get
static constexpr RetType get(bool value)
Definition: vector.hpp:105

sycl::_V1::detail::vec_helper< std::byte >::get
static constexpr RetType get(std::byte value)
Definition: vector.hpp:147

sycl::_V1::detail::vec_helper< std::byte >::set
static constexpr RetType set(std::byte value)
Definition: vector.hpp:148

sycl::_V1::detail::vec_helper< std::byte >::get
static constexpr std::byte get(std::uint8_t value)
Definition: vector.hpp:149

sycl::_V1::detail::vec_helper< std::byte >::set
static constexpr std::byte set(std::uint8_t value)
Definition: vector.hpp:152

sycl::_V1::detail::vec_helper< std::byte >::RetType
std::uint8_t RetType
Definition: vector.hpp:146

sycl::_V1::detail::vec_helper< sycl::ext::oneapi::bfloat16 >::get
static constexpr RetType get(BFloat16StorageT value)
Definition: vector.hpp:112

sycl::_V1::detail::vec_helper< sycl::ext::oneapi::bfloat16 >::set
static constexpr BFloat16StorageT set(RetType value)
Definition: vector.hpp:130

sycl::_V1::detail::vec_helper< sycl::ext::oneapi::bfloat16 >::get
static constexpr RetType get(RetType value)
Definition: vector.hpp:128

sycl::_V1::detail::vec_helper< sycl::ext::oneapi::bfloat16 >::BFloat16StorageT
sycl::ext::oneapi::detail::Bfloat16StorageT BFloat16StorageT
Definition: vector.hpp:111

sycl::_V1::detail::vec_helper
Definition: vector.hpp:97

sycl::_V1::detail::vec_helper::set
static constexpr RetType set(T value)
Definition: vector.hpp:100

sycl::_V1::detail::vec_helper::get
static constexpr RetType get(T value)
Definition: vector.hpp:99

sycl::_V1::detail::vec_helper::RetType
T RetType
Definition: vector.hpp:98

sycl::_V1::elem
Definition: vector.hpp:61

sycl::_V1::elem::s4
static constexpr int s4
Definition: vector.hpp:74

sycl::_V1::elem::s5
static constexpr int s5
Definition: vector.hpp:75

sycl::_V1::elem::s6
static constexpr int s6
Definition: vector.hpp:76

sycl::_V1::elem::s1
static constexpr int s1
Definition: vector.hpp:71

sycl::_V1::elem::x
static constexpr int x
Definition: vector.hpp:62

sycl::_V1::elem::s2
static constexpr int s2
Definition: vector.hpp:72

sycl::_V1::elem::sB
static constexpr int sB
Definition: vector.hpp:81

sycl::_V1::elem::sC
static constexpr int sC
Definition: vector.hpp:82

sycl::_V1::elem::sE
static constexpr int sE
Definition: vector.hpp:84

sycl::_V1::elem::a
static constexpr int a
Definition: vector.hpp:69

sycl::_V1::elem::w
static constexpr int w
Definition: vector.hpp:65

sycl::_V1::elem::z
static constexpr int z
Definition: vector.hpp:64

sycl::_V1::elem::s9
static constexpr int s9
Definition: vector.hpp:79

sycl::_V1::elem::sA
static constexpr int sA
Definition: vector.hpp:80

sycl::_V1::elem::sF
static constexpr int sF
Definition: vector.hpp:85

sycl::_V1::elem::s7
static constexpr int s7
Definition: vector.hpp:77

sycl::_V1::elem::s3
static constexpr int s3
Definition: vector.hpp:73

sycl::_V1::elem::r
static constexpr int r
Definition: vector.hpp:66

sycl::_V1::elem::g
static constexpr int g
Definition: vector.hpp:67

sycl::_V1::elem::sD
static constexpr int sD
Definition: vector.hpp:83

sycl::_V1::elem::y
static constexpr int y
Definition: vector.hpp:63

sycl::_V1::elem::s0
static constexpr int s0
Definition: vector.hpp:70

sycl::_V1::elem::s8
static constexpr int s8
Definition: vector.hpp:78

sycl::_V1::elem::b
static constexpr int b
Definition: vector.hpp:68

type_list.hpp

type_traits.hpp

__SYCL_DEFINE_HALF_VECSTORAGE
#define __SYCL_DEFINE_HALF_VECSTORAGE(Num)
Definition: vector.hpp:317

__SYCL_DEFINE_BF16_VECSTORAGE
#define __SYCL_DEFINE_BF16_VECSTORAGE(Num)
Definition: vector.hpp:337

vector_convert.hpp
Implementation of vec::convert.

vector_traits.hpp