Support Metal math functions (#4118)

* Support Metal math functions Closes #4024 Note that Metal document says Metal doesn't support "double" type; "Metal does not support the double, long long, unsigned long long, and long double data types." According to Metal document, math functions are not defined for integer types. That leaves only two types to test: half and float. As a code clean up, __floatCast is replaced with __realCast. But I had to add a new signature that can convert from integer to float. Some of GLSL functions are moved to hlsl.meta.slang. For those functions, there isn't builtin functions for HLSL but there are for GLSL and Metal. "nextafter(T,T)" is currently not working because it requires Metal version 3.1 and we invoke metal compiler with a profile version lower than 3.1. * Changes based on review comments.
author: Jay Kwak <82421531+jkwak-work@users.noreply.github.com> 2024-05-07 08:27:27 -0700
committer: GitHub <noreply@github.com> 2024-05-07 08:27:27 -0700
commit: 997f040f48b5c34e20ad6b0f512bb9d1ae6e6128 (patch)
tree: cd5465de90902e029702251766f6183e5dcc3014 /tests
parent: 1b3a428bfa24350d9d69b092747b4ad142b7c4b4 (diff)
1 files changed, 513 insertions, 0 deletions
diff --git a/tests/metal/math.slang b/tests/metal/math.slang
new file mode 100644
index 000000000..288d6137c
--- /dev/null
+++ b/tests/metal/math.slang
@@ -0,0 +1,513 @@
+//TEST:SIMPLE(filecheck=METAL): -stage compute -entry computeMain -target metal
+//TEST:SIMPLE(filecheck=GLSL): -stage compute -entry computeMain -target glsl
+//TEST:SIMPLE(filecheck=GLSL_SPIRV): -stage compute -entry computeMain -target spirv -emit-spirv-via-glsl
+//TEST:SIMPLE(filecheck=SPIR): -stage compute -entry computeMain -target spirv -emit-spirv-directly
+//TEST:SIMPLE(filecheck=HLSL): -stage compute -entry computeMain -target hlsl
+//TEST:SIMPLE(filecheck=CUDA): -stage compute -entry computeMain -target cuda
+//TEST:SIMPLE(filecheck=CPP):  -stage compute -entry computeMain -target cpp
+
+//TEST(compute, vulkan):COMPARE_COMPUTE(filecheck-buffer=BUF):-vk -compute -entry computeMain -output-using-type -emit-spirv-via-glsl
+//TEST(compute, vulkan):COMPARE_COMPUTE(filecheck-buffer=BUF):-vk -compute -entry computeMain -output-using-type -emit-spirv-directly
+//TEST:SIMPLE(filecheck=METALLIB): -target metallib
+
+//TEST_INPUT:ubuffer(data=[0 1 -1], stride=4):name=inputBuffer
+RWStructuredBuffer<int> inputBuffer;
+
+//TEST_INPUT: ubuffer(data=[0 0 0 0], stride=4):out,name outputBuffer
+RWStructuredBuffer<int> outputBuffer;
+
+// METALLIB: define void @computeMain
+
+// It is unclear why "nextafter" is not working for Metal.
+#define TEST_WHEN_nextafter_WORKS 0
+
+__generic<T:__BuiltinFloatingPointType>
+bool Test_Scalar()
+{
+    // METAL-LABEL: Test_Scalar
+    const T zero = T(inputBuffer[0]);
+    const T one = T(inputBuffer[1]);
+
+    const int zeroInt = int(inputBuffer[0]);
+
+    T outFloat1, outFloat2;
+    int outInt;
+
+    bool voidResult = true;
+
+    // METAL: sincos(
+    // METAL-NOT: sincos(
+    sincos<T>(zero, outFloat1, outFloat2);
+    voidResult = voidResult && zero == outFloat1 && one == outFloat2;
+
+    return voidResult
+        // METAL: acos(
+        // METALLIB: acos.f32
+        && zero == acos<T>(one)
+
+        // METAL: acosh(
+        // METALLIB: acosh.f32
+        && zero == acosh<T>(one)
+
+        // METAL: asin(
+        // METALLIB: asin.f32
+        && zero == asin<T>(zero)
+
+        // METAL: asinh(
+        // METALLIB: asinh.f32
+        && zero == asinh<T>(zero)
+
+        // METAL: atan(
+        // METALLIB: atan.f32
+        && zero == atan<T>(zero)
+
+        // METAL: atan2(
+        // METALLIB: atan2.f32
+        && zero == atan2<T>(zero, zero)
+
+        // METAL: atanh(
+        // METALLIB: atanh.f32
+        && zero == atanh<T>(zero)
+
+        // METAL: ceil(
+        // METALLIB: ceil.f32
+        && zero == ceil<T>(zero)
+
+        // METAL: copysign(
+        // METALLIB: bitcast float
+        && zero == copysign<T>(zero, zero)
+
+        // METAL: cos(
+        // METALLIB: cos.f32
+        && one == cos<T>(zero)
+
+        // METAL: cosh(
+        // METALLIB: cosh.f32
+        && one == cosh<T>(zero)
+
+        // METAL: cospi(
+        // METALLIB: cospi.f32
+        && one == cospi<T>(zero)
+
+        // METAL: divide(
+        // METALLIB: fdiv
+        && zero == divide<T>(zero, one)
+
+        // METAL: exp(
+        // METALLIB: exp.f32
+        && one == exp<T>(zero)
+
+        // METAL: exp2(
+        // METALLIB: exp2.f32
+        && one == exp2<T>(zero)
+
+        // METAL: exp10(
+        // METALLIB: exp10.f32
+        && one == exp10<T>(zero)
+
+        // METAL: fabs(
+        // METALLIB: fabs.f32
+        && zero == fabs<T>(zero)
+
+        // METAL: abs(
+        && zero == abs<T>(zero)
+
+        // METAL: fdim(
+        && zero == fdim<T>(zero, zero)
+
+        // METAL: floor(
+        // METALLIB: floor.f32
+        && zero == floor<T>(zero)
+
+        // METAL: fma(
+        // METALLIB: fma.f32
+        && zero == fma(zero, zero, zero)
+
+        // METAL: fmax(
+        // METALLIB: fmax.f32
+        && zero == fmax<T>(zero, zero)
+
+        // METAL: max(
+        && zero == max<T>(zero, zero)
+
+        // METAL: fmax3(
+        // METALLIB: fmax3.f32
+        && zero == fmax3<T>(zero, zero, zero)
+
+        // METAL: max3(
+        && zero == max3<T>(zero, zero, zero)
+
+        // METAL: fmedian3(
+        // METALLIB: fmedian3.f32
+        && zero == fmedian3<T>(zero, zero, zero)
+
+        // METAL: median3(
+        && zero == median3<T>(zero, zero, zero)
+
+        // METAL: fmin(
+        // METALLIB: fmin.f32
+        && zero == fmin<T>(zero, zero)
+
+        // METAL: min(
+        && zero == min<T>(zero, zero)
+
+        // METAL: fmin3(
+        // METALLIB: fmin3.f32
+        && zero == fmin3<T>(zero, zero, zero)
+
+        // METAL: min3(
+        && zero == min3<T>(zero, zero, zero)
+
+        // METAL-COUNT-2: fmod(
+        // METALLIB-COUNT-2: fmod.f32
+        && zero == fmod<T>(zero, one)
+
+        // METAL: fract(
+        // METALLIB: fract.f32
+        && zero == fract<T>(zero)
+
+        // METAL: frexp(
+        // METALLIB: frexp_float
+        && zero == frexp<T>(zero, outInt) && zeroInt == outInt
+
+        // METAL: ldexp(
+        // METALLIB: ldexp.f32
+        && zero == ldexp<T>(zero, zeroInt)
+
+        // METAL: log(
+        // METALLIB: log.f32
+        && zero == log<T>(one)
+
+        // METAL: log2(
+        // METALLIB: log2.f32
+        && zero == log2<T>(one)
+
+        // METAL: log10(
+        // METALLIB: log10.f32
+        && zero == log10<T>(one)
+
+        // METAL: modf(
+        && zero == modf<T>(zero, outFloat1)
+
+#if TEST_WHEN_nextafter_WORKS
+        // M-ETAL: nextafter(
+        && zero == nextafter<T>(zero, zero)
+#endif
+
+        // METAL: pow(
+        // METALLIB: pow.f32
+        && zero == pow<T>(zero, one)
+
+        // METAL: powr(
+        // METALLIB: powr.f32
+        && zero == powr<T>(zero, one)
+
+        // METAL: rint(
+        // METALLIB: rint.f32
+        && zero == rint<T>(zero)
+
+        // METAL: round(
+        // METALLIB: round.f32
+        && zero == round<T>(zero)
+
+        // METAL: rsqrt(
+        // METALLIB: rsqrt.f32
+        && one == rsqrt<T>(one)
+
+        // METAL: sin(
+        // METALLIB: sin.f32
+        && zero == sin<T>(zero)
+
+        // METAL: sinh(
+        // METALLIB: sinh.f32
+        && zero == sinh<T>(zero)
+
+        // METAL: sinpi(
+        // METALLIB: sinpi.f32
+        && zero == sinpi<T>(zero)
+
+        // METAL: sqrt(
+        // METALLIB: sqrt.f32
+        && zero == sqrt<T>(zero)
+
+        // METAL: tan(
+        // METALLIB: tan.f32
+        && zero == tan<T>(zero)
+
+        // METAL: tanh(
+        // METALLIB: tanh.f32
+        && zero == tanh<T>(zero)
+
+        // METAL: tanpi(
+        // METALLIB: tanpi.f32
+        && zero == tanpi<T>(zero)
+
+        // METAL: trunc(
+        && zero == trunc<T>(zero)
+        ;
+
+    // METALLIB: ret
+}
+
+__generic<T:__BuiltinFloatingPointType, let N : int>
+bool Test_Vector()
+{
+    // METAL-LABEL: Test_Vector_0
+    const vector<T,N> zero = T(inputBuffer[0]);
+    const vector<T,N> one = T(inputBuffer[1]);
+
+    const vector<int,N> zeroInt = int(inputBuffer[0]);
+
+    vector<T,N> outFloat1, outFloat2;
+    vector<int,N> outInt;
+
+    bool voidResult = true;
+
+    // METAL: sincos(
+    // METAL-NOT: sincos(
+    sincos<T>(zero, outFloat1, outFloat2);
+    voidResult = voidResult && zero == outFloat1 && one == outFloat2;
+
+    return voidResult
+        // METAL: acos(
+        // METAL-NOT: acos(
+        && zero == acos<T>(one)
+
+        // METAL: acosh(
+        // METAL-NOT: acosh(
+        && zero == acosh<T>(one)
+
+        // METAL: asin(
+        // METAL-NOT: asin(
+        && zero == asin<T>(zero)
+
+        // METAL: asinh(
+        // METAL-NOT: asinh(
+        && zero == asinh<T>(zero)
+
+        // METAL: atan(
+        // METAL-NOT: atan(
+        && zero == atan<T>(zero)
+
+        // METAL: atan2(
+        // METAL-NOT: atan2(
+        && zero == atan2<T>(zero, zero)
+
+        // METAL: atanh(
+        // METAL-NOT: atanh(
+        && zero == atanh<T>(zero)
+
+        // METAL: ceil(
+        // METAL-NOT: ceil(
+        && zero == ceil<T>(zero)
+
+        // METAL: copysign(
+        // METAL-NOT: copysign(
+        && zero == copysign<T>(zero, zero)
+
+        // METAL: cos(
+        // METAL-NOT: cos(
+        && one == cos<T>(zero)
+
+        // METAL: cosh(
+        // METAL-NOT: cosh(
+        && one == cosh<T>(zero)
+
+        // METAL: cospi(
+        // METAL-NOT: cospi(
+        && one == cospi<T>(zero)
+
+        // METAL: divide(
+        // METAL-NOT: divide(
+        && zero == divide<T>(zero, one)
+
+        // METAL: exp(
+        // METAL-NOT: exp(
+        && one == exp<T>(zero)
+
+        // METAL: exp2(
+        // METAL-NOT: exp2(
+        && one == exp2<T>(zero)
+
+        // METAL: exp10(
+        // METAL-NOT: exp10(
+        && one == exp10<T>(zero)
+
+        // METAL: fabs(
+        // METAL-NOT: fabs(
+        && zero == fabs<T>(zero)
+
+        // METAL: abs(
+        // METAL-NOT: abs(
+        && zero == abs<T>(zero)
+
+        // METAL: fdim(
+        // METAL-NOT: fdim(
+        && zero == fdim<T>(zero, zero)
+
+        // METAL: floor(
+        // METAL-NOT: floor(
+        && zero == floor<T>(zero)
+
+        // METAL: fma(
+        // METAL-NOT: fma(
+        && zero == fma(zero, zero, zero)
+
+        // METAL: fmax(
+        // METAL-NOT: fmax(
+        && zero == fmax<T>(zero, zero)
+
+        // METAL: max(
+        // METAL-NOT: max(
+        && zero == max<T>(zero, zero)
+
+        // METAL: fmax3(
+        // METAL-NOT: fmax3(
+        && zero == fmax3<T>(zero, zero, zero)
+
+        // METAL: max3(
+        // METAL-NOT: max3(
+        && zero == max3<T>(zero, zero, zero)
+
+        // METAL: fmedian3(
+        // METAL-NOT: fmedian3(
+        && zero == fmedian3<T>(zero, zero, zero)
+
+        // METAL: median3(
+        // METAL-NOT: median3(
+        && zero == median3<T>(zero, zero, zero)
+
+        // METAL: fmin(
+        // METAL-NOT: fmin(
+        && zero == fmin<T>(zero, zero)
+
+        // METAL: min(
+        // METAL-NOT: min(
+        && zero == min<T>(zero, zero)
+
+        // METAL: fmin3(
+        // METAL-NOT: fmin3(
+        && zero == fmin3<T>(zero, zero, zero)
+
+        // METAL: min3(
+        // METAL-NOT: min3(
+        && zero == min3<T>(zero, zero, zero)
+
+        // METAL-COUNT-2: fmod(
+        // METAL-NOT: fmod(
+        && zero == fmod<T>(zero, one)
+
+        // METAL: fract(
+        // METAL-NOT: fract(
+        && zero == fract<T>(zero)
+
+        // METAL: frexp(
+        // METAL-NOT: frexp(
+        && zero == frexp<T>(zero, outInt) && all(zeroInt == outInt)
+
+        // METAL: ldexp(
+        // METAL-NOT: ldexp(
+        && zero == ldexp<T>(zero, zeroInt)
+
+        // METAL: log(
+        // METAL-NOT: log(
+        && zero == log<T>(one)
+
+        // METAL: log2(
+        // METAL-NOT: log2(
+        && zero == log2<T>(one)
+
+        // METAL: log10(
+        // METAL-NOT: log10(
+        && zero == log10<T>(one)
+
+        // METAL: modf(
+        // METAL-NOT: modf(
+        && zero == modf<T>(zero, outFloat1)
+
+#if TEST_WHEN_nextafter_WORKS
+        // M-ETAL: nextafter(
+        // METAL-NOT: nextafter(
+        && zero == nextafter<T>(zero, zero)
+#endif
+
+        // METAL: pow(
+        // METAL-NOT: pow(
+        && zero == pow<T>(zero, one)
+
+        // METAL: powr(
+        // METAL-NOT: powr(
+        && zero == powr<T>(zero, one)
+
+        // METAL: rint(
+        // METAL-NOT: rint(
+        && zero == rint<T>(zero)
+
+        // METAL: round(
+        // METAL-NOT: round(
+        && zero == round<T>(zero)
+
+        // METAL: rsqrt(
+        // METAL-NOT: rsqrt(
+        && one == rsqrt<T>(one)
+
+        // METAL: sin(
+        // METAL-NOT: sin(
+        && zero == sin<T>(zero)
+
+        // METAL: sinh(
+        // METAL-NOT: sinh(
+        && zero == sinh<T>(zero)
+
+        // METAL: sinpi(
+        // METAL-NOT: sinpi(
+        && zero == sinpi<T>(zero)
+
+        // METAL: sqrt(
+        // METAL-NOT: sqrt(
+        && zero == sqrt<T>(zero)
+
+        // METAL: tan(
+        // METAL-NOT: tan(
+        && zero == tan<T>(zero)
+
+        // METAL: tanh(
+        // METAL-NOT: tanh(
+        && zero == tanh<T>(zero)
+
+        // METAL: tanpi(
+        // METAL-NOT: tanpi(
+        && zero == tanpi<T>(zero)
+
+        // METAL: trunc(
+        // METAL-NOT: trunc(
+        && zero == trunc<T>(zero)
+        ;
+
+    // METAL-LABEL: Test_Vector_1
+}
+
+[numthreads(1,1,1)]
+void computeMain()
+{
+    // GLSL: void main(
+    // GLSL_SPIRV: OpEntryPoint
+    // SPIR: OpEntryPoint
+    // HLSL: void computeMain(
+    // CUDA: void computeMain(
+    // CPP: void _computeMain(
+
+    bool result = true
+        && Test_Scalar<float>()
+        && Test_Vector<float, 2>()
+        && Test_Vector<float, 3>()
+        && Test_Vector<float, 4>()
+        && Test_Scalar<half>()
+        && Test_Vector<half, 2>()
+        && Test_Vector<half, 3>()
+        && Test_Vector<half, 4>()
+        ;
+
+    // BUF: 1
+    outputBuffer[0] = int(result);
+}
author	Jay Kwak <82421531+jkwak-work@users.noreply.github.com>	2024-05-07 08:27:27 -0700
committer	GitHub <noreply@github.com>	2024-05-07 08:27:27 -0700
commit	997f040f48b5c34e20ad6b0f512bb9d1ae6e6128 (patch)
tree	cd5465de90902e029702251766f6183e5dcc3014 /tests
parent	1b3a428bfa24350d9d69b092747b4ad142b7c4b4 (diff)