multiarch/libs/float_helpers.c

a4f3ed62SAlex Bennée/*
a4f3ed62SAlex Bennée * Common Float Helpers
a4f3ed62SAlex Bennée *
a4f3ed62SAlex Bennée * This contains a series of useful utility routines and a set of
a4f3ed62SAlex Bennée * floating point constants useful for exercising the edge cases in
a4f3ed62SAlex Bennée * floating point tests.
a4f3ed62SAlex Bennée *
*542b10bdSAlex Bennée * Copyright (c) 2019, 2024 Linaro
a4f3ed62SAlex Bennée *
*542b10bdSAlex Bennée * SPDX-License-Identifier: GPL-2.0-or-later
a4f3ed62SAlex Bennée */
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/* we want additional float type definitions */
a4f3ed62SAlex Bennée#define __STDC_WANT_IEC_60559_BFP_EXT__
a4f3ed62SAlex Bennée#define __STDC_WANT_IEC_60559_TYPES_EXT__
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée#define _GNU_SOURCE
a4f3ed62SAlex Bennée#include <stdio.h>
a4f3ed62SAlex Bennée#include <stdlib.h>
a4f3ed62SAlex Bennée#include <inttypes.h>
a4f3ed62SAlex Bennée#include <math.h>
a4f3ed62SAlex Bennée#include <float.h>
a4f3ed62SAlex Bennée#include <fenv.h>
a4f3ed62SAlex Bennée
5343a837SAlex Bennée#include "../float_helpers.h"
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée#define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/*
a4f3ed62SAlex Bennée * Half Precision Numbers
a4f3ed62SAlex Bennée *
a4f3ed62SAlex Bennée * Not yet well standardised so we return a plain uint16_t for now.
a4f3ed62SAlex Bennée */
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/* no handy defines for these numbers */
a4f3ed62SAlex Bennéestatic uint16_t f16_numbers[] = {
a4f3ed62SAlex Bennée    0xffff, /* -NaN / AHP -Max */
a4f3ed62SAlex Bennée    0xfcff, /* -NaN / AHP */
a4f3ed62SAlex Bennée    0xfc01, /* -NaN / AHP */
a4f3ed62SAlex Bennée    0xfc00, /* -Inf */
a4f3ed62SAlex Bennée    0xfbff, /* -Max */
a4f3ed62SAlex Bennée    0xc000, /* -2 */
a4f3ed62SAlex Bennée    0xbc00, /* -1 */
a4f3ed62SAlex Bennée    0x8001, /* -MIN subnormal */
a4f3ed62SAlex Bennée    0x8000, /* -0 */
a4f3ed62SAlex Bennée    0x0000, /* +0 */
a4f3ed62SAlex Bennée    0x0001, /* MIN subnormal */
a4f3ed62SAlex Bennée    0x3c00, /* 1 */
a4f3ed62SAlex Bennée    0x7bff, /* Max */
a4f3ed62SAlex Bennée    0x7c00, /* Inf */
a4f3ed62SAlex Bennée    0x7c01, /* NaN / AHP */
a4f3ed62SAlex Bennée    0x7cff, /* NaN / AHP */
a4f3ed62SAlex Bennée    0x7fff, /* NaN / AHP +Max*/
a4f3ed62SAlex Bennée};
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéestatic const int num_f16 = ARRAY_SIZE(f16_numbers);
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéeint get_num_f16(void)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    return num_f16;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéeuint16_t get_f16(int i)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    return f16_numbers[i % num_f16];
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/* only display as hex */
a4f3ed62SAlex Bennéechar *fmt_16(uint16_t num)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    char *fmt;
a4f3ed62SAlex Bennée    asprintf(&fmt, "f16(%#04x)", num);
a4f3ed62SAlex Bennée    return fmt;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/*
a4f3ed62SAlex Bennée * Single Precision Numbers
a4f3ed62SAlex Bennée */
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée#ifndef SNANF
a4f3ed62SAlex Bennée/* Signaling NaN macros, if supported.  */
a4f3ed62SAlex Bennée#  define SNANF (__builtin_nansf (""))
a4f3ed62SAlex Bennée#  define SNAN (__builtin_nans (""))
a4f3ed62SAlex Bennée#  define SNANL (__builtin_nansl (""))
a4f3ed62SAlex Bennée#endif
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéestatic float f32_numbers[] = {
a4f3ed62SAlex Bennée    -SNANF,
a4f3ed62SAlex Bennée    -NAN,
a4f3ed62SAlex Bennée    -INFINITY,
a4f3ed62SAlex Bennée    -FLT_MAX,
a4f3ed62SAlex Bennée    -0x1.1874b2p+103,
a4f3ed62SAlex Bennée    -0x1.c0bab6p+99,
a4f3ed62SAlex Bennée    -0x1.31f75p-40,
a4f3ed62SAlex Bennée    -0x1.505444p-66,
a4f3ed62SAlex Bennée    -FLT_MIN,
a4f3ed62SAlex Bennée    0.0,
a4f3ed62SAlex Bennée    FLT_MIN,
a4f3ed62SAlex Bennée    0x1p-25,
a4f3ed62SAlex Bennée    0x1.ffffe6p-25, /* min positive FP16 subnormal */
a4f3ed62SAlex Bennée    0x1.ff801ap-15, /* max subnormal FP16 */
a4f3ed62SAlex Bennée    0x1.00000cp-14, /* min positive normal FP16 */
a4f3ed62SAlex Bennée    1.0,
a4f3ed62SAlex Bennée    0x1.004p+0, /* smallest float after 1.0 FP16 */
a4f3ed62SAlex Bennée    2.0,
a4f3ed62SAlex Bennée    M_E, M_PI,
a4f3ed62SAlex Bennée    0x1.ffbep+15,
a4f3ed62SAlex Bennée    0x1.ffcp+15, /* max FP16 */
a4f3ed62SAlex Bennée    0x1.ffc2p+15,
a4f3ed62SAlex Bennée    0x1.ffbfp+16,
a4f3ed62SAlex Bennée    0x1.ffcp+16, /* max AFP */
a4f3ed62SAlex Bennée    0x1.ffc1p+16,
a4f3ed62SAlex Bennée    0x1.c0bab6p+99,
a4f3ed62SAlex Bennée    FLT_MAX,
a4f3ed62SAlex Bennée    INFINITY,
a4f3ed62SAlex Bennée    NAN,
a4f3ed62SAlex Bennée    SNANF
a4f3ed62SAlex Bennée};
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéestatic const int num_f32 = ARRAY_SIZE(f32_numbers);
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéeint get_num_f32(void)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    return num_f32;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéefloat get_f32(int i)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    return f32_numbers[i % num_f32];
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéechar *fmt_f32(float num)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    uint32_t single_as_hex = *(uint32_t *) &num;
a4f3ed62SAlex Bennée    char *fmt;
a4f3ed62SAlex Bennée    asprintf(&fmt, "f32(%02.20a:%#010x)", num, single_as_hex);
a4f3ed62SAlex Bennée    return fmt;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/* This allows us to initialise some doubles as pure hex */
a4f3ed62SAlex Bennéetypedef union {
a4f3ed62SAlex Bennée    double d;
a4f3ed62SAlex Bennée    uint64_t h;
a4f3ed62SAlex Bennée} test_doubles;
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéestatic test_doubles f64_numbers[] = {
a4f3ed62SAlex Bennée    {SNAN},
a4f3ed62SAlex Bennée    {-NAN},
a4f3ed62SAlex Bennée    {-INFINITY},
a4f3ed62SAlex Bennée    {-DBL_MAX},
a4f3ed62SAlex Bennée    {-FLT_MAX-1.0},
a4f3ed62SAlex Bennée    {-FLT_MAX},
a4f3ed62SAlex Bennée    {-1.111E+31},
a4f3ed62SAlex Bennée    {-1.111E+30}, /* half prec */
a4f3ed62SAlex Bennée    {-2.0}, {-1.0},
a4f3ed62SAlex Bennée    {-DBL_MIN},
a4f3ed62SAlex Bennée    {-FLT_MIN},
a4f3ed62SAlex Bennée    {0.0},
a4f3ed62SAlex Bennée    {FLT_MIN},
a4f3ed62SAlex Bennée    {2.98023224e-08},
a4f3ed62SAlex Bennée    {5.96046E-8}, /* min positive FP16 subnormal */
a4f3ed62SAlex Bennée    {6.09756E-5}, /* max subnormal FP16 */
a4f3ed62SAlex Bennée    {6.10352E-5}, /* min positive normal FP16 */
a4f3ed62SAlex Bennée    {1.0},
a4f3ed62SAlex Bennée    {1.0009765625}, /* smallest float after 1.0 FP16 */
a4f3ed62SAlex Bennée    {DBL_MIN},
a4f3ed62SAlex Bennée    {1.3789972848607228e-308},
a4f3ed62SAlex Bennée    {1.4914738736681624e-308},
a4f3ed62SAlex Bennée    {1.0}, {2.0},
a4f3ed62SAlex Bennée    {M_E}, {M_PI},
a4f3ed62SAlex Bennée    {65503.0},
a4f3ed62SAlex Bennée    {65504.0}, /* max FP16 */
a4f3ed62SAlex Bennée    {65505.0},
a4f3ed62SAlex Bennée    {131007.0},
a4f3ed62SAlex Bennée    {131008.0}, /* max AFP */
a4f3ed62SAlex Bennée    {131009.0},
a4f3ed62SAlex Bennée    {.h = 0x41dfffffffc00000 }, /* to int = 0x7fffffff */
a4f3ed62SAlex Bennée    {FLT_MAX},
a4f3ed62SAlex Bennée    {FLT_MAX + 1.0},
a4f3ed62SAlex Bennée    {DBL_MAX},
a4f3ed62SAlex Bennée    {INFINITY},
a4f3ed62SAlex Bennée    {NAN},
a4f3ed62SAlex Bennée    {.h = 0x7ff0000000000001}, /* SNAN */
a4f3ed62SAlex Bennée    {SNAN},
a4f3ed62SAlex Bennée};
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéestatic const int num_f64 = ARRAY_SIZE(f64_numbers);
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéeint get_num_f64(void)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    return num_f64;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéedouble get_f64(int i)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    return f64_numbers[i % num_f64].d;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennéechar *fmt_f64(double num)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    uint64_t double_as_hex = *(uint64_t *) &num;
a4f3ed62SAlex Bennée    char *fmt;
a4f3ed62SAlex Bennée    asprintf(&fmt, "f64(%02.20a:%#020" PRIx64 ")", num, double_as_hex);
a4f3ed62SAlex Bennée    return fmt;
a4f3ed62SAlex Bennée}
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée/*
a4f3ed62SAlex Bennée * Float flags
a4f3ed62SAlex Bennée */
a4f3ed62SAlex Bennéechar *fmt_flags(void)
a4f3ed62SAlex Bennée{
a4f3ed62SAlex Bennée    int flags = fetestexcept(FE_ALL_EXCEPT);
a4f3ed62SAlex Bennée    char *fmt;
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée    if (flags) {
a4f3ed62SAlex Bennée        asprintf(&fmt, "%s%s%s%s%s",
a4f3ed62SAlex Bennée                 flags & FE_OVERFLOW ? "OVERFLOW " : "",
a4f3ed62SAlex Bennée                 flags & FE_UNDERFLOW ? "UNDERFLOW " : "",
a4f3ed62SAlex Bennée                 flags & FE_DIVBYZERO ? "DIV0 " : "",
a4f3ed62SAlex Bennée                 flags & FE_INEXACT ? "INEXACT " : "",
a4f3ed62SAlex Bennée                 flags & FE_INVALID ? "INVALID" : "");
a4f3ed62SAlex Bennée    } else {
a4f3ed62SAlex Bennée        asprintf(&fmt, "OK");
a4f3ed62SAlex Bennée    }
a4f3ed62SAlex Bennée
a4f3ed62SAlex Bennée    return fmt;
a4f3ed62SAlex Bennée}