在不丢失有效数字的情况下分析十进制数字

本文关键字:情况下 十进制数字 有效数字 | 更新日期: 2023-09-27 18:28:15

我需要将用户输入解析为数字,并将其存储在十进制变量中。

对我来说,重要的是不要接受任何不能用十进制值正确表示的用户输入。

这对于非常大(或非常小)的数字来说很好,因为Parse方法在这些情况下会抛出OverflowException。

但是,当一个数字的有效数字太多时,Parse方法将无声地返回一个截断(或取整?)的值。

例如,解析1.23456789123456789123456789123(30个有效数字)会得到一个等于1.2345678912345678912345678912(29个有效位数)的值。

这是根据规范规定的,十进制值的精度为28-29位有效数字。

然而,我需要能够检测(并拒绝)解析时将被截断的数字,因为在我的情况下,丢失有效数字是不可接受的。

对此,最好的方法是什么?


请注意,通过字符串比较进行预解析或后验证并不是一个简单的方法,因为我需要支持各种特定于区域性的输入和各种数字样式(空白、千位分隔符、括号、指数语法等)。

因此,我正在寻找一种解决方案,而不会复制.NET.提供的解析代码


我目前正在使用此解决方法来检测具有28个或更多有效数字的输入。虽然这是有效的,但它有效地将所有输入限制在最多27个有效数字(而不是28-29):

/// <summary>
///     Determines whether the specified value has 28 or more significant digits, 
///     in which case it must be rejected since it may have been truncated when 
///     we parsed it.
/// </summary>
static bool MayHaveBeenTruncated(decimal value)
{
    const string format = "#.###########################e0";
    string str = value.ToString(format, CultureInfo.InvariantCulture);
    return (str.LastIndexOf('e') - str.IndexOf('.')) > 27;
}

在不丢失有效数字的情况下分析十进制数字

让我首先声明没有"官方"解决方案。通常我不会依赖内部实现,所以我向您提供以下内容,因为您说过解决这一问题对您来说非常重要。

如果你看一下引用源,你会发现所有的解析方法都是在一个(不幸的是内部的)System.Number类中实现的。进一步研究,与decimal相关的方法是TryParseDecimal和ParseDecimal,它们都使用类似于的东西

byte* buffer = stackalloc byte[NumberBuffer.NumberBufferBytes];
var number = new NumberBuffer(buffer);
if (TryStringToNumber(s, styles, ref number, numfmt, true))
{
   // other stuff
}                        

其中CCD_ 4是另一个内部CCD_。关键是整个解析都发生在TryStringToNumber方法内部,并使用结果来生成结果。我们感兴趣的是一个名为precision的NumberBuffer字段,它由上面的方法填充。

考虑到所有这些,我们可以在调用基本十进制方法后生成一个类似的方法来提取精度,以确保在进行后处理之前进行正常的验证/异常。所以这个方法就像这个

static unsafe bool GetPrecision(string s, NumberStyles style, NumberFormatInfo numfmt)
{
    byte* buffer = stackalloc byte[Number.NumberBuffer.NumberBufferBytes];
    var number = new NumberBuffer(buffer);
    TryStringToNumber(s, styles, ref number, numfmt, true);
    return number.precision;
}

但请记住,这些类型及其方法都是内部的,因此很难应用基于法线反射、委托或Expression的技术。幸运的是,使用System.Reflection.Emit编写这样一个方法并不困难。完整实施如下

public static class DecimalUtils
{
    public static decimal ParseExact(string s, NumberStyles style = NumberStyles.Number, IFormatProvider provider = null)
    {
        // NOTE: Always call base method first 
        var value = decimal.Parse(s, style, provider);
        if (!IsValidPrecision(s, style, provider))
            throw new InvalidCastException(); // TODO: throw appropriate exception
        return value;
    }
    public static bool TryParseExact(string s, out decimal result, NumberStyles style = NumberStyles.Number, IFormatProvider provider = null)
    {
        // NOTE: Always call base method first 
        return decimal.TryParse(s, style, provider, out result) && !IsValidPrecision(s, style, provider);
    }
    static bool IsValidPrecision(string s, NumberStyles style, IFormatProvider provider)
    {
        var precision = GetPrecision(s, style, NumberFormatInfo.GetInstance(provider));
        return precision <= 29;
    }
    static readonly Func<string, NumberStyles, NumberFormatInfo, int> GetPrecision = BuildGetPrecisionFunc();
    static Func<string, NumberStyles, NumberFormatInfo, int> BuildGetPrecisionFunc()
    {
        const BindingFlags Flags = BindingFlags.Public | BindingFlags.NonPublic;
        const BindingFlags InstanceFlags = Flags | BindingFlags.Instance;
        const BindingFlags StaticFlags = Flags | BindingFlags.Static;
        var numberType = typeof(decimal).Assembly.GetType("System.Number");
        var numberBufferType = numberType.GetNestedType("NumberBuffer", Flags);
        var method = new DynamicMethod("GetPrecision", typeof(int),
            new[] { typeof(string), typeof(NumberStyles), typeof(NumberFormatInfo) },
            typeof(DecimalUtils), true);
        var body = method.GetILGenerator();
        // byte* buffer = stackalloc byte[Number.NumberBuffer.NumberBufferBytes];
        var buffer = body.DeclareLocal(typeof(byte*));
        body.Emit(OpCodes.Ldsfld, numberBufferType.GetField("NumberBufferBytes", StaticFlags));
        body.Emit(OpCodes.Localloc);
        body.Emit(OpCodes.Stloc, buffer.LocalIndex);
        // var number = new Number.NumberBuffer(buffer);
        var number = body.DeclareLocal(numberBufferType);
        body.Emit(OpCodes.Ldloca_S, number.LocalIndex);
        body.Emit(OpCodes.Ldloc, buffer.LocalIndex);
        body.Emit(OpCodes.Call, numberBufferType.GetConstructor(InstanceFlags, null,
            new[] { typeof(byte*) }, null));
        // Number.TryStringToNumber(value, options, ref number, numfmt, true);
        body.Emit(OpCodes.Ldarg_0);
        body.Emit(OpCodes.Ldarg_1);
        body.Emit(OpCodes.Ldloca_S, number.LocalIndex);
        body.Emit(OpCodes.Ldarg_2);
        body.Emit(OpCodes.Ldc_I4_1);
        body.Emit(OpCodes.Call, numberType.GetMethod("TryStringToNumber", StaticFlags, null,
            new[] { typeof(string), typeof(NumberStyles), numberBufferType.MakeByRefType(), typeof(NumberFormatInfo), typeof(bool) }, null));
        body.Emit(OpCodes.Pop);
        // return number.precision;
        body.Emit(OpCodes.Ldloca_S, number.LocalIndex);
        body.Emit(OpCodes.Ldfld, numberBufferType.GetField("precision", InstanceFlags));
        body.Emit(OpCodes.Ret);
        return (Func<string, NumberStyles, NumberFormatInfo, int>)method.CreateDelegate(typeof(Func<string, NumberStyles, NumberFormatInfo, int>));
    }
}

风险自负:)

假设输入是一个字符串,并且它已被验证为数字,则可以使用string.Split:

text = text.Trim().Replace(",", "");
bool neg = text.Contains("-");
if (neg) text = text.Replace("-", "");
while (text.Substring(0, 1) == 0 && text.Substring(0, 2) != "0." && text != "0")
    text = text.Substring(1);
if (text.Contains("."))
{
    while (text.Substring(text.Length - 1) == "0")
        text = text.Substring(0, text.Length - 1);
}
if (text.Split(".")[0].Length + text.Split(".")[1].Length + (neg ? 1 : 0) <= 29)
    valid = true;

您可以覆盖或替换Parse并包含此检查。

问题是,在进行对话时会注意四舍五入,即如果小数超过28,Decimal myNumber = Decimal.Parse(myInput)将始终返回四舍五舍五入的数字。

你也不想创建一个大的解析器,所以我要做的是将输入的字符串值与新的十进制值作为字符串进行比较:

//This is the string input from the user
string myInput = "1.23456789123456789123456789123";
//This is the decimal conversation in your application
Decimal myDecimal = Decimal.Parse(myInput);
//This is the check to see if the input string value from the user is the same 
//after we parsed it to a decimal value. Now we need to parse it back to a string to verify
//the two different string values:
if(myInput.CompareTo(myDecimal.ToString()) == 0)
    Console.WriteLine("EQUAL: Have NOT been rounded!");
else
    Console.WriteLine("NOT EQUAL: Have been rounded!");

通过这种方式,C#将处理所有的数字内容,并且您只需要进行快速检查。

您应该了解一下BigRational的实现。它还不是.Net框架的一部分,但它是BigInteger类的等价物,并提供了TryParse方法。通过这种方式,您应该能够比较您解析的BigRational是否等于解析的小数。