使用TPL的推测性执行

本文关键字:执行 TPL 使用 | 更新日期: 2023-09-27 17:58:07

我有一个List<Task<bool>>,我想并行枚举它,找到第一个要完成的任务,结果是true,而不等待或观察任何其他仍挂起的任务的异常。

var tasks = new List<Task<bool>>
{ 
    Task.Delay(2000).ContinueWith(x => false), 
    Task.Delay(0).ContinueWith(x => true), 
};

我曾尝试使用PLINQ做一些类似的事情:

var task = tasks.AsParallel().FirstOrDefault(t => t.Result);

它并行执行,但一旦找到令人满意的结果就不会返回。因为访问Result属性被阻止。为了使用PLINQ实现这一点,我必须写下以下令人敬畏的语句:

var cts = new CancellationTokenSource();
var task = tasks.AsParallel()
    .FirstOrDefault(t =>
    {
        try 
        { 
            t.Wait(cts.Token);
            if (t.Result)
            {
                cts.Cancel();
            }
            return t.Result;
        } 
        catch (OperationCanceledException) 
        { 
            return false;
        }
    } );

我已经写了一个扩展方法,它可以在任务完成时生成任务

public static class Exts
{
    public static IEnumerable<Task<T>> InCompletionOrder<T>(this IEnumerable<Task<T>> source)
    {
        var tasks = source.ToList();
        while (tasks.Any())
        {
            var t = Task.WhenAny(tasks);
            yield return t.Result;
            tasks.Remove(t.Result);
        }
    }
}
// and run like so
var task = tasks.InCompletionOrder().FirstOrDefault(t => t.Result);

但感觉这是一件很常见的事情,有更好的方法。建议?

使用TPL的推测性执行

也许是这样的?

var tcs = new TaskCompletionSource<Task<bool>>();
foreach (var task in tasks)
{
    task.ContinueWith((t, state) =>
    {
        if (t.Result)
        {
            ((TaskCompletionSource<Task<bool>>)state).TrySetResult(t);
        }
    },
        tcs,
        TaskContinuationOptions.OnlyOnRanToCompletion |
        TaskContinuationOptions.ExecuteSynchronously);
}
var firstTaskToComplete = tcs.Task;

也许您可以尝试Rx.Net库。实际上,这对林克的工作很有好处。

在引用Microsoft Rx.Net程序集后,请在LinqPad中尝试此代码段。

using System
using System.Linq
using System.Reactive.Concurrency
using System.Reactive.Linq
using System.Reactive.Threading.Tasks
using System.Threading.Tasks
void Main()
{
    var tasks = new List<Task<bool>>
    { 
        Task.Delay(2000).ContinueWith(x => false), 
        Task.Delay(0).ContinueWith(x => true), 
    };
    var observable = (from t in tasks.ToObservable()
                      //Convert task to an observable
                      let o = t.ToObservable()
                      //SelectMany
                      from x in o
                      select x);

    var foo = observable
                .SubscribeOn(Scheduler.Default) //Run the tasks on the threadpool
                .ToList()
                .First();
    Console.WriteLine(foo);
}

首先,我不明白您为什么要在这里使用PLINQ。列举一个Task的列表应该不会花很长时间,所以我认为你不会从并行化中获得任何好处

现在,要获得已经用true完成的第一个Task,可以使用(非阻塞)IsCompleted属性:

var task = tasks.FirstOrDefault(t => t.IsCompleted && t.Result);

如果您想获得按完成顺序排列的Task的集合,请参阅Stephen Toub的文章在任务完成时处理任务。如果要首先列出返回true的代码,则需要修改该代码。如果您不想修改它,可以使用Stephen Cleary的AsyncEx库中的此方法版本。


此外,在您问题中的特定情况下,您可以通过将.WithMergeOptions(ParallelMergeOptions.NotBuffered)添加到PLINQ查询来"修复"代码。但是这样做仍然在大多数时候都不起作用,并且即使在起作用的时候也会浪费很多线程。这是因为PLINQ使用恒定数量的线程,分区和使用Result在大多数时候会阻塞这些线程。