IT俱乐部 ASP.NET .NET高效实现List集合去重的多种方法详解

.NET高效实现List集合去重的多种方法详解

在 .NET 开发中,处理集合数据时经常会遇到需要对 List 进行去重的场景。无论是基本类型(如 intstring)还是自定义对象,.NET 提供了多种简洁高效的去重方式。本文将系统介绍几种常用且性能良好的去重方法,并对比其适用场景。

一、使用 LINQ 的 Distinct() 方法(最常用)

LINQ 提供了最简洁的去重方式:Distinct() 扩展方法。

1. 基本类型去重

var numbers = new List { 1, 2, 2, 3, 4, 4, 5 };
var uniqueNumbers = numbers.Distinct().ToList();
// 结果: [1, 2, 3, 4, 5]

2. 自定义对象去重(需实现 IEqualityComparer 或重写 Equals/GetHashCode)

若直接对自定义类调用 Distinct(),默认比较的是引用(除非重写了 EqualsGetHashCode)。

方式 A:重写 Equals 和 GetHashCode

public class Person
{
    public string Name { get; set; }
    public int Age { get; set; }

    public override bool Equals(object obj) => obj is Person p && Name == p.Name && Age == p.Age;
    public override int GetHashCode() => HashCode.Combine(Name, Age);
}

var people = new List
{
    new Person { Name = "Alice", Age = 30 },
    new Person { Name = "Alice", Age = 30 },
    new Person { Name = "Bob", Age = 25 }
};

var uniquePeople = people.Distinct().ToList(); // 自动去重

方式 B:使用自定义 IEqualityComparer

public class PersonNameComparer : IEqualityComparer
{
    public bool Equals(Person x, Person y) => x?.Name == y?.Name;
    public int GetHashCode(Person obj) => obj?.Name?.GetHashCode() ?? 0;
}

var uniqueByName = people.Distinct(new PersonNameComparer()).ToList();

二、使用 HashSet(高性能推荐)

HashSet 天然具有去重特性,插入时自动忽略重复项,性能优于 Distinct()(尤其在大数据量时)。

var numbers = new List { 1, 2, 2, 3, 4, 4, 5 };
var uniqueNumbers = new HashSet(numbers).ToList();

对于自定义对象,同样需要提供合适的 IEqualityComparer

var uniquePeople = new HashSet(people, new PersonNameComparer()).ToList();

优点:时间复杂度接近 O(n),适合频繁去重或大数据集。

注意HashSet 不保证元素顺序(但 .NET Core 6+ 的 HashSet 在某些情况下保持插入顺序,不建议依赖此行为)。

三、使用 ToLookup / GroupBy(按条件去重)

如果需要“保留第一个出现的元素”并按特定字段去重,可结合 GroupBy

var uniquePeople = people
    .GroupBy(p => p.Name)
    .Select(g => g.First())
    .ToList();

这种方式灵活,适用于复杂去重逻辑(如保留最新记录、按多个字段分组等)。

四、.NET 6+ 新特性:DistinctBy()

从 .NET 6 开始,LINQ 新增了 DistinctBy() 方法,无需实现比较器即可按属性去重:

var uniquePeople = people.DistinctBy(p => p.Name).ToList();
// 或按多个属性
var uniqueByBoth = people.DistinctBy(p => new { p.Name, p.Age }).ToList();

强烈推荐:代码简洁、语义清晰、性能良好,是现代 .NET 项目的首选方案。

五、性能与选型建议

方法 适用场景 是否保序 性能 .NET 版本要求
Distinct() 简单去重,已重写 Equals/GetHashCode 中等 所有版本
HashSet 大数据量、高频去重 否(通常) 所有版本
GroupBy + First 按条件去重、需控制保留逻辑 中等 所有版本
DistinctBy() 按属性去重、代码简洁 .NET 6+

总结

对于 基本类型,直接使用 Distinct() 即可。

对于 自定义对象

  • 若使用 .NET 6 及以上,优先使用 DistinctBy()
  • 若需兼容旧版本,可选择 GroupBy 或实现 IEqualityComparer
  • 若追求极致性能且不关心顺序,使用 HashSet

合理选择去重方式,不仅能提升代码可读性,还能显著优化程序性能。希望本文能帮助你在 .NET 项目中高效处理集合去重问题!

到此这篇关于.NET高效实现List集合去重的多种方法详解的文章就介绍到这了,更多相关.NET List集合去重内容请搜索IT俱乐部以前的文章或继续浏览下面的相关文章希望大家以后多多支持IT俱乐部!

本文收集自网络,不代表IT俱乐部立场,转载请注明出处。https://www.2it.club/code/asp-net/17887.html
上一篇
下一篇
联系我们

联系我们

在线咨询: QQ交谈

邮箱: 1120393934@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部