c# – 如何有效地使用大数据集中LINQ并行中的子句或选择

前端之家收集整理的这篇文章主要介绍了c# – 如何有效地使用大数据集中LINQ并行中的子句或选择前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有大约250,000条记录标记为Boss,每个Boss有2到10名职员.我每天都需要了解员工的详细信息.大约有1,000,000名员工.我正在使用 Linq获取每日工作人员的唯一列表.考虑以下C#LINQ和模型
  1. void Main()
  2. {
  3.  
  4. List<Boss> BossList = new List<Boss>()
  5. {
  6. new Boss()
  7. {
  8. EmpID = 101,Name = "Harry",Department = "Development",Gender = "Male",Employees = new List<Person>()
  9. {
  10. new Person() {EmpID = 102,Name = "Peter",Gender = "Male"},new Person() {EmpID = 103,Name = "Emma Watson",Gender = "Female"},}
  11. },new Boss()
  12. {
  13. EmpID = 104,Name = "Raj",Employees = new List<Person>()
  14. {
  15. new Person() {EmpID = 105,Name = "Kaliya",..... ~ 250,000 Records ......
  16.  
  17. };
  18.  
  19. List<Person> staffList = BossList
  20. .SelectMany(x =>
  21. new[] { new Person { Name = x.Name,Department = x.Department,Gender = x.Gender,EmpID = x.EmpID } }
  22. .Concat(x.Employees))
  23. .GroupBy(x => x.EmpID) //Group by employee ID
  24. .Select(g => g.First()) //And select a single instance for each unique employee
  25. .ToList();
  26. }
  27.  
  28. public class Person
  29. {
  30. public int EmpID { get; set; }
  31. public string Name { get; set; }
  32. public string Department { get; set; }
  33. public string Gender { get; set; }
  34. }
  35.  
  36. public class Boss
  37. {
  38. public int EmpID { get; set; }
  39. public string Name { get; set; }
  40. public string Department { get; set; }
  41. public string Gender { get; set; }
  42. public List<Person> Employees { get; set; }
  43. }

在上面的LINQ中我得到了不同员工或员工名单,该列表包含超过1,000条记录.从获得的列表中我需要搜索“Raj”

  1. staffList.Where(m => m.Name.ToLowerInvariant().Contains("Raj".ToLowerInvariant()));

对于此操作,获得结果需要3到5分钟.

我怎么能让它更有效率.请帮助我……

解决方法

如果你改变Boss继承Person(公共类Boss:Person),你不仅不需要在Person和Boss中复制你的属性,你不必为每个Boss创建所有新的Person实例,因为Boss已经是一个人:
  1. IEnumerable<Person> staff = BossList
  2. .Concat(BossList
  3. .SelectMany(x => x.Employees)
  4. )
  5. .DistinctBy(p => p.EmpId)
  6. .ToList()

DistinctByis定义为

  1. public static IEnumerable<TSource> DistinctBy<TSource,TKey>
  2. (this IEnumerable<TSource> source,Func<TSource,TKey> keySelector)
  3. {
  4. var seenKeys = new HashSet<TKey>();
  5. foreach (TSource element in source)
  6. {
  7. if (seenKeys.Add(keySelector(element)))
  8. {
  9. yield return element;
  10. }
  11. }
  12. }

此外,在您的比较中,您将每个Name转换为小写并进行比较 – 这是您不需要的大量字符串创建.相反,尝试类似的东西

  1. staffList.Where(m => m.Name.Equals("Raj",StringComparison.InvariantCultureIgnoreCase));

此外,请注意,您对Contains的使用也会与Rajamussen和mirajii等名称相匹配 – 可能不是您所期望的.

猜你在找的C#相关文章