
本文介绍如何利用 Java 8 Stream API,从对象列表中完整提取所有重复项(而非仅去重或保留单个副本),以 City::name 为判重依据,返回包含全部重复实例的扁平化列表。
本文介绍如何利用 Java 8 Stream API,从对象列表中完整提取所有重复项(而非仅去重或保留单个副本),以 `City::name` 为判重依据,返回包含全部重复实例的扁平化列表。
在实际开发中,我们常需识别并收集“完全重复”的对象——但注意:此处的“重复”并非指对象内存地址或全字段相等,而是依据某个业务属性(如 City.name)判定逻辑重复。关键需求是:保留所有重复出现的原始对象实例,且每个重复组中每个元素都应被纳入结果。例如,“Lisboa”出现 3 次,则结果列表中应包含全部 3 个 City("Lisboa", ...) 对象。
实现该目标的核心思路是两阶段流式处理:
- 分组聚合:按 City::getName 将原始列表归类,生成 Map<String, List<City>>;
- 筛选+展平:过滤出长度 > 1 的分组(即存在重复的名称),再用 flatMap(List::stream) 将所有子列表合并为单一流。
以下是完整、可运行的解决方案:
import java.util.*;
import java.util.stream.Collectors;
// … City 类定义(同题中所示)…
public class Main {
public static void main(String[] args) {
List<City> portugalCities = List.of(
new City("Lisboa", "Estremadura", 2275591),
new City("Lisboa", "Estremadura", 2275591),
new City("Faro", "Algarve", 67650),
new City("Braga", "Minho", 193324),
new City("Braga", "Esposende", 193324),
new City("Braga", "Fafe", 193324),
new City("Alentejo", "Ribatejo", 704533),
new City("Viseu", "Beira Alta", 99561),
new City("Lisboa", "Alenquer", 2275591),
new City("Guarda", "Almeida", 143019),
new City("Guarda", "Aguiar da Beira", 143019)
);
// ✅ 核心逻辑:获取所有 name 重复的 City 实例(含全部副本)
List<City> duplicates = portugalCities.stream()
.collect(Collectors.groupingBy(City::getName)) // 分组:name → [City...]
.values().stream() // 提取所有分组(List<City> 集合)
.filter(list -> list.size() > 1) // 仅保留重复组(size ≥ 2)
.flatMap(List::stream) // 展平为单一流
.toList(); // 收集为不可变列表
// 输出验证
duplicates.forEach(System.out::println);
// 输出共 8 个对象:Lisboa×3 + Braga×3 + Guarda×2
}
}? 注意事项与最佳实践:
- Collectors.groupingBy() 是本方案基石,它天然支持按任意属性分组,且保持原始对象引用,无需修改 City 的 equals/hashCode(除非你另有全字段去重需求);
- flatMap(List::stream) 是关键一步——它确保不是返回 [ [c1,c2], [c3,c4,c5] ] 这样的嵌套结构,而是 c1,c2,c3,c4,c5 的线性序列;
- 若需兼容 Java 16 以下版本,请将 .toList() 替换为 .collect(Collectors.toList());
- 此方案时间复杂度为 O(n),空间复杂度为 O(n),符合流式处理预期;虽有中间 Map,但这是逻辑必需——无法仅靠一次遍历完成重复识别(因重复性需全局统计)。
总结:当需求明确为“取出所有重复项的完整副本”时,分组→筛选→展平三步法是最清晰、高效且符合函数式风格的 Stream 解决方案。