当前位置:首页 > 数据库 > 正文

怎么在excel表格中查找重复数据库

在Excel中,可通过【数据】-【删除重复项】快速定位重复数据;或用条件格式高亮重复项(开始-条件格式-突出显示单元格规则-重复值

基础准备与核心概念

明确目标范围

  1. 确定查找维度:判断是基于单列(如身份证号)还是多列组合(姓名+手机号)进行查重。
  2. 区分大小写/空格:默认情况下Excel会忽略前后空格且不区分大小写,若需严格匹配需提前统一格式。
  3. 样本测试建议:先用少量数据验证方法有效性,再应用于全表。

主流查重方法详解

方法1:条件格式快速标记重复值(可视化首选)

步骤 操作描述 关键细节
选中目标区域(含标题行) 若仅查某列,直接选该列;多列联合查重需先合并为文本
【开始】→【条件格式】→【突出显示单元格规则】→【重复值】 默认填充浅红色背景+深红色文字
按需调整格式样式 可自定义颜色/字体效果
️注意 此方法仅标记完全重复的整行,无法区分局部重复 如需跨列组合查重,需先用&连接多列(例:=A2&B2)

适用场景:快速肉眼识别重复行,适合数据量<1万行的简单场景。

方法2:COUNTIF函数量化重复次数(精准计数)

=COUNTIF($A$2:$A$100, A2) > 1
  • 公式解析$A$2:$A$100为绝对引用区间,A2为相对引用当前单元格
  • 返回结果:TRUE表示重复,FALSE表示唯一
  • 扩展应用:嵌套IF函数实现分级标注:
    =IF(COUNTIF($A$2:$A$100, A2)>1, "重复", "唯一")

进阶技巧:结合排序功能将重复项集中显示:

  1. 插入辅助列输入上述公式
  2. 按辅助列降序排列,所有重复项自动相邻
  3. 配合筛选功能批量处理

方法3:数据透视表多维分析(大数据优选)

操作步骤 功能说明
选中数据区域 → 【插入】→【数据透视表】
将需查重的字段拖入「行」区域
将同一字段再次拖入「值」区域(设置为计数)
右键点击值字段 → 【值字段设置】→ 选择「计数」
筛选计数>1的项目即为重复项

优势对比:可同时展示各值出现次数,支持动态更新,适合超10万行数据的快速统计。

方法4:高级筛选提取唯一/重复记录

  1. 提取唯一记录
    • 【数据】→【高级】→ 选择「将筛选结果复制到其他位置」
    • 勾选「唯一记录」→ 指定目标位置
  2. 提取重复记录

    同路径下选择「重复记录」→ 自动生成包含所有重复行的副本

    怎么在excel表格中查找重复数据库  第1张

注意事项:该方法会破坏原始数据顺序,建议先复制工作表再操作。

方法5:Power Query智能去重(动态数据流处理)

  1. 【数据】→【来自表格/区域】加载数据至Power Query编辑器
  2. 选择需要查重的列 → 【转换】→【分组依据】
  3. 设置新列名为”计数”,操作选「对所有行进行计数」
  4. 添加自定义列判断是否重复:if [计数] > 1 then "重复" else "唯一"
  5. 点击【关闭并上载】返回Excel,得到带标记的新表

核心优势:支持实时刷新,当源数据变更时自动更新查重结果。


特殊场景解决方案

场景1:多列组合查重(如姓名+电话相同视为重复)

  1. 新增辅助列:=A2&B2&C2(合并关键字段)
  2. 对辅助列应用COUNTIF函数或条件格式
  3. 完成后可隐藏辅助列保持界面整洁

场景2:跨工作表/工作簿查重

修改COUNTIF公式范围为跨表引用:

=COUNTIF(INDIRECT("Sheet2!A:A"), A2)>1

或通过【数据】→【合并计算】实现多表联合查重。


常见错误排查

现象 原因 解决方案
明明有重复却未标记 存在不可见字符(空格/换行符) 使用TRIM()函数清理数据
公式返回#VALUE! 引用区域包含空值 改用COUNTIFS并指定非空条件
数据透视表无结果 字段未正确拖放 检查行/值区域的字段设置

实战案例演示

假设有如下销售数据表(A列为产品编码):
| 序号 | 产品编码 | 销售员 | 金额 |
|——|———-|——–|——|
| 1 | P001 | 张三 | 500 |
| 2 | P002 | 李四 | 300 |
| 3 | P001 | 王五 | 450 |
| 4 | P003 | 赵六 | 600 |
| 5 | P001 | 陈七 | 700 |

操作流程

  1. 在D列输入公式:=COUNTIF($B$2:$B$6, B2)
  2. 向下填充公式得到各产品的销售次数
  3. 筛选D列>1的记录,即可找出P001的三次销售记录
  4. 若需高亮显示,对B列应用条件格式设置重复值警告色

FAQs

Q1: 如何查找两列数据中的共同重复项?(如比较A列和B列的交集)

:使用以下任一方法:

  • 公式法=MATCH(A2, B:B, 0) 返回数字则为重复,#N/A表示不重复
  • 条件格式法:分别对A列和B列设置相同的条件格式规则,重叠变色区域即为公共重复项
  • 高级筛选法:将A列和B列分别复制到新表,使用【数据】→【合并计算】→求交集

Q2: 如何在保留第一个重复项的同时删除后续重复行?

:采用辅助列+排序+删除三步法:

  1. 在E列输入公式:=COUNTIF($B$2:B2, B2)(随滚动窗口扩大范围)
  2. 按E列升序排序,使首次出现的记录排在最前
  3. 筛选E列>1的记录并删除,保留E列为1的原始记录
  4. 最后清除E列的辅助公式

通过以上方法组合使用,您可以灵活应对各种查重需求,建议根据数据量级(<1万行/>1万行)选择合适的方法,对于频繁更新的数据推荐使用Power Query建立动态查询

0