影刀RPA新手教程：Excel公式与数据验证完全指南——VLOOKUP、条件格式、数据有效性自动化

原创于 2026-06-27 16:38:01 发布 · 85 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

收录于

影刀RPA新手教程

影刀RPA新手教程：Excel公式与数据验证完全指南——VLOOKUP、条件格式、数据有效性自动化

本文作者：林焱 | 转载请注明出处

开篇案例：用VLOOKUP把两个表合在一起，结果对不上

前几个月帮财务部门做一个RPA，需求是：把"订单表"和"退款表"按订单号关联，找出已退款的订单。

我想当然地在Excel里用了VLOOKUP：

=VLOOKUP(A2,退款表!A:B,2,FALSE)

跑出来结果，有200多个订单显示 #N/A。

我仔细检查，发现订单号在订单表里是文本格式（前面有个不可见字符），在退款表里是数字格式。

VLOOKUP要求两个表的关联字段格式一致，否则匹配不上。

这个问题花了我半天时间排查。

从此以后，凡是涉及Excel表关联的RPA流程，我都会在关联前先统一格式。

本文所有案例，围绕"财务订单与退款数据核对"这条真实业务线展开。

在这里插入图片描述

模块一：安装与准备工作

影刀RPA操作Excel，有两种方式。

方式一：用影刀自带的Excel指令

指令面板里搜索"Excel"，可以看到：打开/关闭工作簿、读取/写入单元格、插入行列等。

优点是：不需要安装Excel，影刀自带的处理引擎可以直接读写xlsx文件。

缺点是：不支持某些高级功能（如条件格式、数据验证的详细配置）。

方式二：用Python的openpyxl库

安装：pip install openpyxl

优点：功能完整，支持公式、条件格式、数据验证等所有Excel特性。

缺点：需要安装库，且复杂操作代码量较大。

建议：简单读写用影刀自带指令，涉及公式和数据验证用openpyxl。

环境配置教程在 home.linyan.cloud 有详细图文。

在这里插入图片描述

新建流程，命名为"Excel公式与验证Demo"。

模块二：元素定位（从网页导出Excel）

很多场景下，Excel文件是从网页导出的。

先用网页自动化把文件下载到本地，再用Excel指令处理。

检查文件下载完成的可靠方法

import os
import time

def wait_download_complete(filepath, timeout=60):
    """
    等待文件下载完成（检查文件大小是否稳定）
    """
    last_size = -1
    for i in range(timeout):
        if not os.path.exists(filepath):
            time.sleep(1)
            continue
        current_size = os.path.getsize(filepath)
        if current_size == last_size and current_size > 0:
            return True
        last_size = current_size
        time.sleep(1)
    return False

拼多多店群自动化上架方案

模块三：变量与数据类型（Excel里的数据类型陷阱）

Excel单元格的数据类型，经常和你看到的不一样。

陷阱一：数字存成了文本

在Excel里，数字左对齐是文本，右对齐是数字。

在这里插入图片描述

但用影刀读取时，文本类型的数字会被读成字符串。

订单号：13812345678（文本）-> 读取后是 "13812345678"（字符串）
订单号：13812345678（数字）-> 读取后是 13812345678（整数）

如果两份数据的同一列，一个是文本一个是数字，关联时会匹配失败。

陷阱二：日期格式

Excel里的日期，读取后可能是字符串（“2024-06-01”），也可能是浮点数（45474，这是Excel的日期序列号）。

用Python处理时：

import datetime

def excel_date_to_py(excel_date):
    """
    把Excel日期序列号转成Python日期
    """
    if isinstance(excel_date, (int, float)):
        # Excel的日期从1899-12-30开始算
        base = datetime.datetime(1899, 12, 30)
        return base + datetime.timedelta(days=int(excel_date))
    elif isinstance(excel_date, str):
        return datetime.datetime.strptime(excel_date, "%Y-%m-%d")
    else:
        return excel_date

模块四：流程控制（Excel处理的标准流程）

处理Excel的标准流程：

1. 打开工作簿
2. 读取数据（全部或指定范围）
3. 数据清洗（格式统一、去空行）
4. 写入公式或数据验证
5. 保存并关闭

在影刀里，步骤1、2、5用Excel指令，步骤3、4根据复杂度选择用指令还是Python代码。

在这里插入图片描述

模块五：网页自动化（结合Excel操作）

从网页导出的Excel，有时候格式不规范（比如合并单元格、多余的空行）。

用影刀的网页自动化重新导出，或者导出后用openpyxl处理合并单元格：

from openpyxl import load_workbook

def unmerge_cells(wb_path, sheet_name=None):
    """
    取消所有合并单元格，并把值填充到每个单元格
    """
    wb = load_workbook(wb_path)
    ws = wb[sheet_name] if sheet_name else wb.active
    
    # 获取所有合并单元格的范围
    merged_ranges = list(ws.merged_cells.ranges)
    
    for merged_range in merged_ranges:
        # 获取合并单元格的值（在左上角单元格）
        top_left = ws.cell(merged_range.min_row, merged_range.min_column)
        value = top_left.value
        
        # 把值填到每个单元格
        for row in range(merged_range.min_row, merged_range.max_row + 1):
            for col in range(merged_range.min_column, merged_range.max_column + 1):
                ws.cell(row, col).value = value
        
        # 取消合并
        ws.unmerge_cells(str(merged_range))
    
    wb.save(wb_path)
    print("已取消所有合并单元格")

模块六：数据处理——VLOOKUP公式写入

用openpyxl在Excel里写入VLOOKUP公式：

from openpyxl import load_workbook

def write_vlookup(wb_path, sheet_name, output_col, lookup_range, result_col_idx):
    """
    写入VLOOKUP公式
    output_col: 公式要写入的列（如 "D"）
    lookup_range: 查找范围（如 "退款表!A:B"）
    result_col_idx: 返回第几列（从1开始）
    """
    wb = load_workbook(wb_path)
    ws = wb[sheet_name]
    
    # 假设A列是要查找的值，从第2行开始
    for row in range(2, ws.max_row + 1):
        lookup_value = f"A{row}"
        formula = f'=VLOOKUP({lookup_value},{lookup_range},{result_col_idx},FALSE)'
        ws[f"{output_col}{row}"].value = formula
    
    wb.save(wb_path)
    print(f"已写入VLOOKUP公式，共{ws.max_row - 1}行")

VLOOKUP的常见错误

错误	原因	解决方案
#N/A	找不到匹配值	检查格式是否一致，是否有多余空格
#REF!	引用范围不存在	检查sheet名和范围是否正确
#VALUE!	参数类型错误	检查result_col_idx是否是数字
匹配到错误的值	没加FALSE参数	VLOOKUP第4个参数必须是FALSE（精确匹配）

模块七：数据处理——条件格式自动化

用openpyxl设置条件格式，比如"金额大于1000的单元格标红"：

在这里插入图片描述

from openpyxl import load_workbook
from openpyxl.formatting.rule import CellIsRule
from openpyxl.styles import PatternFill

def apply_conditional_format(wb_path, sheet_name, range_addr):
    """
    设置条件格式：金额>1000标红，<0标黄
    """
    wb = load_workbook(wb_path)
    ws = wb[sheet_name]
    
    # 定义颜色
    red_fill = PatternFill(start_color="FFCCCC", end_color="FFCCCC", fill_type="solid")
    yellow_fill = PatternFill(start_color="FFFFCC", end_color="FFFFCC", fill_type="solid")
    
    # 大于1000标红
    ws.conditional_formatting.add(
        range_addr,
        CellIsRule(operator="greaterThan", formula=["1000"], fill=red_fill)
    )
    
    # 小于0标黄
    ws.conditional_formatting.add(
        range_addr,
        CellIsRule(operator="lessThan", formula=["0"], fill=yellow_fill)
    )
    
    wb.save(wb_path)
    print("条件格式设置完成")

用影刀指令设置条件格式（简单场景）

在影刀指令面板搜索"设置条件格式"，可以可视化配置，不需要写代码。

但影刀指令的功能有限，复杂的多条件格式还是要用openpyxl。

模块八：数据处理——数据有效性（下拉列表）

数据有效性可以让用户只能输入规定范围内的值，防止脏数据。

用openpyxl设置下拉列表：

from openpyxl import load_workbook
from openpyxl.worksheet.datavalidation import DataValidation

def set_dropdown_validation(wb_path, sheet_name, col_letter, values):
    """
    设置下拉列表数据有效性
    col_letter: 要设置的列（如 "C"）
    values: 下拉选项列表（如 ["待处理", "已处理", "已取消"]）
    """
    wb = load_workbook(wb_path)
    ws = wb[sheet_name]
    
    # 创建数据有效性规则
    dv = DataValidation(
        type="list",
        formula1=f'{"{" + ",".join(values) + "}"}',  # Excel的下拉列表公式格式
        allow_blank=True
    )
    
    # 应用到整列（从第2行开始，跳过表头）
    dv.add(f"{col_letter}2:{col_letter}10000")
    
    ws.add_data_validation(dv)
    wb.save(wb_path)
    print(f"已设置{col_letter}列的下拉列表：{values}")

数据有效性的其他类型

# 限制只能输入数字
dv_number = DataValidation(type="whole", operator="between", formula1="1", formula2="99999")

# 限制只能输入日期
dv_date = DataValidation(type="date", operator="greaterThan", formula1="2024-01-01")

# 限制文本长度
dv_text = DataValidation(type="textLength", operator="lessThanOrEqual", formula1="50")

模块九：鼠标键盘与图像操作（Excel文件密码破解）

在这里插入图片描述

有些Excel文件有密码保护，影刀无法直接打开。

如果是"打开密码"（文件级加密），需要用专门工具解除。

如果是"工作表保护密码"（可以打开，但不能编辑），可以用以下方法解除：

from openpyxl import load_workbook

def remove_sheet_password(wb_path, output_path):
    """
    移除工作表保护密码（只适用于弱保护，强加密无效）
    """
    wb = load_workbook(wb_path)
    
    for ws in wb.worksheets:
        ws.protection.sheet = False  # 尝试直接设为False
    
    wb.save(output_path)
    print(f"已保存无密码版本到：{output_path}")

如果上面方法不行，说明密码较强，需要用专业的密码恢复工具。

模块十：进阶技能

技能一：用Python做VLOOKUP（比Excel公式快）

当数据量超过5万行时，Excel的VLOOKUP很慢。

用Python的字典做关联，速度提升100倍：

import pandas as pd

def vlookup_with_pandas(orders_path, refunds_path, output_path):
    """
    用Pandas做VLOOKUP
    """
    orders = pd.read_excel(orders_path)
    refunds = pd.read_excel(refunds_path)
    
    # 用merge做关联（类似SQL的JOIN）
    result = pd.merge(
        orders,
        refunds,
        on="order_id",       # 关联字段
        how="left",          # 左关联（保留所有订单）
        suffixes=("", "_refund")
    )
    
    result.to_excel(output_path, index=False)
    print(f"关联完成，结果保存到：{output_path}")

技能二：动态公式（根据数据行数自动扩展）

写入公式时，不要写死行数，用 ws.max_row 动态获取：

在这里插入图片描述

from openpyxl import load_workbook

def write_dynamic_formula(wb_path, sheet_name):
    wb = load_workbook(wb_path)
    ws = wb[sheet_name]
    
    max_row = ws.max_row
    print(f"共{max_row - 1}行数据")
    
    # 写入求和公式（动态范围）
    total_cell = ws.cell(max_row + 1, 4)  # 在最后一行后面写总计
    total_cell.value = f"=SUM(D2:D{max_row})"
    total_cell.font = total_cell.font.copy(bold=True)
    
    wb.save(wb_path)

技能三：保护工作表（防止公式被改）

from openpyxl import load_workbook

def protect_sheet(wb_path, sheet_name, password):
    """
    保护工作表，隐藏公式
    """
    wb = load_workbook(wb_path)
    ws = wb[sheet_name]
    
    # 先把要隐藏公式的单元格设为"隐藏"
    for row in ws.iter_rows():
        for cell in row:
            if cell.value and str(cell.value).startswith("="):
                cell.protection = cell.protection.copy(hidden=True)
    
    # 保护工作表
    ws.protection.password = password
    ws.protection.enable()
    
    wb.save(wb_path)
    print("工作表已保护，公式已隐藏")

模块十一：平台实战

把Excel处理流程部署到影刀控制台时，注意以下几点。

要点一：Excel文件用绝对路径

影刀控制台执行流程时，当前目录可能不是流程文件所在目录。

所有Excel文件路径用绝对路径，或者用配置变量管理。

TEMU店群如何管理运营？

要点二：处理完成的Excel自动发邮件

# 伪代码：用影刀的"发送邮件"指令
# 把处理完成的Excel作为附件发送
email_content = f"""
Excel处理完成
文件：{output_path}
处理行数：{row_count}
"""
# 在影刀里配置邮件服务器，发送附件

要点三：用任务监控查看Excel处理异常

在这里插入图片描述

如果Excel公式里有 #N/A 或 #REF!，说明数据有问题。

可以在流程里用Python检查处理结果，把有错误的行写到另一个文件：

from openpyxl import load_workbook

def check_excel_errors(wb_path, sheet_name):
    """
    检查Excel里的错误值
    """
    wb = load_workbook(wb_path)
    ws = wb[sheet_name]
    
    errors = []
    for row in range(2, ws.max_row + 1):
        for col in range(1, ws.max_column + 1):
            cell_value = ws.cell(row, col).value
            if isinstance(cell_value, str) and cell_value.startswith("#"):
                errors.append((row, col, cell_value))
    
    return errors

模块十二：系统联动与工程化规范

工程化规范一：Excel模板单独管理

不要把数据直接写到新Excel里。

创建一个模板Excel（包含表头、公式、条件格式、数据有效性），每次处理时先复制模板，再往里填数据。

import shutil

def process_with_template(template_path, output_path, data):
    """
    用模板处理Excel
    """
    # 复制模板
    shutil.copy(template_path, output_path)
    
    # 打开复制后的文件，填数据
    wb = load_workbook(output_path)
    ws = wb.active
    
    for i, row_data in enumerate(data, start=2):  # 从第2行开始（第1行是表头）
        for j, value in enumerate(row_data, start=1):
            ws.cell(i, j).value = value
    
    wb.save(output_path)
    print(f"已用模板生成文件：{output_path}")

工程化规范二：Excel操作日志

每次操作Excel，记录日志：

import logging
from datetime import datetime

def log_excel_operation(operation, filepath, row_count):
    logger = logging.getLogger("excel_ops")
    logger.info(f"{datetime.now()} | {operation} | {filepath} | {row_count}行")

在这里插入图片描述

速查表：Excel公式与RPA对应

Excel操作	影刀指令	Python库
打开工作簿	打开Excel工作簿	openpyxl.load_workbook
读取单元格	读取Excel单元格	ws.cell(row, col).value
写入单元格	写入Excel单元格	ws.cell(row, col).value = x
VLOOKUP	写入公式	ws.cell().value = “=VLOOKUP(…)”
条件格式	设置条件格式	ws.conditional_formatting.add
数据验证	（用Python）	DataValidation

报错排查指南

报错：ValueError: Cannot convert {…} to Excel

原因：尝试把Python的set或复杂对象写入Excel单元格。

解决：把值转成字符串或数字再写入。

报错：公式在Excel里显示的是文本，不是计算结果

原因：用 ws.cell().value = "=SUM(A1:A10)" 写入公式后，Excel默认不自动计算。

解决：在Excel里按F9刷新，或者在openpyxl里设置 wb.calculation = True（部分版本支持）。

总结

Excel公式和数据验证自动化的核心：关联前先统一格式、大量数据用Pandas不用VLOOKUP、重要文件用模板不用从头创建。

在这里插入图片描述

把这三个原则记住，Excel自动化就不会再踩坑。

更多Excel高级技巧，访问 home.linyan.cloud 获取完整教程。

#影刀RPA #RPA教程 #Excel自动化 #VLOOKUP #数据验证

作者：林焱

标签

#爬虫自动化 #办公自动化 #拼多多运营工具 #电商自动化 #电商运营