xlsx
Excel/CSV 读写、数据清洗、公式、图表、财务建模。
评分明细
适用场景
anthropic-xlsx 快速入门
Anthropic 官方 Excel Skill,基于 openpyxl + pandas,支持数据清洗、公式重算、图表生成、财务建模。
这是什么?解决什么问题?
anthropic-xlsx 是 Anthropic 在 anthropics/skills 仓库中维护的电子表格处理 Skill,基于 openpyxl + pandas 协同。它能做的不止是”读 Excel”,还包括:复杂公式写入与重算(LibreOffice 兜底)、数据透视、条件格式、图表(柱/折线/饼/散点)、多 sheet 联动、CSV 互转、财务建模(三表模型、DCF、敏感性分析)。
对小白来说,这个 Skill 把”AI 算账”从一句空话变成真活。你说”帮我做一份 5 年 DCF 模型,WACC 8%,营收增长率前三年 30% 后两年 15%“,AI 直接出 .xlsx,公式全写好,改一个变量所有数字自动重算。
准备工作
- 支持 Agent:Claude Code(主推)、支持 Skills 协议的 Agent。
- 运行环境:Python 3.10+;
pip install openpyxl pandas。 - 可选工具:LibreOffice(用于公式重算与 PDF 预览);matplotlib(图表可视化)。
- 目标场景:财务模型、数据清洗报表、销售跟踪、库存管理、HR 数据。
3 步快速上手
第 1 步:安装依赖
pip install openpyxl pandas
# 公式重算需要 LibreOffice
brew install --cask libreoffice # macOS
# 或
apt-get install libreoffice # Ubuntu
克隆 Skill:
git clone https://github.com/anthropics/skills.git
cp -r skills/xlsx ~/.claude/skills/
第 2 步:在 Claude Code 中发起任务
claude
发起任务:
请用 xlsx Skill 帮我做一份 5 年 DCF 模型:营收增速 30%/30%/20%/15%/10%,WACC 8%,永续增长率 3%。输出 .xlsx 文件。
AI 会写入公式(三表联动)、添加敏感性分析表、用 LibreOffice 重算。
第 3 步:验证与微调
# 转 PDF 看效果
libreoffice --headless --convert-to pdf dcf-model.xlsx
打开 Excel 检查公式是否正确,通常第一次跑通后再让 AI 微调格式。
常见踩坑
- 公式不自动重算:openpyxx 写入的公式是字符串,Excel/LibreOffice 打开时才会算。Skill 自动用 LibreOffice headless 跑一次,确保打开就是数字。
- VLOOKUP/XLOOKUP 错位:跨表引用时表名要加单引号,Skill 提示时务必按它给的格式。
- 大数据量卡顿:100 万行的 xlsx 用 openpyxl 写会很慢,Skill 会建议改用 pandas 直接写。
- 日期格式乱:openpyxl 写日期默认是 datetime 对象,需要显式
number_format='yyyy-mm-dd'。 - 中文表头变乱码:保存为 .xlsx(非 .xls)避免中文乱码,Skill 默认就是 .xlsx。
- 图表数据范围错:插入图表时如果数据有合并单元格,Skill 会主动展开,不需要手动处理。
初级用法
- CSV 转 Excel 报表:把脏 CSV 数据清洗、加表头、设条件格式,出干净 xlsx。
- 考勤/销售周报:把数据库导出的数据透视成周报,自动算同比环比。
- 预算跟踪表:多 sheet 联动(实际 vs 预算 vs 差异),公式自动算。
高级玩法
- DCF/估值模型:Skill 内置财务建模模板,可直接复用。
- 数据透视表自动生成:用 pandas groupby + openpyxl 写透视表。
- 敏感性与情景分析:多变量数据表(Data Table)、Monte Carlo 模拟。
小技巧
- 大量数据清洗用 pandas,小数据且需要格式美观用 openpyxl,Skill 会自动选型。
- 公式复杂时,在 prompt 里说明”用 LibreOffice 重算”,避免打开是空值。
- 图表用 matplotlib 生成 PNG 再插入,比 openpyxl 原生图表更精美。
- 关注 Excel 365 的新函数(XLOOKUP、LAMBDA),Skill 会跟进支持。
- 重要财务模型务必人工复核公式,AI 不替代专业判断。
常见问题 FAQ
Q1: 这个 Skill 跟 anthropic-xlsx 有什么关系?必须装吗?
A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。
Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?
A: anthropic-xlsx 来自 Anthropic,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。
Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?
A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。
Q4: 怎么验证 Skill 装对了?
A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。
Q5: 这个 Skill 有许可证吗?能商用吗?
A: 取决于 anthropic-xlsx 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。
进阶学习建议
如果想进一步用好 anthropic-xlsx,建议按以下路径学习:
第 1 周:熟练使用
- 完成 3 步快速上手,跑通第一个任务
- 试 2-3 个不同场景的真实任务
- 记录”哪些 prompt 有效、哪些没用”——形成自己的 prompt 笔记
第 2 周:理解机制
- 阅读 Skill 的官方文档(README、SKILL.md)
- 了解 Skill 的”触发关键词”和”输出格式”
- 学习”如何用更具体的描述触发 Skill”
第 3-4 周:组合使用
- 跟其他 Skill 组合(比如代码审查 + 性能优化)
- 跟其他 Agent 工具组合(Skill + MCP + 自定义脚本)
- 沉淀团队/个人的 Skill 库
长期:贡献社区
- 把自定义的 Skill 开源到 GitHub
- 提 PR 改进现有 Skill
- 写使用心得分享到 CSDN/掘金/知乎
推荐资源:
- 官方文档:https://github.com/anthropics/skills
- 官方仓库 README 里的 Examples
- 社区最佳实践:Anthropic 官方博客 https://www.anthropic.com/blog
- 国内社区:CSDN AI 板块、掘金 AI 板块
避免的坑:
- 不要装太多 Skill(超过 10 个会拖慢 Agent)
- 不要把 Skill 装在不兼容的 Agent 上
- 不要直接复制 Skill 默认 prompt——要根据项目调整
- 定期 review Skill 库的实用性,清理不用的
参考链接
- 官方仓库:https://github.com/anthropics/skills
- 该 Skill 目录:https://github.com/anthropics/skills/tree/main/skills/xlsx
- openpyxl 文档:https://openpyxl.readthedocs.io/
- pandas 文档:https://pandas.pydata.org/docs/
- LibreOffice:https://www.libreoffice.org/
- Excel 函数参考:https://support.microsoft.com/en-us/excel
Excel 在数据分析中的地位
即使进入”Python + pandas”时代,Excel 仍然是企业里最常用的数据分析工具——财务、HR、销售、运营都离不开它。Excel 的核心优势是”可被非技术人员编辑”,AI 直接生成 Python 脚本并不总能被业务方使用。
Anthropic 的 xlsx Skill 把 AI 的”语义理解”与 Excel 的”易编辑”特性结合:AI 写好公式、生成图表、设计好表格样式,产出的 .xlsx 文件直接发邮件给业务方,他们用 Excel/WPS 打开就能用。
最常见的应用场景:DCF/估值模型(三表联动)、月度销售报表(同比环比)、库存跟踪(条件格式高亮)、HR 薪酬表(多 sheet 联动)、学生成绩单(透视表)、小型 BI 报表等。
进一步阅读
- openpyxl 官方文档(https://openpyxl.readthedocs.io/) 详细讲 .xlsx 的 Python API。
- pandas 文档(https://pandas.pydata.org/docs/) 是数据清洗的瑞士军刀。
- LibreOffice(https://www.libreoffice.org/) 提供 headless 模式做公式重算与 PDF 转换。
- Excel 365 新函数参考(https://support.microsoft.com/en-us/excel) 讲 XLOOKUP、LAMBDA 等现代函数。
- 《Financial Modeling in Excel》(《Excel 金融建模》) 是金融建模的经典教材。
- CFI(https://corporatefinanceinstitute.com/) 提供大量免费财务建模教程。
- xlsxwriter(https://xlsxwriter.readthedocs.io/) 是另一个流行的 Python 写 Excel 库,功能与 openpyxl 互补。
实战建议
- CSV 转 Excel 报表:把脏 CSV 数据清洗、加表头、设条件格式,出干净 xlsx。
- 考勤/销售周报:把数据库导出的数据透视成周报,自动算同比环比。
- 预算跟踪表:多 sheet 联动(实际 vs 预算 vs 差异),公式自动算。
- DCF/估值模型:Skill 内置财务建模模板,可直接复用。
- 数据透视表自动生成:用 pandas groupby + openpyxl 写透视表。
- 敏感性与情景分析:多变量数据表(Data Table)、Monte Carlo 模拟。
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
xlsx Skill 多维度简评
来源:anthropics/skills(官方) 类别:文档处理 / 数据处理
一、核心定位与价值
xlsx + xlsx 数据分析师 是日常工作中仅次于 PDF 的高频需求。
不同于原生 Claude 经常输出 HTML 表格或 Python 脚本让你自己跑,装上 xlsx Skill 后,Claude 会直接输出真正的 .xlsx 文件——这是最大的差异。
二、核心能力清单
| 操作 | 实现 | 适用 |
|---|---|---|
| 读取/修改 | openpyxl + pandas | 财务报表、用户数据 |
| 添加列/公式 | openpyxl | 计算指标、自动汇总 |
| 数据清洗 | pandas | 去重、空值、格式统一 |
| 图表制作 | openpyxl + matplotlib | 趋势、对比、占比 |
| 格式转换 | openpyxl | .xlsx ↔ .csv ↔ .tsv |
| 条件格式 | openpyxl | 红绿黄、超标标红 |
| 透视表 | openpyxl | 多维度分析 |
| 财务建模 | openpyxl | DCF、IRR、敏感性分析 |
三、10 大实战场景
场景 1:预算跟踪表
帮我创建一份 2026 年部门预算跟踪表:
- 12 个月的分项预算列
- 实际支出 vs 预算的对比公式
- 自动计算偏差百分比
- 超出 10% 标红,低于 5% 标绿
- 按月汇总和全年累计
场景 2:项目进度跟踪
创建项目进度跟踪表:任务名/负责人/开始日期/截止日期/完成百分比/状态
用条件格式:逾期变红、本周截止变黄、已完成变绿
场景 3:财务建模 - DCF 估值
构建一个 DCF 估值模型:
- 5 年自由现金流预测
- 终值计算
- WACC 折现
- 敏感性分析(±20%)
场景 4:损益表
根据这份收支数据,生成带公式的损益表:
收入/成本/毛利/费用/净利,自动计算利润率
场景 5:数据清洗
这份 CSV 的日期格式不一致、有空值、有重复行,帮我清洗后保存
场景 6:月度分析报表
分析这份销售数据:
- 按月汇总
- 同比增长
- Top 10 客户
- 生成分析报表
场景 7:复杂查询
在这些数据中找出:
- 退货率超过 10% 的产品
- 连续 3 个月下滑的品类
场景 8:可视化趋势图
在这份数据中插入月度收入趋势柱状图,加趋势线
场景 9:饼图分析
按产品类别生成市场份额饼图,标注百分比
场景 10:批量处理
分析这个目录下所有 CSV:提取销售额列,按月分组,生成汇总报告
四、4 个关键技巧
1. 输出真实 .xlsx 文件
原生 Claude:经常输出 HTML 表格或 Python 脚本让你自己跑。 xlsx Skill:直接输出 .xlsx,可用 Excel 打开。
2. 公式 vs 数值的区分
# openpyxl 写入公式只是字符串
ws['B2'] = '=SUM(A1:A10)' # 字符串,不是计算结果
# 需要 LibreOffice 打开才会计算
# 或导出时强制重算
3. 冻结首行 + 条件格式
提示词示例:
保存为 .xlsx,第一行冻结,金额标红负值
4. 链式调用
1. 用 xlsx 做数据清洗和 KPI 计算,生成带图表的财务模型
2. 把关键图表嵌入 PPT,生成 8 页高管汇报幻灯片
3. 最后导出为加密 PDF 用于分发
五、SKILL.md 内部工作流
Anthropic xlsx Skill 的核心 prompt
You are a spreadsheet expert. When asked to work with .xlsx:
1. Use openpyxl for any cell/format/chart operation
2. Use pandas for data transformation (>1000 rows)
3. Write formulas as strings; user will recalculate in Excel
4. Default to A4 landscape, freeze first row, auto-width columns
5. Use conditional formatting for status indicators
6. Always preserve source data; never overwrite
选型逻辑
| 库 | 用于 | 不用它的情况 |
|---|---|---|
| openpyxl | 单元格、格式、图表、条件格式 | 超过 100MB 文件(用 pyxlsb) |
| pandas | 批量数据清洗、聚合、透视 | 单元格级格式 |
| matplotlib | 高级图表(热图、3D) | 简单柱状(用 openpyxl) |
| formulas | 解析已有公式 | 仅查看不修改 |
| pyxlsb | 二进制 .xlsb | 兼容性要求高时不用 |
关键设计:把”数据处理”(pandas)和”格式控制”(openpyxl)分离——前者快但丢格式,后者慢但保格式。
六、openpyxl vs xlsxwriter 选型
| 维度 | openpyxl | xlsxwriter | pandas + openpyxl |
|---|---|---|---|
| 读取 | 优秀 | 只能写 | 表现优秀 |
| 写入新文件 | 支持 | 更快 | 支持 |
| 修改现有 | 唯一选择 | 不支持 | 支持 |
| 公式 | 字符串 | 公式支持 | 仅基础 |
| 图表 | 基础 | 更丰富 | 需 matplotlib |
| 性能(大文件) | 慢 | 快 | 中 |
| 内存 | 较高 | 较低 | 高 |
最佳实践:
- 读取 + 修改: openpyxl 唯一选择
- 生成新文件: 大数据用 xlsxwriter,普通用 openpyxl
- 数据分析: pandas + openpyxl 组合
七、大数据处理(10 万+ 行)
# 慢(全加载)
wb = openpyxl.load_workbook("big.xlsx") # OOM 风险
# 用 read_only 模式
from openpyxl import load_workbook
wb = load_workbook("big.xlsx", read_only=True)
for row in wb.active.iter_rows(values_only=True):
process(row)
# 用 pandas(更快)
df = pd.read_excel("big.xlsx", engine="openpyxl")
for _, row in df.iterrows():
process(row)
# 流式写入
from openpyxl import Workbook
from openpyxl.cell import WriteOnlyCell
wb = Workbook(write_only=True)
ws = wb.create_sheet()
for row_data in huge_data:
row = []
for val in row_data:
cell = WriteOnlyCell(ws, value=val)
row.append(cell)
ws.append(row)
wb.save("output.xlsx")
八、公式自动重算
openpyxl 写入的公式是字符串, 不会自动计算。解决方案:
# 用 LibreOffice headless 模式
libreoffice --headless --calc --convert-to xlsx output.xlsx
# 重算并保存
# 用 formulas 库
import formulas
xl_model = formulas.ExcelModel().loads("output.xlsx").finish()
xl_model.calculate()
xl_model.write(dirpath="./calculated/")
九、限制与应对
| 限制 | 说明 |
|---|---|
| 复杂排版 | 合并单元格、条件格式可能丢失细节 |
| 大数据量 | 10 万+ 行建议用 Pandas 直接处理 |
| 公式不自动计算 | openpyxl 写的是字符串,需 LibreOffice 打开 |
| 旧版 .xls | 需先转 .xlsx |
十、安装
# Claude Code
/plugin install document-skills@anthropic-agent-skills
# 通用
npx skills add anthropics/skills --skill xlsx
十一、常见 Q&A 实战版
Q:100 万行怎么不卡死?
A:用 pandas 读 → 内存处理 → 用 openpyxl.writer.excel.WriteOnlyCell 流式写入。
Q:怎么让用户看到的公式是计算后的值?
A:要么用 LibreOffice headless 跑一遍 libreoffice --headless --convert-to xlsx 重算,要么用 formulas 库手动重算。
Q:图表标题中文乱码?
A:设置 matplotlib.rcParams['font.sans-serif'] = ['SimHei'] 或写入字体文件。
Q:怎么保护 Sheet 不被改?
A:ws.protection.sheet = True,加密码 ws.protection.password = 'xxx'。
Q:怎么加数据验证下拉?
A:from openpyxl.worksheet.datavalidation import DataValidation; dv = DataValidation(type="list", formula1='"A,B,C"'); ws.add_data_validation(dv); dv.add('A1:A10')。
十二、总结
xlsx Skill 是数据分析师、财务、运营的必备工具。
核心价值:
- 直接输出真实 Excel 文件
- 完整财务建模能力
- 数据清洗自动化
适用人群:所有人,特别是数据分析、财务、运营岗。
本文基于官方文档和公开资料整理,未经过 MagicNetWorld 实测。
参考资料
- anthropics/skills - xlsx Skill 源码 — GitHub 官方仓库
- openpyxl 官方文档 — Python Excel 操作库
- pandas 官方文档 — Python 数据分析库
- formulas 库:解析 Excel 公式 — Excel 公式引擎
- xlsxwriter 官方文档 — 高性能 Excel 写入库
快速安装
pip install openpyxl pandas
brew install --cask libreoffice # macOS
apt-get install libreoffice # Ubuntu
```
克隆 Skill:
```bash
git clone https://github.com/anthropics/skills.git
cp -r skills/xlsx ~/.claude/skills/