AI办公自动化:批量把docx文档转换为txt文本

作者 : admin 本文共955个字,预计阅读时间需要3分钟 发布时间: 2024-06-10 共3人阅读

任务:把docx文档批量转换成txt,首先让deepseek写了一段代码,但是转换失败。用的是最流行的python-docx库来读取docx文档,但是始终无法读取成功,换成pywin32库就解决问题了。

在deepseek中输入提示词:

写一个Python脚本,打开文件夹:F:\AI自媒体内容\,用pywin32库把里面所有的docx文档内容读取出来,然后保存到txt文档中,文件名保持一致,也保存在同一个文件夹中。一步步的思考,但是代码都整合在一起

源代码:

import os

import win32com.client as win32

# 定义源文件夹路径

source_folder = r’F:\AI自媒体内容’

# 初始化Word应用程序

word_app = win32.gencache.EnsureDispatch(‘Word.Application’)

word_app.Visible = False # 设置Word应用程序为不可见

# 遍历文件夹中的所有.docx文件

for filename in os.listdir(source_folder):

if filename.endswith(‘.docx’):

# 构建完整的文件路径

file_path = os.path.join(source_folder, filename)

# 打开.docx文件

try:

doc = word_app.Documents.Open(file_path)

except Exception as e:

print(f”无法打开文件 {filename},错误信息:{e}”)

continue

# 读取文档内容

content = doc.Content.Text

# 创建新的.txt文件名

txt_filename = filename.replace(‘.docx’, ‘.txt’)

# 将内容写入.txt文件

with open(os.path.join(source_folder, txt_filename), ‘w’, encoding=’utf-8′) as f:

f.write(content)

# 关闭Word文档

doc.Close()

print(f”文件 {filename} 已成功转换为 {txt_filename}”)

# 关闭Word应用程序

word_app.Quit()

print(“转换完成!”)

AI办公自动化:批量把docx文档转换为txt文本插图

AI办公自动化:批量把docx文档转换为txt文本插图(1)

本站无任何商业行为
个人在线分享-虚灵IT资料分享 » AI办公自动化:批量把docx文档转换为txt文本
E-->