python实现word转anki制卡格式

2023-12-28 04:30

本文主要是介绍python实现word转anki制卡格式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录阿

    • 超级长的吐槽前言
    • 目标简述
    • 第一歩:将段落格式转换为英文和汉字分开并且以tab制表符分开
    • 第二步:使用有道翻译url带入短语参数获取例句信息
    • 第三步:导入anki

超级长的吐槽前言

最近需要背一下短语,没有在各大背单词app上面找到我需要背的词书.没办法了,去网上找到了某垃圾教育网站的word,…,这个格式,简直惨不忍睹,???那个憨憨做的文档??分栏不会吗居然手打空格来分栏,我佛了np,来感受一下
在这里插入图片描述

好吧,我承认光是把格式改成一条词汇一行我就花了半个小时…
在这里插入图片描述

目标简述

首先需要将上一张图片的格式转换为英文和汉字分开并且以tab制表符分开,(在anki导入卡片的时候使用制表符分割字段)
在这里插入图片描述
然后还需要给短语加上例句,变成这样
在这里插入图片描述
最后进行导入操作,得到
在这里插入图片描述

第一歩:将段落格式转换为英文和汉字分开并且以tab制表符分开

import re
# 
# 用于anki卡片txt制作,简单实现对英文和中文的分割,分隔符为\t
# python 3.5版本
# 正则匹配中文,固定形式:\u4E00-\u9FA5
# 
with open("1.txt","r") as tt: #1.txt为目标文档for i in tt.readlines():text = iregex_str = ".*?([\u4E00-\u9FA5|\W]+).*?" #构造pattench = re.findall(regex_str, text) #读取所有中文en = re.findall('[a-zA-Z0-9]+',text) #读取所有英文if ch:#如果读取到了中文rc="" #初始化中文翻译结果变量Re="" #初始化短语结果变量for j in ch:rc=rc+j#组装中文结果if en:#如果读取到了英文for k in en:Re=Re+k+" "#组装短语结果,单词与单词之间还需要加一个空格print(Re)with open("2.txt","a") as tt2:tt2.write(Re+"\t"+rc)#写入结果(追加)

第二步:使用有道翻译url带入短语参数获取例句信息

这里用到了requests库用于发送翻译请求,BeautifulSoup库用于读取指定内容,html库用于去除所有的html标记(太方便了这个库)
这里主要是在上一步的"判断如果读取到了英文"后面加入内容

import re,requests
from bs4 import BeautifulSoup
from w3lib import html
# 
# 用于anki卡片txt制作,简单实现对英文和中文的分割,分隔符为\t
# python 3.5版本
# 正则匹配中文,固定形式:\u4E00-\u9FA5
# 
with open("1.txt","r") as tt:for i in tt.readlines():text = iregex_str = ".*?([\u4E00-\u9FA5|\W]+).*?"ch = re.findall(regex_str, text)en = re.findall('[a-zA-Z0-9]+',text)if ch:rc=""Re=""for j in ch:rc=rc+jif en:for k in en:Re=Re+k+" "print(Re)url="http://dict.youdao.com/w/eng/"+Re#构造翻译请求链接Rs=requests.get(url)#发送链接Rs=BeautifulSoup(Rs.text,'html.parser')#指定解析方式为htmlif Rs.select('.examples'):#先判断有没有提供柯林斯英汉双解大词典例句 注释1Rs=Rs.select('.examples') #注释2else:#如果没有就找普通例句Rs=Rs.select('#bilingual')#注释2Rs= str(html.remove_tags(str(Rs)))#去掉所有html代码Rs = Rs.replace("《柯林斯英汉双解大词典》","").replace("《牛津词典》","").replace("\n","").replace("更多双语例句","").replace("精选例句","")#去掉不必要的信息with open("2.txt","a") as tt2:tt2.write(Re+"\t"+rc.replace("\n","")+str(Rs)+"\n")#写入数据并且英文与答案之间以tab隔开
  • 注释1:随便翻译一个词汇发现结果界面会有2个地方出现例句,第一个是柯林斯英汉双解大词典例句,第二个是其他大辞典里面的例句.不过有些词汇的翻译并没有柯林斯英汉双解大词典例句.
    在这里插入图片描述
    查看网页源代码发现柯林斯英汉双解大词典例句的class=examples.
    在这里插入图片描述

  • 注释2:仔细观察后发现普通例句的id为bilingual
    在这里插入图片描述

第三步:导入anki

如下即可
在这里插入图片描述

尾巴:还是想吐槽一下,为什么这些教育网站都那么垃圾阿,界面也low,都几十年前的风格了吧,还卡…

这篇关于python实现word转anki制卡格式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/545064

相关文章

Python按照24个实用大方向精选的上千种工具库汇总整理

《Python按照24个实用大方向精选的上千种工具库汇总整理》本文整理了Python生态中近千个库,涵盖数据处理、图像处理、网络开发、Web框架、人工智能、科学计算、GUI工具、测试框架、环境管理等多... 目录1、数据处理文本处理特殊文本处理html/XML 解析文件处理配置文件处理文档相关日志管理日期和

Python标准库datetime模块日期和时间数据类型解读

《Python标准库datetime模块日期和时间数据类型解读》文章介绍Python中datetime模块的date、time、datetime类,用于处理日期、时间及日期时间结合体,通过属性获取时间... 目录Datetime常用类日期date类型使用时间 time 类型使用日期和时间的结合体–日期时间(

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

Python yield与yield from的简单使用方式

《Pythonyield与yieldfrom的简单使用方式》生成器通过yield定义,可在处理I/O时暂停执行并返回部分结果,待其他任务完成后继续,yieldfrom用于将一个生成器的值传递给另一... 目录python yield与yield from的使用代码结构总结Python yield与yield

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

精选20个好玩又实用的的Python实战项目(有图文代码)

《精选20个好玩又实用的的Python实战项目(有图文代码)》文章介绍了20个实用Python项目,涵盖游戏开发、工具应用、图像处理、机器学习等,使用Tkinter、PIL、OpenCV、Kivy等库... 目录① 猜字游戏② 闹钟③ 骰子模拟器④ 二维码⑤ 语言检测⑥ 加密和解密⑦ URL缩短⑧ 音乐播放

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group