Python - 读取 mobi 电子书内容

2024-06-10 09:28

本文主要是介绍Python - 读取 mobi 电子书内容,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 使用 mobi-reader 库
      • 安装
      • 使用
    • 使用 mobi 库
      • 安装
      • 读取
      • 查看文件
      • mobiunpack 命令行工具


相关库:

  • mobi : https://github.com/iscc/mobi
  • mobi-reader : https://github.com/MrLucio/mobi-reader

使用 mobi-reader 库

安装

pip install mobi-reader

使用

from mobi import Mobifile_path = "/Users/user/Downloads/萬曆十五年.mobi"
reader = Mobi(file_path)
output = reader.read()  # bytearray containing the decoded mobi filereader.close()type(output) # -> <class 'bytearray'>
content = output.decode('utf-8')  

content 内容很长,可以保存到文件夹,不要轻易在终端打印


使用 mobi 库

安装

pip install mobi 

读取

from mobi import Mobi
tempdir, filepath = mobi.extract("/Users/user/Downloads/萬曆十五年.mobi") 
# tempdir, filepath --> ('/var/folders/3n/j60lmmv93kngjr3cv_00zmvr0000gn/T/mobiexejtyu2zc',  '/var/folders/3n/j60lmmv93kngjr3cv_00zmvr0000gn/T/mobiexejtyu2zc/mobi7/book.html')

内容将保存在指定文件夹


查看文件

$ cd '/var/folders/3n/j60lmmv93kngjr3cv_00zmvr0000gn/T/mobiexejtyu2zc' 
$ tree
.
├── HDImages
└── mobi7├── Images│   ├── cover00137.jpeg│   └── image00138.jpeg├── book.html├── content.opf└── toc.ncx3 directories, 5 files

mobiunpack 命令行工具

$ mobiunpack --help
KindleUnpack v0.82Based on initial mobipocket version Copyright © 2009 Charles M. Hannum <root@ihack.net>Extensive Extensions and Improvements Copyright © 2009-2014 by:  P. Durrant, K. Hendricks, S. Siebert, fandrieu, DiapDealer, nickredding, tkeo.This program is free software: you can redistribute it and/or modifyit under the terms of the GNU General Public License as published bythe Free Software Foundation, version 3.
option --help not recognizedDescription:Unpacks an unencrypted Kindle/MobiPocket ebook to html and imagesor an unencrypted Kindle/Print Replica ebook to PDF and imagesinto the specified output folder.
Usage:mobiunpack -r -s -p apnxfile -d -h --epub_version= infile [outdir]
Options:-h                 print this help message-i                 use HD Images, if present, to overwrite reduced resolution images-s                 split combination mobis into mobi7 and mobi8 ebooks-p APNXFILE        path to an .apnx file associated with the azw3 input (optional)--epub_version=    specify epub version to unpack to: 2, 3, A (for automatic) or  F (force to fit to epub2 definitions), default is 2-d                 dump headers and other info to output and extra files-r                 write raw data to the output folder

2024-06-06(四)

这篇关于Python - 读取 mobi 电子书内容的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1047781

相关文章

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Python版本与package版本兼容性检查方法总结

《Python版本与package版本兼容性检查方法总结》:本文主要介绍Python版本与package版本兼容性检查方法的相关资料,文中提供四种检查方法,分别是pip查询、conda管理、PyP... 目录引言为什么会出现兼容性问题方法一:用 pip 官方命令查询可用版本方法二:conda 管理包环境方法

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

pycharm跑python项目易出错的问题总结

《pycharm跑python项目易出错的问题总结》:本文主要介绍pycharm跑python项目易出错问题的相关资料,当你在PyCharm中运行Python程序时遇到报错,可以按照以下步骤进行排... 1. 一定不要在pycharm终端里面创建环境安装别人的项目子模块等,有可能出现的问题就是你不报错都安装

Python打包成exe常用的四种方法小结

《Python打包成exe常用的四种方法小结》本文主要介绍了Python打包成exe常用的四种方法,包括PyInstaller、cx_Freeze、Py2exe、Nuitka,文中通过示例代码介绍的非... 目录一.PyInstaller11.安装:2. PyInstaller常用参数下面是pyinstal

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型: