笔趣阁获取文本

2023-10-19 04:30
文章标签 获取 文本 笔趣

本文主要是介绍笔趣阁获取文本,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

前言

 一、目标步骤

二、详细介绍

1.获取小说文本

2.获取文本的txt版本

3.将txt文本合并在一起

三、总结


前言

最近又想听小说了,但是好多小说听不见,但是edge自带阅读插件,就想着用其来读小说。

但是会有以下问题:

  1. 小说中会有其他内容,影响听书体验,如下图1。
  2. 听完一章小说后,小说不能自动跳转至下一页。

图1


 一、目标步骤

我们的目标有三个:

  1. 从网页上获取小说文本。
  2. 从网页上获取文本的txt版本。
  3. 将txt文本合并在一起。

二、详细介绍

1.获取小说文本

代码如下:

//获取页面中小说的章节标题

var title=document.getElementsByClassName("bookname").item(0).innerText;

//获取文本中包含小说文本的p标签
var c=document.getElementById("content").getElementsByTagName("p");
var content="";
var i;

//将单独的p标签合并为一个字符串文本。
for (i in c){
   if(c[i].innerText==undefined || c[i].innerText.indexOf("App")>=0 || c[i].innerText.indexOf("本章完")>=0){
   continue;
    }
   content+=c[i].innerText;
}
var result=`<h1>${title}</h1>\n\t\t<p>${content}</p>\n\t\t`;
console.log(result);

2.获取文本的txt版本

代码如下:

//创建一个<a>元素

var Usea=document.createElement("a");

//创建一个文字节点
var textNode=document.createTextNode("下载");

//将文字节点添加到<a>元素
Usea.appendChild(textNode);

//创建File类对象
var myfile=new File([result],Date.now()+title,{
    type: "text/plain",
});
Usea.download=Date.now()+title+".txt";

//创建一个链接,方便后面调用a.click()触发download属性
Usea.href=URL.createObjectURL(myfile);

//调用a.click()触发download属性
Usea.click();

全部代码如下:【需要使用tampermonkey插件,将js自动触发】将代码放入油猴插件中。

// ==UserScript==
// @name         笔趣阁获取文本
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description  try to take over the world!
// @author       You
// @match        https://www.beqege.cc/1076/*
// @icon         https://www.google.com/s2/favicons?sz=64&domain=beqege.cc
// @grant        none
// ==/UserScript==
//上面的match后的网址根据需求填写****(function() {'use strict';console.log("开始了");var timeNumber=0window.TextGain=function(){var title=document.getElementsByClassName("bookname").item(0).innerText;var c=document.getElementById("content").getElementsByTagName("p");var content="";var i;for (i in c){if(c[i].innerText==undefined || c[i].innerText.indexOf("App")>=0 || c[i].innerText.indexOf("本章完")>=0){continue;}content+=c[i].innerText;}var result=`<h1>${title}</h1>\n\t\t<p>${content}</p>\n\t\t`;console.log(result);var Usea=document.createElement("a");var textNode=document.createTextNode("下载");Usea.appendChild(textNode);var myfile=new File([result],Date.now()+title,{type: "text/plain",});Usea.download=Date.now()+title+".txt";Usea.href=URL.createObjectURL(myfile);Usea.click();}window.nextPage=function(){document.getElementsByClassName("bottem1")[0].getElementsByTagName("a")[2].click();timeNumber+=1;}window.strat=function(){if(timeNumber==0){setTimeout("TextGain()",800);setTimeout("nextPage()",2000);}}setTimeout("strat()",600);
})();

使用步骤:

先打开笔趣阁的相关章节,如下图:

 然后激活我们自制的脚本,如下图:

 最后刷新笔趣阁网页即可触发下载脚本:

3.将txt文本合并在一起

这时我们下载文本的文件夹中的情况如下:

 这时用到了python了。

代码如下:

import os
import pyautogui
import pyperclip
import keyboard
import time

#获取当前文本的名字列表

listFileName=os.listdir(os.path.dirname(__file__))
listFileName.sort()
p=None

def autoWrite():
    time.sleep(1)
    for i in listFileName:
        if(i.find("txt")!=-1):
            p=open(file=r".\%s"%(i),mode="+r",encoding="utf-8")
            pyperclip.copy("".join(p.readlines()))
            pyautogui.hotkey("ctrl","v")
            print("完成%s"%(i))
            time.sleep(0.3)

if __name__=="__main__":
    keyboard.add_hotkey("alt+x",callback=autoWrite)
    keyboard.wait("esc")

Now!将我们做的小说html打开:

运行我们的py脚本,点击“alt+x”即可开始合并文件。


三、总结

最后,我们点击我们制作的html文件【用edge】,然后点击“ctrl+shift+u”即可激活阅读功能。

这篇关于笔趣阁获取文本的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/237327

相关文章

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

MySQL 获取字符串长度及注意事项

《MySQL获取字符串长度及注意事项》本文通过实例代码给大家介绍MySQL获取字符串长度及注意事项,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 获取字符串长度详解 核心长度函数对比⚠️ 六大关键注意事项1. 字符编码决定字节长度2

python3如何找到字典的下标index、获取list中指定元素的位置索引

《python3如何找到字典的下标index、获取list中指定元素的位置索引》:本文主要介绍python3如何找到字典的下标index、获取list中指定元素的位置索引问题,具有很好的参考价值,... 目录enumerate()找到字典的下标 index获取list中指定元素的位置索引总结enumerat

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

SpringMVC高效获取JavaBean对象指南

《SpringMVC高效获取JavaBean对象指南》SpringMVC通过数据绑定自动将请求参数映射到JavaBean,支持表单、URL及JSON数据,需用@ModelAttribute、@Requ... 目录Spring MVC 获取 JavaBean 对象指南核心机制:数据绑定实现步骤1. 定义 Ja

C++中RAII资源获取即初始化

《C++中RAII资源获取即初始化》RAII通过构造/析构自动管理资源生命周期,确保安全释放,本文就来介绍一下C++中的RAII技术及其应用,具有一定的参考价值,感兴趣的可以了解一下... 目录一、核心原理与机制二、标准库中的RAII实现三、自定义RAII类设计原则四、常见应用场景1. 内存管理2. 文件操

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

SpringBoot服务获取Pod当前IP的两种方案

《SpringBoot服务获取Pod当前IP的两种方案》在Kubernetes集群中,SpringBoot服务获取Pod当前IP的方案主要有两种,通过环境变量注入或通过Java代码动态获取网络接口IP... 目录方案一:通过 Kubernetes Downward API 注入环境变量原理步骤方案二:通过