笔趣阁获取文本

2023-10-19 04:30
文章标签 获取 文本 笔趣

本文主要是介绍笔趣阁获取文本,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

前言

 一、目标步骤

二、详细介绍

1.获取小说文本

2.获取文本的txt版本

3.将txt文本合并在一起

三、总结


前言

最近又想听小说了,但是好多小说听不见,但是edge自带阅读插件,就想着用其来读小说。

但是会有以下问题:

  1. 小说中会有其他内容,影响听书体验,如下图1。
  2. 听完一章小说后,小说不能自动跳转至下一页。

图1


 一、目标步骤

我们的目标有三个:

  1. 从网页上获取小说文本。
  2. 从网页上获取文本的txt版本。
  3. 将txt文本合并在一起。

二、详细介绍

1.获取小说文本

代码如下:

//获取页面中小说的章节标题

var title=document.getElementsByClassName("bookname").item(0).innerText;

//获取文本中包含小说文本的p标签
var c=document.getElementById("content").getElementsByTagName("p");
var content="";
var i;

//将单独的p标签合并为一个字符串文本。
for (i in c){
   if(c[i].innerText==undefined || c[i].innerText.indexOf("App")>=0 || c[i].innerText.indexOf("本章完")>=0){
   continue;
    }
   content+=c[i].innerText;
}
var result=`<h1>${title}</h1>\n\t\t<p>${content}</p>\n\t\t`;
console.log(result);

2.获取文本的txt版本

代码如下:

//创建一个<a>元素

var Usea=document.createElement("a");

//创建一个文字节点
var textNode=document.createTextNode("下载");

//将文字节点添加到<a>元素
Usea.appendChild(textNode);

//创建File类对象
var myfile=new File([result],Date.now()+title,{
    type: "text/plain",
});
Usea.download=Date.now()+title+".txt";

//创建一个链接,方便后面调用a.click()触发download属性
Usea.href=URL.createObjectURL(myfile);

//调用a.click()触发download属性
Usea.click();

全部代码如下:【需要使用tampermonkey插件,将js自动触发】将代码放入油猴插件中。

// ==UserScript==
// @name         笔趣阁获取文本
// @namespace    http://tampermonkey.net/
// @version      0.1
// @description  try to take over the world!
// @author       You
// @match        https://www.beqege.cc/1076/*
// @icon         https://www.google.com/s2/favicons?sz=64&domain=beqege.cc
// @grant        none
// ==/UserScript==
//上面的match后的网址根据需求填写****(function() {'use strict';console.log("开始了");var timeNumber=0window.TextGain=function(){var title=document.getElementsByClassName("bookname").item(0).innerText;var c=document.getElementById("content").getElementsByTagName("p");var content="";var i;for (i in c){if(c[i].innerText==undefined || c[i].innerText.indexOf("App")>=0 || c[i].innerText.indexOf("本章完")>=0){continue;}content+=c[i].innerText;}var result=`<h1>${title}</h1>\n\t\t<p>${content}</p>\n\t\t`;console.log(result);var Usea=document.createElement("a");var textNode=document.createTextNode("下载");Usea.appendChild(textNode);var myfile=new File([result],Date.now()+title,{type: "text/plain",});Usea.download=Date.now()+title+".txt";Usea.href=URL.createObjectURL(myfile);Usea.click();}window.nextPage=function(){document.getElementsByClassName("bottem1")[0].getElementsByTagName("a")[2].click();timeNumber+=1;}window.strat=function(){if(timeNumber==0){setTimeout("TextGain()",800);setTimeout("nextPage()",2000);}}setTimeout("strat()",600);
})();

使用步骤:

先打开笔趣阁的相关章节,如下图:

 然后激活我们自制的脚本,如下图:

 最后刷新笔趣阁网页即可触发下载脚本:

3.将txt文本合并在一起

这时我们下载文本的文件夹中的情况如下:

 这时用到了python了。

代码如下:

import os
import pyautogui
import pyperclip
import keyboard
import time

#获取当前文本的名字列表

listFileName=os.listdir(os.path.dirname(__file__))
listFileName.sort()
p=None

def autoWrite():
    time.sleep(1)
    for i in listFileName:
        if(i.find("txt")!=-1):
            p=open(file=r".\%s"%(i),mode="+r",encoding="utf-8")
            pyperclip.copy("".join(p.readlines()))
            pyautogui.hotkey("ctrl","v")
            print("完成%s"%(i))
            time.sleep(0.3)

if __name__=="__main__":
    keyboard.add_hotkey("alt+x",callback=autoWrite)
    keyboard.wait("esc")

Now!将我们做的小说html打开:

运行我们的py脚本,点击“alt+x”即可开始合并文件。


三、总结

最后,我们点击我们制作的html文件【用edge】,然后点击“ctrl+shift+u”即可激活阅读功能。

这篇关于笔趣阁获取文本的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/237327

相关文章

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Java发送SNMP至交换机获取交换机状态实现方式

《Java发送SNMP至交换机获取交换机状态实现方式》文章介绍使用SNMP4J库(2.7.0)通过RCF1213-MIB协议获取交换机单/多路状态,需开启SNMP支持,重点对比SNMPv1、v2c、v... 目录交换机协议SNMP库获取交换机单路状态获取交换机多路状态总结交换机协议这里使用的交换机协议为常

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Spring Boot中获取IOC容器的多种方式

《SpringBoot中获取IOC容器的多种方式》本文主要介绍了SpringBoot中获取IOC容器的多种方式,包括直接注入、实现ApplicationContextAware接口、通过Spring... 目录1. 直接注入ApplicationContext2. 实现ApplicationContextA

python获取指定名字的程序的文件路径的两种方法

《python获取指定名字的程序的文件路径的两种方法》本文主要介绍了python获取指定名字的程序的文件路径的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 最近在做项目,需要用到给定一个程序名字就可以自动获取到这个程序在Windows系统下的绝对路径,以下

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

SpringBoot 获取请求参数的常用注解及用法

《SpringBoot获取请求参数的常用注解及用法》SpringBoot通过@RequestParam、@PathVariable等注解支持从HTTP请求中获取参数,涵盖查询、路径、请求体、头、C... 目录SpringBoot 提供了多种注解来方便地从 HTTP 请求中获取参数以下是主要的注解及其用法:1

Python文本相似度计算的方法大全

《Python文本相似度计算的方法大全》文本相似度是指两个文本在内容、结构或语义上的相近程度,通常用0到1之间的数值表示,0表示完全不同,1表示完全相同,本文将深入解析多种文本相似度计算方法,帮助您选... 目录前言什么是文本相似度?1. Levenshtein 距离(编辑距离)核心公式实现示例2. Jac