搜狗微信搜索爬虫

2024-08-30 13:20
文章标签 微信 搜索 爬虫 搜狗

本文主要是介绍搜狗微信搜索爬虫,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 列表采集
  • 详情采集

前言

最近在做一个语料采集的项目,其中有涉及到公众号内容采集(非指定公众号而是指定关键词的采集),于是考虑使用搜狗采集,记录一下采集过程

列表采集

打开搜狗页面输入关键词,选择微信,直接搜索,查看F12发现需要的列表内容直接就在DOC文档里,postman验证一下直接URL输入就可以采集到,属于是比较容易的采集类型
在这里插入图片描述
在这里插入图片描述

详情采集

通过列表采集到的url是/link这样的形式,需要拼接还会有跳转,这一步是需要解决的
在这里插入图片描述
如图示的原始链接为https://weixin.sogou.com/link?url=dn9a_-gY295K0Rci_xozVXfdMkSQTLW6ft3wfAVofsP5Peu-UiA4DGseIEA7zE2zlj4s3ji8u8GVgrFeYQugDsScNWNhR16IPBQ5xHZTJMofuyJy4xt5exMSe0Q-wpcGJiUoSonxbEsfuSSrjQIuccSq-1fNJZF2hUQpUjvo0qtu8iygQXIjl1SrWJX0d6AM35pMJkC9ozB6UxBa1hZYHbMhGiRiC_qmt8AmPpzYfLfmn_8ekF_xC_Q1IvX2-Tzra8RdgdEqMnT4Z9KRwPzScjgZHTk8WJz5yDYUgTcZbC3xbso0aod2jCXucl6fR1sLiZqwg0yoRFw.&type=2&query=%E7%99%BD%E6%9C%AF&token=257BEA52D17286B8C8C1E719A6019408C81F185666D13FAB
输入到浏览器的地址栏之后会跳转到https://mp.weixin.qq.com/s?src=3&timestamp=1724989355&ver=1&signature=H1efLtkgEVg8AFd308YzX-KoqdIOg9nVsLPiC9D5eFwfkKlZHD3z1mE1QcOd2EkpFE-Lv64BBp7789obYbg42mkHTeflcuuyMt5HmcMKTmcd3tv0VVUdULJ3lXMuZH2KWzzSibjV4Nb14b0aGU8TP6LrFyJJ4CXAbTG97Z*c4=
在这里插入图片描述
其中需要一步转换过程,postman直接调用一下转换前的链接
在这里插入图片描述
算是有点意料之外的转换方式了,写个正则抽出来拼接一下就行了

这篇关于搜狗微信搜索爬虫的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1120938

相关文章

HTML5 搜索框Search Box详解

《HTML5搜索框SearchBox详解》HTML5的搜索框是一个强大的工具,能够有效提升用户体验,通过结合自动补全功能和适当的样式,可以创建出既美观又实用的搜索界面,这篇文章给大家介绍HTML5... html5 搜索框(Search Box)详解搜索框是一个用于输入查询内容的控件,通常用于网站或应用程

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

如何基于Python开发一个微信自动化工具

《如何基于Python开发一个微信自动化工具》在当今数字化办公场景中,自动化工具已成为提升工作效率的利器,本文将深入剖析一个基于Python的微信自动化工具开发全过程,有需要的小伙伴可以了解下... 目录概述功能全景1. 核心功能模块2. 特色功能效果展示1. 主界面概览2. 定时任务配置3. 操作日志演示

Redis迷你版微信抢红包实战

《Redis迷你版微信抢红包实战》本文主要介绍了Redis迷你版微信抢红包实战... 目录1 思路分析1.1hCckRX 流程1.2 注意点①拆红包:二倍均值算法②发红包:list③抢红包&记录:hset2 代码实现2.1 拆红包splitRedPacket2.2 发红包sendRedPacket2.3 抢

SpringBoot后端实现小程序微信登录功能实现

《SpringBoot后端实现小程序微信登录功能实现》微信小程序登录是开发者通过微信提供的身份验证机制,获取用户唯一标识(openid)和会话密钥(session_key)的过程,这篇文章给大家介绍S... 目录SpringBoot实现微信小程序登录简介SpringBoot后端实现微信登录SpringBoo

Python实现微信自动锁定工具

《Python实现微信自动锁定工具》在数字化办公时代,微信已成为职场沟通的重要工具,但临时离开时忘记锁屏可能导致敏感信息泄露,下面我们就来看看如何使用Python打造一个微信自动锁定工具吧... 目录引言:当微信隐私遇到自动化守护效果展示核心功能全景图技术亮点深度解析1. 无操作检测引擎2. 微信路径智能获

SpringBoot实现微信小程序支付功能

《SpringBoot实现微信小程序支付功能》小程序支付功能已成为众多应用的核心需求之一,本文主要介绍了SpringBoot实现微信小程序支付功能,文中通过示例代码介绍的非常详细,对大家的学习或者工作... 目录一、引言二、准备工作(一)微信支付商户平台配置(二)Spring Boot项目搭建(三)配置文件

微信公众号脚本-获取热搜自动新建草稿并发布文章

《微信公众号脚本-获取热搜自动新建草稿并发布文章》本来想写一个自动化发布微信公众号的小绿书的脚本,但是微信公众号官网没有小绿书的接口,那就写一个获取热搜微信普通文章的脚本吧,:本文主要介绍微信公众... 目录介绍思路前期准备环境要求获取接口token获取热搜获取热搜数据下载热搜图片给图片加上标题文字上传图片

如何用java对接微信小程序下单后的发货接口

《如何用java对接微信小程序下单后的发货接口》:本文主要介绍在微信小程序后台实现发货通知的步骤,包括获取Access_token、使用RestTemplate调用发货接口、处理AccessTok... 目录配置参数 调用代码获取Access_token调用发货的接口类注意点总结配置参数 首先需要获取Ac

Python使用DeepSeek进行联网搜索功能详解

《Python使用DeepSeek进行联网搜索功能详解》Python作为一种非常流行的编程语言,结合DeepSeek这一高性能的深度学习工具包,可以方便地处理各种深度学习任务,本文将介绍一下如何使用P... 目录一、环境准备与依赖安装二、DeepSeek简介三、联网搜索与数据集准备四、实践示例:图像分类1.