PHP通过CURL爬取携程特价机票(国内/国际/单程/往返)

2023-11-06 03:10

本文主要是介绍PHP通过CURL爬取携程特价机票(国内/国际/单程/往返),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第一步先确认要抓取的地方是否是和我的一样(如果是请继续浏览,如果不是请自便)
在这里插入图片描述
确认过眼神,这就是你想要爬取的网页那就往下浏览把
(1)先获取所有的城市列表。
可以自己整理一份,也可以爬取网络上的城市列表。由于爬取过飞猪的城市列表,所以就没爬取携程的。这里我把爬取飞猪城市列表的代码分享一下。大家可以参考。

//获取飞猪的城市列表$url = "https://webresource.c-ctrip.com/code/cquery/resource/address/flight/fuzzy_start_poi_timezone_gb2312.js??CR_2016_04_26_00_00_00";$ch = curl_init();curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);curl_setopt($ch, CURLOPT_HEADER, false);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_REFERER, $url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);$result = curl_exec($ch);curl_close($ch);$city = array();preg_match_all('/\((.*?)\)/i',$result,$city);$city = $city['1'];$city_1 = array();foreach ($city as $key=>$value) {if (strlen($value) != 3) {unset($city[$key]);}}$citys = array_merge($city,$city_1);$cityName = array();foreach ($citys as $val) {$cityName[$val] = $val;}

获取到的数据如下
在这里插入图片描述
(2)确认是否获取到了城市列表。获取到了就开始爬取。
我爬取的是 单程/往返 出发地 到 全世界的数据 代码如下

foreach ($cityName as $value) {$city = $value;$url = 'https://flights.ctrip.com/fuzzy/search';$da = '{"inputDepartureCity":"$city","inputDepartureCityName":"null","travelType":"ONEWAY","departStringDate":"任何时间","departDateRanges":[],"maxDays":-1,"minDays":-1,"inputArrivalCities":{"themes":[],"cities":[],"areas":[]},"inputArrivalCitiesMap":{"themes":[],"cities":[],"areas":[],"filter":{}},"isSearchPage":true,"sortingType":"PRICE_ASC","isIncludedTax":true,"city_offset":480}';$da = str_replace('$city', $city, $da);$ch= curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);//设置请求头信息 这里是json数据curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json;charset=utf-8'));curl_setopt($ch, CURLOPT_ENCODING, 'gzip,deflate');curl_setopt($ch, CURLOPT_POST, 1);if($da) {$da = is_array($da) ? json_encode($da) : $da;curl_setopt($ch, CURLOPT_POSTFIELDS, $da);}curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);curl_exec($ch);$str = curl_exec($ch);curl_close($ch);
//            print_r($str);die;}

这里便获取到了数据,数据如下
在这里插入图片描述
上面是获取的单程,国内和国际的所有机票信息。想获取往返的只需要将下图的这里改为"ROUNDTRIP"
在这里插入图片描述
第二步将获取的数据进行处理
当然我这里肯定有一份处理好的源码。但是代码过长不方便分享。
友情提示(如何获取携程数据的源码以经分享。如何处理这便靠自己。)
在提示一条(数据里面有国际/国内/包含税费/不包含税费所以处理的时候请认真对照网页上的数据找出规律)
在这里插入图片描述

这篇关于PHP通过CURL爬取携程特价机票(国内/国际/单程/往返)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/354137

相关文章

如何为Yarn配置国内源的详细教程

《如何为Yarn配置国内源的详细教程》在使用Yarn进行项目开发时,由于网络原因,直接使用官方源可能会导致下载速度慢或连接失败,配置国内源可以显著提高包的下载速度和稳定性,本文将详细介绍如何为Yarn... 目录一、查询当前使用的镜像源二、设置国内源1. 设置为淘宝镜像源2. 设置为其他国内源三、还原为官方

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

Android Studio 配置国内镜像源的实现步骤

《AndroidStudio配置国内镜像源的实现步骤》本文主要介绍了AndroidStudio配置国内镜像源的实现步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、修改 hosts,解决 SDK 下载失败的问题二、修改 gradle 地址,解决 gradle

使用国内镜像源优化pip install下载的方法步骤

《使用国内镜像源优化pipinstall下载的方法步骤》在Python开发中,pip是一个不可或缺的工具,用于安装和管理Python包,然而,由于默认的PyPI服务器位于国外,国内用户在安装依赖时可... 目录引言1. 为什么需要国内镜像源?2. 常用的国内镜像源3. 临时使用国内镜像源4. 永久配置国内镜

国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)

《国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)》本文给大家利用deepseek模型搭建私有知识问答库的详细步骤和遇到的问题及解决办法,感兴趣的朋友一起看看吧... 目录1. 第1步大家在安装完ollama后,需要到系统环境变量中添加两个变量2. 第3步 “在cmd中

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用Java实现一个解析CURL脚本小工具

《使用Java实现一个解析CURL脚本小工具》文章介绍了如何使用Java实现一个解析CURL脚本的工具,该工具可以将CURL脚本中的Header解析为KVMap结构,获取URL路径、请求类型,解析UR... 目录使用示例实现原理具体实现CurlParserUtilCurlEntityICurlHandler

Linux中Curl参数详解实践应用

《Linux中Curl参数详解实践应用》在现代网络开发和运维工作中,curl命令是一个不可或缺的工具,它是一个利用URL语法在命令行下工作的文件传输工具,支持多种协议,如HTTP、HTTPS、FTP等... 目录引言一、基础请求参数1. -X 或 --request2. -d 或 --data3. -H 或

PHP执行php.exe -v命令报错的解决方案

《PHP执行php.exe-v命令报错的解决方案》:本文主要介绍PHP执行php.exe-v命令报错的解决方案,文中通过图文讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下... 目录执行phpandroid.exe -v命令报错解决方案执行php.exe -v命令报错-PHP War

PHP原理之内存管理中难懂的几个点

PHP的内存管理, 分为俩大部分, 第一部分是PHP自身的内存管理, 这部分主要的内容就是引用计数, 写时复制, 等等面向应用的层面的管理. 而第二部分就是今天我要介绍的, zend_alloc中描写的关于PHP自身的内存管理, 包括它是如何管理可用内存, 如何分配内存等. 另外, 为什么要写这个呢, 因为之前并没有任何资料来介绍PHP内存管理中使用的策略, 数据结构, 或者算法. 而在我们