swoole+Mixphp+CodeIgniter开发失踪儿童信息平台

2023-12-11 18:10

本文主要是介绍swoole+Mixphp+CodeIgniter开发失踪儿童信息平台,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这是我在sf上的第一篇文章。写基于swoole、Mixphp和CodeIgniter开发的失踪儿童信息平台。

在2017年的时候,关注到有一个“团圆系统”,它是公安部专门为了快速扩散失踪儿童消息的平台,但是网上并没有找到这个平台的地址。当然,偶然在淘宝平台上找到一个接口,这个接口可以取得失踪儿童的数据,后来这个接口提示不能访问了。那么如果我想去做这样的一个失踪儿童信息平台的话,就要从另外的地方获取数据了。

团圆系统的全称应该是公安部儿童失踪信息紧急发布平台,在新浪微博上有一个官方的微博账号,通过这个微博账号发布儿童失踪信息。因此在实现“失踪儿童信息平台”的第一步就是从微博上去获取数据,并且这个获取数据的程序最后能在后台程序自动运行,这样就不用人工干预了。

从微博页面抓取数据

我对php语言要熟悉一些,因此在打算自己动手实现这个想法的时候,就选择了php,另外之前也关注到swoole,swoole拓展了PHPer的能力范围,不再局限于Web开发。进而找了一个比较容易上手的基于swoole的框架MixPHP,因此,在从微博上抓取数据的程序是基于Mixphp写的,工程结构如下:
图片描述

在apps/daemon/commands目录下新建一个控制器IndexController.php,控制器部分代码如下:

<?php
/*** Created by PhpStorm.* User: luoam* Date: 2018/4/20* Time: 22:28*/namespace apps\daemon\commands;use mix\client\Http;
use mix\console\Controller;
use mix\swoole\Process;
use apps\daemon\commands\SaeTClientV2;
use apps\daemon\commands\SaeTOAuthV2;
use apps\daemon\commands\Sae;class IndexController extends Controller
{// 启动public function actionStart(){// 重复启动处理if ($pid = Process::getMasterPid(self::PID_FILE)) {return "mix-daemon '{$this->processName}' is running, PID : {$pid}." . PHP_EOL;}// 启动提示echo "mix-daemon '{$this->processName}' start successed." . PHP_EOL;// 蜕变为守护进程if ($this->d) {Process::daemon();}// 写入 PID 文件Process::writePid(self::PID_FILE);// 修改进程名称Process::setName("mix-daemon: {$this->processName}");// 开始工作$this->startWork();}public function startWork(){try {while (true) {//实时采集一次$sql = "select `itemid` from items where status=:status";$rows = \mix::app()->rdb->createCommand($sql)->bindParams(['status' => '失踪'])->queryAll();if (!empty($rows)) {foreach ($rows as $row) {//采集一次失踪的,$this->actionDetail($row['itemid']);sleep(5);//再增量采集一次$this->actionIncrementOnce();}}}} catch (\Exception $e) {\Mix::app()->error->exception($e);sleep(10); // 休息一会,避免 cpu 出现 100%$this->startWork();}}}

哦,需要提醒的是,Mixphp需要一些准备条件,在官方文档中写的非常详细。安装好Mixphp之后就可以直接运行上面的后台程序,命令如:

./mix-daemon index/start -d

-d 表示这个进程将在后台运行。
数据的抓取分为几个部分,

  1. 批量抓取,在程序第一次运行时会给定一些url进行批量初始化抓取
  2. 增量抓取,会根据抓取回来的页面内容分析新的url,再进行抓取新的url
  3. 补充抓取,意思是部分儿童的状态为失踪,隔一段时间之后找回来了,那么状态也会发生变化,因此要对这些url进行补充抓取。

前台展示页面

前台展示,相当于做一个网站,使用的是CodeIgniter框架,这个框架用来做网站,很方便,因此我也一直在用。
整个网站只显示那些仍然处于失踪状态的儿童的信息。页面的效果大致是这样的:
图片描述

另外一个就是发微博

我在微博开发平台注册了一个应用,可以调用微博的api,因此在数据抓取的程序里,在数据存到数据库中的同时会发一条微博。调用的是share接口。使用微博的api的过程是这样的,先使用oauth获取到access_token,另外从微博开发平台找到key和secret,部分代码如下:

$c = new SaeTClientV2(WB_AKEY, WB_SKEY, $access_token);
$sus = \mix::app()->rdb->insert('items', $dataArray)->execute();
$insertId = \Mix::app()->rdb->getLastInsertId();
$affectedRowss = \Mix::app()->rdb->getRowCount();
if ($affectedRowss > 0) {$texts = "" . $dataArray['name'] . "," . $dataArray['agesex'] . "," . mb_substr($dataArray['detail'], 0, 110, 'utf-8') . '...' . "如有线索,请迅速与警方联系:" . $dataArray['policetel'] . "http://www.anman.org/index/baobei/" . $containerid;if ($weibopic) {$weibopic = $this->get_img($weibopic, \mix::app()->getRuntimePath());}$weiboRep = $c->share($texts, $weibopic);if (isset($weiboRep['id'])){$sinaweibos = array('itemid'=>$containerid,'weiboid'=>$weiboRep['id']);\mix::app()->rdb->insert('sinaweibos',$sinaweibos)->execute();}if ($weibopic){unlink($weibopic);}echo date("Y-m-d H:i:s") . ' ' . $containerid . '微博发送成功!' . PHP_EOL;echo date("Y-m-d H:i:s") . ' ' . $containerid . '插入数据操作成功' . PHP_EOL;\mix::app()->log->info(date("Y-m-d H:i:s") . ' ' . $containerid . '插入数据操作成功');
} else {\mix::app()->log->error(date("Y-m-d H:i:s") . ' ' . $containerid . '插入操作出错');
}

微博的效果如下:
图片描述

总结一下:

整个实现过程中使用到了swoole,codeigniter框架,微博开发平台,mysql。
后台程序从微博中抓取数据到本地,然后根据规则通过微博api在发送微博。
有一个专门的网站去展示这些信息。
后面我打算试着去对这些数据做一些分析。

这篇关于swoole+Mixphp+CodeIgniter开发失踪儿童信息平台的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/481615

相关文章

Python38个游戏开发库整理汇总

《Python38个游戏开发库整理汇总》文章介绍了多种Python游戏开发库,涵盖2D/3D游戏开发、多人游戏框架及视觉小说引擎,适合不同需求的开发者入门,强调跨平台支持与易用性,并鼓励读者交流反馈以... 目录PyGameCocos2dPySoyPyOgrepygletPanda3DBlenderFife

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

PyQt5 GUI 开发的基础知识

《PyQt5GUI开发的基础知识》Qt是一个跨平台的C++图形用户界面开发框架,支持GUI和非GUI程序开发,本文介绍了使用PyQt5进行界面开发的基础知识,包括创建简单窗口、常用控件、窗口属性设... 目录简介第一个PyQt程序最常用的三个功能模块控件QPushButton(按钮)控件QLable(纯文本

Linux之platform平台设备驱动详解

《Linux之platform平台设备驱动详解》Linux设备驱动模型中,Platform总线作为虚拟总线统一管理无物理总线依赖的嵌入式设备,通过platform_driver和platform_de... 目录platform驱动注册platform设备注册设备树Platform驱动和设备的关系总结在 l

基于Python开发一个图像水印批量添加工具

《基于Python开发一个图像水印批量添加工具》在当今数字化内容爆炸式增长的时代,图像版权保护已成为创作者和企业的核心需求,本方案将详细介绍一个基于PythonPIL库的工业级图像水印解决方案,有需要... 目录一、系统架构设计1.1 整体处理流程1.2 类结构设计(扩展版本)二、核心算法深入解析2.1 自

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断

Java中读取YAML文件配置信息常见问题及解决方法

《Java中读取YAML文件配置信息常见问题及解决方法》:本文主要介绍Java中读取YAML文件配置信息常见问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录1 使用Spring Boot的@ConfigurationProperties2. 使用@Valu