【go语言爬虫】go语言高性能抓取手机号码归属地、所属运营商

本文主要是介绍【go语言爬虫】go语言高性能抓取手机号码归属地、所属运营商,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、需求分析
根据手机号码获取手机号码的归属地和所属运营商类型
类似:四川 18683339513 乐山 614000 0833 中国联通

二、运行效果
这里写图片描述

这里写图片描述

三、实现源代码

package main//网址:https://github.com/M2shad0w/phone-go//安装包:go get github.com/M2shad0w/phone-goimport ("fmt""github.com/M2shad0w/phone-go""os""github.com/axgle/mahonia""encoding/csv""io""time")func init() {if err := m2phone.Init("C://phone.dat"); err != nil {panic(err)}
}func mobile_spider() {file, err := os.Open("C://mobile_order//m.txt")if err != nil {fmt.Println("Error:", err)return}decoder := mahonia.NewDecoder("gbk")defer file.Close()//创建excel文件f, err := os.Create("C:/haha3.xlsx")if err != nil {panic(err)}defer f.Close()reader := csv.NewReader(decoder.NewReader(file))var type1 stringfor {record, err := reader.Read()if err == io.EOF {break} else if err != nil {fmt.Println("Error:", err)return}phonestr := record[0]ph, err := m2phone.Find(phonestr)if err != nil {fmt.Println("err:", err)return}switch ph.Phonetype {case 1:type1 ="中国移动"case 2:type1 ="中国联通"case 3:type1 ="中国电信"}fmt.Println(ph.Province, phonestr, ph.City, ph.Zipcode, ph.Areacode, type1)// 写入UTF-8 BOMf.WriteString("\xEF\xBB\xBF")f.WriteString(phonestr + "\t" + string(ph.Province) + "\t" + string(ph.City) + "\t" + string(ph.Zipcode) + "\t" + string(ph.Areacode) + "\t" + string(type1) + "\n")}}func main() {t1 := time.Now() // get current timemobile_spider()elapsed := time.Since(t1)fmt.Println("爬虫结束,总共耗时: ", elapsed)}

这篇关于【go语言爬虫】go语言高性能抓取手机号码归属地、所属运营商的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1144470

相关文章

go rate 原生标准限速库的使用

《gorate原生标准限速库的使用》本文主要介绍了Go标准库golang.org/x/time/rate实现限流,采用令牌桶算法控制请求速率,提供Allow/Reserve/Wait方法,具有一定... 目录介绍安装API介绍rate.NewLimiter:创建限流器limiter.Allow():请求是否

Go 语言中的 Struct Tag 的用法详解

《Go语言中的StructTag的用法详解》在Go语言中,结构体字段标签(StructTag)是一种用于给字段添加元信息(metadata)的机制,常用于序列化(如JSON、XML)、ORM映... 目录一、结构体标签的基本语法二、json:"token"的具体含义三、常见的标签格式变体四、使用示例五、使用

Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题

《Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题》:本文主要介绍Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未... 目录一、前言二、系统架构检测三、卸载旧版 Go四、下载并安装正确版本五、配置环境变量六、验证安装七、常见

Go语言使用slices包轻松实现排序功能

《Go语言使用slices包轻松实现排序功能》在Go语言开发中,对数据进行排序是常见的需求,Go1.18版本引入的slices包提供了简洁高效的排序解决方案,支持内置类型和用户自定义类型的排序操作,本... 目录一、内置类型排序:字符串与整数的应用1. 字符串切片排序2. 整数切片排序二、检查切片排序状态:

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

如何合理管控Java语言的异常

《如何合理管控Java语言的异常》:本文主要介绍如何合理管控Java语言的异常问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、Thorwable类3、Error4、Exception类4.1、检查异常4.2、运行时异常5、处理方式5.1. 捕获异常

C语言中的常见进制转换详解(从二进制到十六进制)

《C语言中的常见进制转换详解(从二进制到十六进制)》进制转换是计算机编程中的一个常见任务,特别是在处理低级别的数据操作时,C语言作为一门底层编程语言,在进制转换方面提供了灵活的操作方式,今天,我们将深... 目录1、进制基础2、C语言中的进制转换2.1 从十进制转换为其他进制十进制转二进制十进制转八进制十进

Python Selenium动态渲染页面和抓取的使用指南

《PythonSelenium动态渲染页面和抓取的使用指南》在Web数据采集领域,动态渲染页面已成为现代网站的主流形式,本文将从技术原理,环境配置,核心功能系统讲解Selenium在Python动态... 目录一、Selenium技术架构解析二、环境搭建与基础配置1. 组件安装2. 驱动配置3. 基础操作模

$在R语言中的作用示例小结

《$在R语言中的作用示例小结》在R语言中,$是一个非常重要的操作符,主要用于访问对象的成员或组件,它的用途非常广泛,不仅限于数据框(dataframe),还可以用于列表(list)、环境(enviro... 目录1. 访问数据框(data frame)中的列2. 访问列表(list)中的元素3. 访问jav