[SQL] 通过工商信息筛选潜在客户

2024-02-27 22:50

本文主要是介绍[SQL] 通过工商信息筛选潜在客户,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今日心情 :佛系的很


对于业务来说,经常会碰到一种需求:手里有一个公司名单(可能也就十几二十个公司名称),深入接触了几次之后,发现这类公司似乎合作意向都很大,具有很大的开发潜力。如果能找到跟这些公司相类似的企业,说不定能扩大客户池,进而带来业绩的增长,收获很多小钱钱。

如果还不会数据挖掘算法,如何先给出一份比较可靠的同类公司名单呢?头大。。。

不过既然要找相似企业,免不了要检索全国所有公司,如果数据库里有全国企业的工商信息数据,可以考虑用SQL先来应个急。

声明:本文重点在于介绍处理这类问题的思路,数据都是东拼西凑的。如有相同,纯属巧合

第一步:获取样本企业的相关信息

已知,样本企业名单如下:

公司A、公司B、公司C、公司D、公司E、公司F、公司G、公司H、公司I、公司J、公司K、公司L、公司M、公司N、公司O、公司P、公司Q、公司R、公司S、公司T

企业工商信息表结构(表结构参考 国家企业信用信息公式系统 中企业的营业执照信息)如下:

表名:enterprise (企业工商信息表)
字段含义字段名称
统一社会信用代码crn
企业名称entity_name
企业类型entity_type
法定代表人legal_repr
注册资本(万)regist_capital
成立日期establish_date
营业期限自start_from
营业期限至start_to
登记机关register_org
核准日期approve_date
登记状态status
住所address
经营范围scope

在工商数据表中查询样本企业的工商信息:

select * from enterprise where entity_name in ('公司A''公司B''公司C''公司D''公司E''公司F''公司G''公司H''公司I''公司J''公司K''公司L''公司M''公司N''公司O''公司P''公司Q''公司R''公司S''公司T')

在这里插入图片描述

第二步:提取样本企业的特征

能作为特征的,都是有具有较强标识性的。比如一个人,性别可以作为TA的一个特征,但是过于宽泛。我们若是想进一步知道TA是哪一类人,就得再给他贴一些标识,或者标签。而且这些标签得是简短、概括性的。比如:长发、胸大、腰细等,这样,这个人就会在我们的脑海里更加的具象化(想太多的,自行面壁去)。

而对于一个只知道工商信息的企业来说,能用来判断是否是同类企业的最重要字段也就是经营范围了。但是经营范围都是一大段一大段的,所以我们得对它进行语义上的分析,用更简短的词语,去标识这个企业。

经营范围分词

将刚刚获取的样本企业的工商数据导出为csv文件(文件名:sample_enter.csv),用python对所有样本企业的经营范围进行分词

1.也可以用python连接数据库,执行sql语句获取结果。考虑到之后这部分数据可能会频繁使用,我就直接导出成文件了。

2.分词用的是百度的自然语言处理API接口,主要是想用它的词性分析功能。如果想简单点,可以用一些分词的在线工具,对每个企业的经营范围依次进行分词。但是如果样本企业过多,可能会比较费事

import timefrom aip import AipNlp
import pandas as pd''' 创建API的client '''APP_ID = '24037821'  # 替换成自己的
API_KEY = 'gSH3nPHazXwsjGtZHdqQxRaR'  # 替换成自己的
SECRET_KEY = '3SOC3G45LSXwmKeyZsdgQZ9uMySQrbHL'  # 替换成自己的client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
client.setConnectionTimeoutInMillis(3600)sample_enter 

这篇关于[SQL] 通过工商信息筛选潜在客户的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/753812

相关文章

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

SQL Server 中的 WITH (NOLOCK) 示例详解

《SQLServer中的WITH(NOLOCK)示例详解》SQLServer中的WITH(NOLOCK)是一种表提示,等同于READUNCOMMITTED隔离级别,允许查询在不获取共享锁的情... 目录SQL Server 中的 WITH (NOLOCK) 详解一、WITH (NOLOCK) 的本质二、工作

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也

2025版mysql8.0.41 winx64 手动安装详细教程

《2025版mysql8.0.41winx64手动安装详细教程》本文指导Windows系统下MySQL安装配置,包含解压、设置环境变量、my.ini配置、初始化密码获取、服务安装与手动启动等步骤,... 目录一、下载安装包二、配置环境变量三、安装配置四、启动 mysql 服务,修改密码一、下载安装包安装地

MySQL CTE (Common Table Expressions)示例全解析

《MySQLCTE(CommonTableExpressions)示例全解析》MySQL8.0引入CTE,支持递归查询,可创建临时命名结果集,提升复杂查询的可读性与维护性,适用于层次结构数据处... 目录基本语法CTE 主要特点非递归 CTE简单 CTE 示例多 CTE 示例递归 CTE基本递归 CTE 结