其实去年我就有做AI获客的想法了。当时帮一个外贸公司做过自动分析客户级别以及自动生成邮件的项目,了解到他们对获取客户的需求非常迫切。他们通常从谷歌浏览器、会展名单以及海关数据中获取客户信息,但是整个过程非常耗时。
我就在想:能不能模拟这些销售人员找客户的过程,用AI来做个自动化工具?
特别是看到DeepSeek等大模型的出现后,我觉得不能再拖延了,这应该是AI落地的绝佳机会了。
我一共实现了三个方案,分别是利用embeding模型和本地知识库构建的语义检索的方案; 利用coze搭建的工作流方案,这个可以直接在公众号里面测试;最后还有利用我之前开源的WebExtracto实现的本地方案。
语义检索知识库
首先是把提前跑好的数据,存进milvus向量库中,采用向量索引方法,如IVF(倒排文件索引)或HNSW(分层导航小世界图索引)等,根据用户问题的语义进行检索。
其实我去年的时候就已经把这部分的demo搞好了,效果如下:
语义检索之前
语义检索之后
其实语义检索的效果已经很好了,但是这个的效果还是取决于原始数据量,目前的数据量太少所以就比较鸡肋了。所以我就转向了第二种思路上。
基于扣子工作流的智能体搜索
我的主要思路分为三步
第一步,把用户的问题转换成搜索引擎的搜索词
然后用coze做了一个智能体,调用搜索引擎搜索内容并返回相应的公司名称。
之所以用coze,主要是因为coze里面有个搜索引擎插件,调用速度比我本地用duckduckgo搜索快得多,但是目前发现扣子里面的必应搜索似乎优先返回头条内容,所以后面可能还是要换回本地的搜索引擎。
获取公司名称后再去检索公司的详情信息,coze的工作流如下:
这里面主要的思路是找公司官网并遍历官网获取详细的公司介绍,产品介绍以及邮箱和电话等。
利用coze完成的这个功能,我已经发布到了公众号中,大家可以直接在我的公众号聊天中即可触发。
需要注意的是因为处理速度很慢,需要回复继续来触发他继续回复的效果,有时候需要发送两次继续才能得到回复,所以体验上还是差一点。
基于WebExtracto的客户采集
但是因为扣子插件返回优先是头条内容,效果其实还并不是很好,实际上,我之前还开源过一个爬虫的采集工具WebExtracto。
系统架构图
利用这个项目,不仅仅可以获取公司官网的信息,还可以获取如领英里面公司的账号等信息。因此我把获取公司详情的信息用WebExtracto重新实现了一道。
然后,再让模型根据公司简介判断一下,并进行打分,如果是潜在客户再进行推送。
不过本地运行的这个版本目前运行的速度太慢,没办法做成对话实时回复的效果,因此我的想法是把这个产品做成提供自己的需求 + 邮箱,然后通用一个定时任务,把发现的新客户推送到邮箱里面的。
写在最后
2020年时我加入了一家还算有点名气AI公司,主要是做人脸识别,也参与过nlp的训练,那时候感觉到AI市场正在逐渐冷却了,像海康、华为这些公司都开始自己去自研摄像头算法了,并不需要再去采购专门做算法公司的产品。
但是当时的老大也在说第三波AI浪潮马上就要来临,果然,2023年chatgpt横空出世,当时我们便觉得,5年内,生活和工作将会有翻天覆地的大变化。
而今年2025年,感觉已经步入一个AI爆发的年份。特别是本周,DeepSeek每天都在开源自己的工程技术,阿里也开源了最新的视频生成模型,openai推出了gpt4.5, claude3.7也出来了,特别要说下这个claude效果真的非常好,不仅仅是写代码,小说写的也很耐看。
感觉每天都有看不完的AI新闻。
我其实也想把这些项目下载下来好好研究,并分享成文章,但实在没有这个精力。看到很多AI博主每天都在更新这些新技术,很佩服他们的"肝"的能力,但我决定还是专注自己想做的事情。
本来我就是基于兴趣才写技术博客的,如果追求热点就太耗费能量了。所以我决定从今天正好也是我生日这天起完成更新100个大模型落地的想法及实现。
实际上,我做的第一个大模型落地项目是30秒发一篇图文 小红书AI自动化运营神器,同时这个项目我开源到了github中,到今年的3月份,已经有400多star了。因此这个AI获客工具应该算是我做的第二个大模型落地实践。作为一个技术人员,我相信AI不是为了替代人类,而是为了让我们从重复性工作中解放出来,专注于更有创造性的事情。
比如AI获客,它不能替代销售人员的判断和沟通能力,但可以帮他们节省大量筛选客户的时间。
如果你对这个工具感兴趣,可以在公众号菜单找到简单版进行体验。对代码版本感兴趣的朋友,可以加微信并提供邮箱,我会设置定时任务定期给邮箱发送客户信息。
关注我们,期待与大家一起探索大模型落地的更多可能!