|
LLM列出符合选择标准的公司(名称和主页URL);
对于在 Crunchbase 上确定的公司,我们会通过 Crunchbase、互联网搜索结果和公司网站仔细检查选择标准;
我们根据互联网搜索结果和公司网站回答补充问题。
Heraeus 开发的基于 Web 的 RAG 解决方案概述
Heraeus 开发的基于 Web 的 RAG 解决方案概述
对于步骤 3 和 4,我们首先尝试仅使 丹麦电报数据 用搜索结果(类似于 FreshPrompt)和 Crunchbase 的公司描述进行回答,如果不确定,我们会利用从公司网站抓取的内容(类似于 Web Research Retriever)再次尝试。在这两种情况下,我们都将网络搜索限制在公司的域名范围内,以降低出现错误或过时信息的风险。
完成这 4 个步骤后,最终用户可以使用 Web 界面来可视化结果、检查相应的来源和引用并验证销售线索。
经验教训
该项目在以下几个方面具有启发意义:
仅使用 GPT-4就可以生成大量可能感兴趣的公司列表。这些公司中有少数已经消失或更名(这是意料之中的,因为我们只依赖 GPT4 的内部记忆),但我们几乎没有看到真正的幻觉的例子,即根本不存在的公司。总体而言,Heraeus 估计,识别销售线索所节省的时间约为 60%-70%,并指出该项目带来了原本无法识别的销售线索。
通过搜索结果和网页进行双重核对通常很有效。主要问题是有时相关信息并不在互联网上公开。例如,核实公司产品的选择标准要比核实其生产过程容易得多。
|
|