将Apify集成到NebulaAIFlow
Apify是一个网页抓取和数据提取平台。它提供了一个Actor商店,其中包含超过3,000个现成的云端工具,这些工具被称为Actors。
NebulaAIFlow中的Apify组件运行Actors来完成数据提取、内容分析和SQL操作等任务。
前提条件
在流程中使用Apify Actors组件
要在流程中使用Apify Actor:
- 点击并拖动Apify Actors组件到您的工作区。
- 在Apify Actor组件的Apify Token字段中,添加您的Apify API令牌。
- 在Apify Actor组件的Actor字段中,添加您的Actor ID。
您可以在Apify Actor商店中找到Actor ID。
例如,网站内容爬虫的Actor ID是
apify/website-content-crawler
。 - 该组件现在可以作为工具连接到Agent组件,或配置为手动运行。 有关手动运行组件的更多信息,请参阅Apify文档中的JSON示例。
示例流程
以下是使用Apify Actors组件的一些示例流程。
以Markdown格式提取网站文本内容
使用网站内容爬虫Actor以Markdown格式从网站提取文本内容,并在您的流程中处理它。
使用agent处理网页内容
使用网站内容爬虫Actor提取网站内容,然后使用agent进行处理。
agent获取提取的数据并将其转换为摘要、见解或结构化响应,使信息更具可操作性。
使用多个actors分析社交媒体资料
使用多个Apify Actors进行全面的社交媒体研究。
添加Google搜索结果抓取Actor来查找相关的社交媒体资料,然后添加TikTok数据提取Actor来收集数据和视频。
agent收集来自Google的链接和来自TikTok的内容,并分析数据以提供关于个人、品牌或主题的见解。
输入参数
名称 | 显示名称 | 信息 |
---|---|---|
apify_token | Apify Token | 您的Apify API密钥。 |
actor | Actor | 要运行的Apify Actor,例如apify/website-content-crawler 。 |
run_input | Run Input | 配置Actor运行的JSON输入。有关更多信息,请参阅Apify文档。 |
输出参数
名称 | 显示名称 | 信息 |
---|---|---|
output | Actor运行结果 | 包含Actor运行输出的JSON响应。 |