Browser Use：让 AI Agent 控制浏览器

项目简介

Browser Use 是一个革命性的开源工具，让 AI Agent 能够像人类一样操控浏览器。通过自然语言指令，AI 可以自动完成网页点击、表单填写、内容提取和页面导航等操作。它的核心价值在于将大语言模型的推理能力与浏览器交互能力相结合，使得 AI 不仅能"思考"，还能"动手"——直接在浏览器中执行操作。

基本信息

项目	数据
GitHub	https://github.com/browser-use/browser-use
Star 数	98,377
编程语言	Python
分类	AI Agent
作者	browser-use
创建时间	2024-10-31
最近更新	2026-06-12

功能介绍

核心功能

自然语言浏览器控制：通过简单指令让 AI 执行复杂的浏览器操作，如"登录网站并下载报表"
智能元素定位：AI 自动识别网页中的按钮、输入框和链接，无需手动编写选择器
多步骤任务编排：支持串联多个操作步骤，自动处理页面加载、弹窗和登录验证

应用场景

Web 自动化测试：自动执行跨浏览器的功能性测试流程
数据采集：从多个网站自动提取和整合结构化数据
RPA 流程自动化：替代传统 RPA 工具，实现更灵活的办公自动化

优势特点

零配置上手：只需几行 Python 代码即可开始使用
多模型支持：兼容 OpenAI、Claude、Gemini 等多种主流大语言模型
抗页面变化：基于语义理解而非固定选择器，页面变化时依然稳定运行

数据来源： GitHub - https://github.com/browser-use/browser-use 发布时间： 2026-06-12 作者： browser-use 原文链接： https://github.com/browser-use/browser-use