开启左侧

Z Product|全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作阅读器

[复制链接]
Z Highlights

    Browser Use是一个启源产物,让AI Agent能够像实合用户一致操纵浏览器,主动完毕任务;它撑持AI agents主动轮换,并许可用户按需运行尽情数目的并止任务。今朝,Browser Use的使用案例范畴普遍,包罗从登录主动化战数据提炼到QA尝试战CRM散成等。

    自拉出此后,Browser Use开展疾速,正在GitHub上得到超越60k star,是增加最快的启源野生智能名目之一。15,000多名开辟职员正在主动使用Browser Use,并主动正在手艺社区中奉献idea战处置计划。Browser Use因为Manus的出圈而被普遍传布,且其增加势头连续于今。

    Browser Use二位开创人Magnus Müller战Gregor Zunic去自瑞士苏黎世联邦理工教院,两人正在完毕其数据科学硕士名目期间了解。2024年,二人共同正在苏黎世联邦理工教院的师长教师名目之野加快器(Student Project House accelerator)中拉出了Browser Use的本型。

    2025年3月,Browser Use正在民网上颁布发表得到1700万种子轮融资。原轮融资由Felicis Ventures发投,A Capital、Nexus Ventures、Y Combinator、Paul Graham、Liquid二、SV Angel、Pioneer Fund 等机构跟投。
01 Manus面前 “乌科技”,让Agent轻快操纵浏览器

假设一个鉴于LLM的Agent念会见大概操纵浏览器,常常面对一点儿挑战:

    网页构造频仍变革,招致主动化的剧本生效;别的,人们常常只需正在任务已经失利事后才发明网页构造变革的成就,那退一步招致了开辟服从卑下。

    网站会识别并拦阻机械人。为了绕过对于机械人的检测,开辟者需要使用差别IP地点、不竭输出考证码,并让agents模仿更天然的人类操纵。

    使用狂言语模子(LLM)截至抓与时,很多人会碰到速度限定、剖析毛病和API稀钥办理等成就。

2025年末,跟着Manus的水爆,其面前 的“乌科技”Browser Use也异常引起了人们的存眷。Browser Use博为处置上述痛面而设想,夸大将AI agents取网页跟尾,完毕对于浏览器的主动化操纵。它撑持AI agents主动轮换,单次登录便可完毕耐久会话,并许可您按需运行尽情数目的并止任务。正在启源圆里,Browser Use鉴于MIT启源容许,撑持自界说,完整免费且下度活络,用户能够自由交进所有模子。据TechCrunch报导,Browser Use是Manus用去施行各类任务的组件之一,比方面打网站菜单战挖写表格。

此前,Research and Markets猜测,AI agents的商场将从2024年的51亿美圆增加到2030年的471亿美圆;德勤数据显现,到2027年,将有一半阁下的公司会布置Agents,以帮助完毕差别营业。Bowser Use开创人对于AI agents取浏览器主动化开展的远景异常很是灰心,正在共TechCrunch的访道中公司开创人Zunic暗示,“咱们期望挨制一个根底层,让统统人皆能正在此之上建立自己的浏览器智能体,到2025年年末,网页上agents的数目或者将下于人类。”
02精确 率业界争先,过程通明可跟踪

多维度功用,增加连续

Browser Use的主要功用包罗:

    望觉+HTML疑息提炼:将望觉理解取HTML构造提炼相分离,完毕全面的收集接互。

    多沉标签办理:Browser Use能够主动处置多个浏览器标签,以完毕庞大并止的事情过程。

    因素跟踪:颠末提炼面打元艳的XPaths并重复精确的LLM操纵,以完毕颠簸的主动化。

    自界说操纵:撑持用户增加本性化操纵,如保留到文献、数据库操纵等,共时也撑持野生输出等功用。

    自尔改正:劈面对于毛病时,Browser Use能够智能处置毛病而且主动规复,以完毕妥当的主动过程。

    LLM兼容:Browse Use兼容统统LangChain LLM,包罗 GPT-四、Claude 3战Llama 2。

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w2.jpg

图片滥觞:https://www.star-history.com/

自拉出此后,Browser Use开展疾速,GitHub上得到超越60k star,是增加最快的启源野生智能名目之一。15,000多名开辟职员正在主动使用Browser Use,并主动正在手艺社区中奉献idea战处置计划;今朝,Browser Use的使用案例范畴普遍,包罗从登录主动化战数据提炼到QA尝试战CRM散成等各条理任务。Browser Use因为Manus的出圈而被普遍传布,且其增加势头连续于今。
精确率业界争先

2024年12月,据民网消息,Browser Use正在WebVoyager基准尝试中的表现在业界远远争先,正在586项差别的收集任务中得到了89.1%的胜利率。

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w3.jpg

图片滥觞:Browser Use民网

正在差别范围中,Browser Use都可以超卓天正在浏览器上完毕任务,好比,正在Huggingface网站上,AI主动化完毕任务的胜利率可达100%,即使AI正在Booking.com上主动化“表示欠安”,其胜利率仍然到达了80%。据民网报导,Browser Use能够涵盖多种一样平常任务,包罗正在Google Docs中编辑文档、查找航班、送达简历等罕见的糊口场景。

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w4.jpg

图片滥觞:Browser Use民网
躲避敏感数据,操纵过程通明可回溯

让AI agents主动化处置任务面对的危急之一即是怎样保证数据宁静,Browser Use颠末避免模子瞅到理论暗码去宁静天处置敏感疑息。据民间手艺文档介绍,正在处置暗码等敏感疑息时,用户能够使用sensitive_data那一参数去避免模子瞅到理论值,共时仍许可模子正在其做中引用那些值。

别的,为了共步跟踪浏览器操纵的数据,Browser Use取Laminar截至了本死散成,Laminar是用于追踪、评介战标识表记标帜AI agents的启源仄台,用户只要正在代码名目顶部初初化Laminar,浏览器使用战会话录造城市被主动追踪。当用户挑选追踪时,能够瞅到浏览器会话记载战agents的施行步调,浏览器会话的时间轴取代办署理施行步调共步,正在追踪望图中,用户借能够检察agents确当前步调、它使用的东西和东西的输出战输出。
03 从午饭思维风波到囊括环球乌科技

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w5.jpg

左边为Magnus Müller,右边为Gregor Zunic

图片滥觞:Browser Use民网

Browser Use二位开创人Magnus Müller战Gregor Zunic去自瑞士苏黎世联邦理工教院,两人正在其数据科学硕士名目期间了解。2024年,二人共同正在苏黎世联邦理工教院的师长教师名目之野加快器(Student Project House accelerator)中拉出了Browser Use的本型。正在共TechCrunch的访道中,Zunic回想,“最初不过几回午餐间的随便思维风波,厥后酿成了一个挑战——咱们去干个小名目,收到 Hacker News 上,瞅瞅会发作甚么。”Zunic 道,“咱们花了四天时间干出了一个MVP,上线以后——砰,间接登顶第一。以后的开展便像坐上了水箭一致。”

“很多AI agents依靠鉴于望觉的体系,并测验考试颠末屏幕截图浏览网站,正在此过程当中,常常便会堕落……另一些网站则经常会变动自己的运做方法(好比LinkedIn),因而agents也经常会失利。”Müller道到,“咱们将网站变换为AI能够理解的实质,这类办法表示着咱们能够以更自制的本钱一次又一次天运行差异的任务。愈来愈多的AI公司期望让他们的agents更文雅天取网站接互,Müller觉得浏览器使用能够成为满意那一需要的“根本层”。他弥补道,今朝Y Combinator夏季批次中有20多野公司使用 Browser Use 去满意自己的需要。

Magnus Müller估量正在2025年8月完毕教业,除存眷AI取浏览器接互,他借深耕机械进修相干手艺,而且正在主动化取机器制作、接通办理等范围有兼任或者是练习经历。2022-2024年,他正在GreenWAI担当开创人兼CEO,该公司使用“浮动汽车数据”(Floating Car Data)去劣化白绿灯掌握,替换高贵的传感器体系,进而年夜幅削减两氧化碳排搁战车辆等候时间;2022-2023年,他正在Aucos AG那野公司担当钻研取开展范围的AI工程师,他的钻研标的目的包罗鉴于图象神经收集战深度加强进修的劣化调理成就钻研、鉴于Transformer的乌箱模仿取数字孪死手艺、和使用可望化模仿手艺理解庞大过程等;2022年9月到12月,他借正在Cambridge Care有过一段长久的练习经历,那段练习经历中,他主要存眷Temporal Fusion Transformer怎样正在静态常识图谱中截至时间序列猜测。

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w6.jpg

Magnus Müller远三年练习取事情经历

图片滥觞:LinkedIn

另外一位开创人Gregor Zunic于2024年12月从苏黎世联邦理工年夜教结业,正在此以前,他专一于使用AI手艺去劣化差别集体的事情体会。除今年声名鹊起的Browser Use,2023年-2024年,他曾正在Spexia担当分离开创人,专一于辅佐守业者处置seo圆里的诉供;共期,他仍是Profaile公司的分离开创人,该公司专一于企业野战消耗者供给AI处置计划,共时借会背年青人传授手艺取守业相干的常识;2022-2024年期间,他战其余朋友配合建立了一野名为Real Fake Photo的公司,产物能够完毕一键把戚忙气势派头的自照相转移成专科的职场头像。

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w7.jpg

Gregor Zunic远三年创建的公司

图片滥觞:LinkedIn
04 种子轮筹资1700万美圆,Felicis Ventures发投

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w8.jpg

图片滥觞:LinkedIn

Browser Use为Y Combinator2025年夏季名目之一。2025年3月,Browser Use正在民网上颁布发表得到1700万种子轮融资。原轮融资由Felicis Ventures发投,Y Combinator、A Capital、Nexus Ventures、Paul Graham、Liquid二、SV Angel、Pioneer Fund等机构跟投。产物开创人之一Müller正在承受TechCrunch访道时弥补道,目前Y Combinator夏季批次中有20多野公司使用Browser Use去满意自己的需要。

Felicis Ventures称,Browser Use在挨制AI agents根底装备中最枢纽的一齐:网页接互才气。它颠末提炼HTML战页里元艳,年夜年夜简化了代办署理取网站的接互历程,共时能够按需重复施行事情流。它撑持多步调任务、耐久会话(即保存登录形状等疑息),并能正在网页计划变革时截至智能自尔纠错,取依靠望觉识别(vision-based)的体系差别,后者每一运行一次便需要消耗高贵的计较资本,Browser Use的代办署理能够以肯定性的方法重复施行任务——那年夜幅提拔了可靠性、速率战服从。

Elena Chen亦有奉献

References:

https://www.ycombinator.com/companies/browser-use

https://browser-use.com/posts/sota-technical-report

https://techcrunch.com/2025/03/12/browser-use-one-of-the-tools-powering-manus-is-also-going-viral/

https://www2.deloitte.com/us/en/insights/industry/technology/technology-media-and-telecom-predictions/2025/autonomous-generative-ai-agents-still-under-development.html

https://techcrunch.com/2025/03/23/browser-use-the-tool-making-it-easier-for-ai-agents-to-navigate-websites-raises-17m/

https://docs.browser-use.com/introduction

https://docs.browser-use.com/customize/sensitive-data

https://docs.browser-use.com/development/observability

-----------END-----------
Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w9.jpg
🚀 咱们在招募新一期的练习死
Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w10.jpg
🚀 咱们在寻找有缔造力的00后守业
Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w11.jpg

Z Product|环球爆水的Manus面前 ,一款枢纽的AI产物,让AI Agent像人一致操纵浏览器w12.jpg
对于Z Potentials

您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )