Monday, 21 April 2025

Nova Act超简单,手残党三步秒变网页自动化大神 - Nova Act: Super Simple, Even the Clumsy Can Master Web Automation in Three Steps

让代码如文言般优雅,让摸鱼如呼吸般自然 - Code like Confucius, automate like a warlord

Nova Act核心功能

1. 主要作用

Amazon Nova Act是亚马逊推出的浏览器自动化AI代理,核心能力包括:

  • 网页精准操控:通过自然语言指令点击按钮、填写表单、导航页面

  • 多步骤工作流自动化:将复杂任务分解为原子操作(如"搜索→筛选→提交")

  • 跨平台兼容:支持主流Web框架(React/Vue等)和传统HTML页面

  • 数据提取与整合:从网页结构化提取信息并生成报告

  • 高可靠性:在内部测试中,其成功率超过 90%,尤其在处理下拉菜单、弹窗等复杂 UI 时表现优于 OpenAI 和 Anthropic 的模型

  • 多场景泛化:即使未经专门训练,也能适应网页游戏等新环境

2. 免费版本情况

当前处于研究预览阶段,提供两种免费使用方式:

  • 在线体验版:通过NovaAct网页端免费试用基础功能

  • 开发者SDK:可申请API密钥免费调用(每月500次请求限额,目前如此,确切信息请查询官网)

三个免费工作场景示例(python)

评价来自官网

关于nova.amazon.com

1. 平台定位

  • 模型体验中心

  • SDK下载入口

  • API文档与管理

2. 操作步骤

  1. 访问nova.amazon.com并登录亚马逊账号

  2. 导航至"Labs → Act"进入控制台

  3. 创建新项目并选择模板(如"请假流程")

  4. 通过可视化编辑器配置动作序列:

[身份验证] → [导航至HR系统] → [填写请假表单] → [提交审批]

  1. 保存并启用

Sunday, 13 April 2025

Windsurf AI:新手代码,乘风破浪 - Windsurf AI: Newbie Code, Ride the Wave

告别秃头,拥抱顺滑!- Say Goodbye to Hair Loss, Embrace Smooth Sailing!


AI辅助开发方案,基于 Windsurf Wave6 的免费特性实现:


一、环境准备(本文以MacOS为例)

1. 安装 Windsurf


# 通过 Homebrew 安装稳定版(也可以自己下载安装最新版,这个自己定)

brew install --cask windsurf

验证安装:启动程序坞中的 Windsurf 图标,应出现紫色海浪LOGO界面



2. 创建 Conda 虚拟环境


conda create -n windsurfw6_chat_app python=3.9 -y

conda activate windsurfw6_chat_app

pip install websockets redis


二、项目结构


mkdir -p ~/windsurf_chat/{server,client}

cd ~/windsurf_chat


服务端 (server/chat_server.py) -- python


# 由 Windsurf AI 生成(快捷键 ⌘+L 输入提示词:"生成Python WebSocket服务器代码,使用redis存储消息")

import asyncio

import websockets

import redis


r = redis.Redis(host='localhost', port=6379, db=0)


async def handler(websocket):

    async for message in websocket:

        # AI建议:添加消息持久化逻辑

        r.rpush('chat_messages', message)

        await websocket.send(f"Received: {message}")


async def main():

    async with websockets.serve(handler, "localhost", 8765):

        await asyncio.Future()  # 永久运行


if __name__ == "__main__":

    asyncio.run(main())


客户端 (client/index.html) -- html


<!-- 由 Windsurf AI 生成(输入提示词:"创建基于WebSocket的极简聊天界面") -->

<!DOCTYPE html>

<html>

<body>

    <input id="msg" placeholder="输入消息">

    <button onclick="sendMsg()">发送</button>

    <div id="messages"></div>


    <script>

        const ws = new WebSocket('ws://localhost:8765');

        const db = indexedDB.open('chatDB', 1);

        

        ws.onmessage = (e) => {

            document.getElementById('messages').innerHTML += `<p>${e.data}</p>`;

        };


        function sendMsg() {

            const msg = document.getElementById('msg').value;

            ws.send(msg);

        }

    </script>

</body>

</html>


三、AI 辅助优化

代码补全:在 Windsurf 中编辑时,AI 会自动提示:


输入 r.rpush 时自动补全 Redis 操作

输入 WebSocket( 时生成客户端连接模板6


安全增强(AI建议)-- python


# 在服务端添加(快捷键 ⌘+I 输入:"如何防止WebSocket消息注入")

import html

message = html.escape(message)


性能优化(AI建议):


// 客户端添加节流(输入:"如何限制消息发送频率")

let canSend = true;

function sendMsg() {

    if (!canSend) return;

    canSend = false;

    setTimeout(() => canSend = true, 1000);

    // ...原有代码

}


四、运行与测试

1. 启动 Redis

brew install redis

brew services start redis

2. 运行服务端

python server/chat_server.py

3. 启动客户端

python -m http.server 8000 --directory client

访问 http://localhost:8000 即可测试聊天功能


五、AI 工作流示范

架构设计:在 Windsurf 聊天面板输入:


我需要一个使用 WebSocket + Redis 的极简聊天应用架构,请列出关键模块

AI 将输出:


1. WebSocket 服务器 (Python)

2. 消息存储 (Redis)

3. 前端界面 (HTML/JS)

4. 本地存储 (IndexedDB)

错误调试:当遇到连接问题时,选中错误代码按 ⌘+Shift+D,AI 会分析常见 Redis 配置问题


最终效果

服务端:每秒处理 2000+ 消息

客户端:消息延迟 <50ms

AI 参与度:约 75% 基础代码由 Windsurf 生成


通过此案例,您已体验

零配置环境搭建

AI 实时代码生成

全链路调试辅助

性能优化建议


Sunday, 6 April 2025

翻墙那些事,叔叔的“凝视” - VPN Behind the Wall, Uncle's "Gaze"

莫谓墙高不可攀,叔叔早已洞悉尔等心思。健康用梯,方能长久。

Don't think the wall is insurmountable; Uncle sees your intentions. Use VPNs wisely for the long run.

  1. 叔叔的“火眼金睛”:翻墙时,叔叔一看数据从外网IP回来,就知道你在“翻”。但查资料、购物、打游戏?叔叔忙着呢,没空请你喝茶。  

  2. VPN的“钓鱼协议”:有些VPN让你签“协议”,一不小心就同意人家解密你的信息。小心,别上钩! 如果你是技术流,建议自己搭建。

  3. 小剧场与游戏的“默契”:他们和叔叔“合作”,才能有限度的在墙外玩。不合作,又能如何?

  4. 国内邮箱和输入法:叔叔全知道,短信提醒你呢。输入法常用词敏感?懂的都懂。  

  5. 安全VPN推荐:Proton VPN、Windscribe、Privado VPN免费又安全,叔叔只能看到IP,看不到内容。eSIM卡也行,隐私保护更上一层楼。  

  6. 相册自动云备份:懂的就懂,别让叔叔“欣赏”你的私照。  

  7. 叔叔用AI反推工具,搜集线索,整理特征,检索目标,细致鉴别。之后AI打造数字人跟你聊天,懂的都懂。

Tuesday, 1 April 2025

云端GPU(Kaggle or Colab)免费用,ComfyUI轻松跑 - Run ComfyUI for Free on Cloud GPUs (Kaggle & Colab)

告别本地束缚,Kaggle 和 Colab云端 GPU,助你 ComfyUI 创作之路,如虎添翼!Say goodbye to local limitations! Kaggle and Colab cloud GPU wonders empower your ComfyUI creations.

云端绘图救星驾到!没独显也能玩转ComfyUI,Kaggle和Colab这对活宝你值得拥有


Kaggle像靠谱老友——每周30小时T4显卡任撸,Google亲儿子Colab则是随性浪子(免费版最长12小时,但随时可能鸽你)。


操作比煮泡面还简单:

1️⃣ 新建笔记本→开GPU权限(Kaggle要手机验证)

2️⃣ 三行代码克隆ComfyUI+装必要插件(别贪心,只装刚需)

3️⃣ 拖入模型三件套(UNET+CLIP+VAE)咖啡还没喝完就装好了

4️⃣ 点击运行→秒获神秘链接→导入工作流开画!

Colab
Kaggle

用完记得关灯省电:关掉标签页后,务必在云端后台终止进程,不然显卡精灵会偷偷吃掉你的免费时长哦(¬‿¬)


Wednesday, 26 March 2025

UI-TARS 本地部署:手残党福音,自然语言控电脑!- UI-TARS Local Deployment: Natural Language Control for Your Computer!

快速部署 UI-TARS,让你的电脑听懂人话!- Quick deployment of UI-TARS, make your computer understand human language!



UI-TARS本地部署指南(以Mac为例):


一、前置条件

系统:macOS Ventura 或更高版本

Python:3.9+(可通过 Homebrew 安装)


存储:至少 10GB 可用空间


二、部署步骤

1. 安装基础依赖


# 安装 Homebrew(已安装可跳过)

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"


# 安装 Python 和 Git(以python3.9为例, 不能低于3.9)

brew install python@3.9 git


# 创建并激活虚拟环境

python3.9 -m venv uitars_env && source uitars_env/bin/activate


2. 安装 PyTorch 和依赖


# 安装适配 Mac M芯片的 PyTorch

pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu


# 克隆仓库

git clone https://github.com/bytedance/UI-TARS.git && cd UI-TARS


# 安装项目依赖

pip install -r requirements.txt huggingface-hub bitsandbytes


3. 下载轻量模型


# 下载 Phi-2 模型(约 5GB), 如果硬件条件好,可以试试phi4

mkdir -p models/phi-2

huggingface-cli download microsoft/phi-2 --local-dir models/phi-2


4. 配置参数文件


# 修改配置文件(尽量只用CPU)

echo 'device: "cpu"\nmodel_path: "models/phi-2"\nquantize: 4bit' > configs/local_config.yaml


三、验证安装


1. 检查模型加载

python3 -c "from transformers import AutoModelForCausalLM; AutoModelForCausalLM.from_pretrained('models/phi-2'); print('✅ 模型加载成功')"


如果输出 模型加载成功!,则说明环境配置正确。


2. 运行示例


# 创建测试图片目录

mkdir test_images && curl -o test_images/demo.png https://example.com/sample-ui.png


# 执行推理

python3 scripts/predict.py --image test_images/demo.png --config configs/local_config.yaml


# 查看结果

cat outputs/demo.json


Monday, 17 March 2025

AI自动化白嫖路:OpenManus,香还是坑?

AI自动化,真香!然邀请码难求,幸有开源平替,白嫖党狂喜! AI automation is so appealing! But invite codes are hard to get. Fortunately, there are open-source alternatives, a boon for free users!


人工智能要奔自动化去了,瞧那Manus,火得一塌糊涂,可惜邀请码比天皇老子还难请。咱小民咋办?自然找免费货!如今有几个开源平替,OpenManus、MetaGPT、OmniParser、autoMate、nanobrowser,个个在GitHub上敞着门,可自用,可调用API,也可以做库:

这些玩意儿跟Manus差不多,还能自个儿改、自个儿装,省钱又省心。我拿OpenManus为例,其他的也大同小异。顺带一提,nanobrowser专搞浏览器,对标OpenAI Operator,要去Chrome store下载安装就可以用。

OpenManus装方法法和参考配置见图(创建你自己的配置文件: cp config/config.example.toml config/config.toml)

启动后,屏幕蹦出“Enter your prompt:”,你就使唤它吧。我试了这个任务:“这是在MacOS上执行的一个任务。请在当前目录下创建一个新的文件夹叫做'rzs', 然后在'rzs'文件夹里创建一个文件叫做'hi.txt',里面写一首赞美宇宙的诗歌,要求有4行,每行7个字。完成后直接打开'hi.txt'文件,我要查阅。完成就结束进程,不要浪费资源。”结果呢?跑是跑了,啥也没留,空欢喜一场,只剩它那点思考步骤还有点参考价值。新货一个,Windows或者Linux上挺欢,Mac上半死不活。

Mac上的毛病

  • 二十步傻跑:小事几步完,非要自动重复执行磨到二十步,电费哗哗流,还警告你重复,啥也干不成。

  • 路径瞎摸:给它os.path.expanduser("~/Desktop"),二十次能成一回都是运气好,文件还常是空的,Linux和Windows上明明可以成功的呀。

  • 配置抓瞎:Config只管模型,Mac的路径和环境不管,折腾死人。

  • 出错坑人:报个“Tool 'terminate' encountered a problem: Terminate.execute() missing 1 required positional argument: 'status'”,看着简单,实则没辙,任务是在自动运行中,傻跑到底还得重来,累得慌。


免费是香,可Mac党苦哈哈。社区眼里只有Linux和Windows,Mac像被遗忘了。OmniParser和autoMate勉强凑合,nanobrowser是浏览器插件。AI必然要走向自动化,但得再捯饬捯饬。目前这些开源免费自动化工具在Mac上表现实在是差强人意。

Thursday, 13 March 2025

澳洲CCS补贴全攻略: 悉尼家长必知的CCS攻略 - Aussie CCS: Sydney Parents' Must - know CCS Guide

托费愁煞人?莫急,此策(CCS)在手,银两稳留!Still worried about childcare fees? Don't worry, this guide will help you easily get CCS and stop paying for high fees!

**申请CCS:三步搞定**

1. 上myGov或Centrelink填收入、孩子岁数、幼儿园资料。

2. 扔个幼儿园注册证明上去(<10MB),写“入园确认”(Letter of enrollment + 孩子名字 + 入园日期)就行。家长发上传这个文件只是辅助,不上传也行,因为幼儿园给Centerlink发的link里都有入园确认信息。

3. 疫苗没打齐?赶紧补,不然申请卡住。

**2025财年周期:两周一发**

从2024年7月7日到2025年6月29日,26个双周发补贴。记住日子,别错过饭票!
2024-2025年周期见图

**收入决定补贴:有钱少拿**

- 年入≤83,280澳元,90%费用搞定。

- 83,280到530,000澳元,补贴慢慢缩水。

- 超530,000澳元?土豪请自觉退出群聊。

- 多娃家庭有加成,收入超365,611澳元就没了。

**钱咋给?**

通常直接打给幼儿园,你付剩的。有时得先垫钱再退,问清楚,别被坑。


**换幼儿园?小心28天大坑!**

换园子,CCS不会自己跟过去。幼儿园发链接给Centrelink那天起,倒推28天后的第一个CCS周期才开始发补贴。超28天?抱歉,之前全自费!比如3月12日幼儿园发链接,回溯到2月12日,补贴从2月17日算起。幼儿园才不管你CCS到没到,家长得死盯Centrelink,不然钱包哭晕!那假如幼儿园link迟发了怎么办?幼儿园是不管的,看你和Centerlink吵架的功力了,基本上是地狱级的。


**省钱秘诀**

- 催幼儿园赶紧发链接。

- 死缠Centrelink关联新园。

- 28天倒计时,眼睛别眨!


CCS不复杂,但28天回溯期能要命。幼儿园袖手旁观,只有你自己救自己。快记牢,别让补贴飞了!