当前位置:首页 > AI技术 > 正文内容

AIDE ML — 机器学习工程代理

admin2个月前 (03-27)AI技术52

精益实施,用于实验和扩展。

pip install aideml

该平台将 AIDE 的功能推广到更广泛的代码优化场景,提供实验跟踪和增强的用户控制。

替换新的搜索启发式方法、评估器

——根据数据集快速构建高性能机器学习管道。

智能体使用数据集,并用通俗易懂的英语描述

。无需 YAML 网格或自定义封装。

aide data_dir=… goal="Predict churn" eval="AUROC"

每个 Python 脚本都成为解决方案树中的一个节点;LLM 生成的补丁会生成子节点;度量反馈用于修剪和指导搜索。OpenAI 的

(75 项 Kaggle 竞赛)发现,AIDE 的

树搜索算法获得的奖牌数量是最佳线性智能体

(OpenHands)的

此仓库提供的实用功能

——查看完整的解决方案树以及附加到每个节点的代码。

Streamlit UI

– 机器学习解决方案原型。

——OpenAI、Anthropic、Gemini 或任何支持 OpenAI API 的本地 LLM。

基于 AIDE 的特色研究

MLE-bench:

在机器学习工程中评估机器学习

RE-Bench:评估语言模型代理相对于人类专家的前沿人工智能研发能力

AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现

自动化LLM速通基准测试:重现NanoGPT改进

用于机器学习的人工智能研究代理:MLE-bench 中的搜索、探索和泛化

ML-Master:通过融

合探索与推理,迈向人工智能

知道还有其他引用或衍生自 AIDE 的公共项目吗?

如何使用 AIDE ML

1  Install

pip install -U aideml

2  Set an LLM key

OPENAI_API_KEY=

https://platform.openai.com/api-keys

3  Run an optimisation

aide data_dir=

example_tasks/house_prices

Predict the sales price for each house

RMSE between log‑prices

运行结束后你会发现:

logs//best_solution.py

logs//tree_plot.html

– 点击查看解决方案树

pip install -U aideml

adds streamlit

aide/webui

streamlit run app.py

使用侧边栏粘贴您的 API 密钥,上传数据,设置

用户界面显示实时日志、解决方案树和最佳代码。

Choose a different coding model and run 50 steps

aide agent.code.model=

claude-4-sonnet

agent.steps=50 \

data_dir=… goal=… eval=…

agent.code.model

LLM 用于编写代码

gpt-4-turbo

agent.steps

agent.search.num_drafts

在 Python 中使用 AIDE ML

basicConfig

'%(asctime)s - %(name)s - %(levelname)s - %(message)s'

aide_logger

aide_logger.

"Starting experiment..."

Experiment

"example_tasks/bitcoin_price"

# replace this with your own directory

"Build a time series forecasting model for bitcoin close price."

# replace with your own goal description

# replace with your own evaluation metric

best_solution

f"Best solution has validation metric:

best_solution

valid_metric

f"Best solution code:

best_solution

"Experiment finished."

'__main__'

本地LLM(Ollama示例)

OPENAI_BASE_URL=

http://localhost:11434/v1

aide agent.code.model=

data_dir=… goal=… eval=…

注意:评估器默认为 gpt-4o。

完全本地化(代码+评估器——无外部调用)

export OPENAI_BASE_URL="http://localhost:11434/v1"

aide agent.code.model="qwen2.5" agent.feedback.model="qwen2.5" data_dir=… goal=… eval=…

提示:使用完全本地化的模型时,性能可能会有所下降。

docker build -t aide

docker run -it --rm \

${LOGS_DIR

:/app/logs

${WORKSPACE_BASE

workspaces}

:/app/workspaces

/aide/example_tasks:/app/data

-e OPENAI_API_KEY=

your-actual-api-key

aide data_dir=/app/data/house_prices goal=

Predict price

git clone https://github.com/WecoAI/aideml.git

pip install -e

如果您在工作中使用 AIDE,请引用以下论文:

AIDE: AI-Driven Exploration in the Space of Code

Zhengyao Jiang and Dominik Schmidt and Dhruv Srikanth and Dixing Xu and Ian Kaplan and Deniss Jacenko and Yuxiang Wu

2502.13138

archivePrefix

primaryClass

https://arxiv.org/abs/2502.13138

相关文章

Unity 机器学习 基础

ML-Agents 资产导入 Unity 场景创建 Unity 代码部分 Anaconda 执行 rollerball_config.yaml 机器学习逻辑处理...

深入理解优化:如何利用 Gemini 3.1 的阶梯计费策略?企业级大规模调用实务完全指南|Duuu笔记

需深入理解Gemini 3.1阶梯计费与调用联动关系,通过识别阶梯区间、请求级Token预估截断、多模型路由调度、响应缓存去重、项目拆分配额绑定五种路径优化成本。 ☞☞☞AI 智能聊天, 问答助手,...

AI核心技巧:如何重置openclaw硬件设置 openclaw恢复出厂设置操作方法【操作】深度解析|Duuu笔记

重置 OpenClaw 配置有四种方法:一、交互式向导重置(openclaw onboard --reset);二、指定作用域的命令行重置(如--reset-scope config);三、手动删除~...

前端开发实战详解:骡子快跑怎么注册账号 骡子快跑账号注册流程最佳实践|Duuu笔记

骡子快跑注册仅需1分钟,但激活码需从Discord指定频道获取,输错3次将锁账户24小时;积分与注册邮箱强绑定且不可更换;部分地区即使注册成功也无法运行Agent。 ☞☞☞AI 智能聊天, 问答助手...

从入门到精通:前端开发之骡子快跑支持热点借势吗 骡子快跑节日营销文案生成|Duuu笔记

骡子快跑平台提供五步节日营销文案生成路径:一、调用内置32个节日模板库;二、输入热点事件触发动态生成;三、绑定自有素材库实现个性化延展;四、多角色视角协同输出;五、接入微信生态直发并校验合规性。 ☞...

常见的神经网络模型

前馈神经⽹络中包含激活函数( 、tanh函数等)、损失函数(均⽅差损失函数、 等)、优化算法(BP算法)等。常⽤的模型结构有:感知机、 、全连接神经⽹络、卷积神经⽹络、...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。