当前位置:首页 > AI技术 > 正文内容

AIDE ML — 机器学习工程代理

admin3周前 (03-27)AI技术18

精益实施,用于实验和扩展。

pip install aideml

该平台将 AIDE 的功能推广到更广泛的代码优化场景,提供实验跟踪和增强的用户控制。

替换新的搜索启发式方法、评估器

——根据数据集快速构建高性能机器学习管道。

智能体使用数据集,并用通俗易懂的英语描述

。无需 YAML 网格或自定义封装。

aide data_dir=… goal="Predict churn" eval="AUROC"

每个 Python 脚本都成为解决方案树中的一个节点;LLM 生成的补丁会生成子节点;度量反馈用于修剪和指导搜索。OpenAI 的

(75 项 Kaggle 竞赛)发现,AIDE 的

树搜索算法获得的奖牌数量是最佳线性智能体

(OpenHands)的

此仓库提供的实用功能

——查看完整的解决方案树以及附加到每个节点的代码。

Streamlit UI

– 机器学习解决方案原型。

——OpenAI、Anthropic、Gemini 或任何支持 OpenAI API 的本地 LLM。

基于 AIDE 的特色研究

MLE-bench:

在机器学习工程中评估机器学习

RE-Bench:评估语言模型代理相对于人类专家的前沿人工智能研发能力

AI 科学家 v2:基于智能体树搜索的研讨会级自动化科学发现

自动化LLM速通基准测试:重现NanoGPT改进

用于机器学习的人工智能研究代理:MLE-bench 中的搜索、探索和泛化

ML-Master:通过融

合探索与推理,迈向人工智能

知道还有其他引用或衍生自 AIDE 的公共项目吗?

如何使用 AIDE ML

1  Install

pip install -U aideml

2  Set an LLM key

OPENAI_API_KEY=

https://platform.openai.com/api-keys

3  Run an optimisation

aide data_dir=

example_tasks/house_prices

Predict the sales price for each house

RMSE between log‑prices

运行结束后你会发现:

logs//best_solution.py

logs//tree_plot.html

– 点击查看解决方案树

pip install -U aideml

adds streamlit

aide/webui

streamlit run app.py

使用侧边栏粘贴您的 API 密钥,上传数据,设置

用户界面显示实时日志、解决方案树和最佳代码。

Choose a different coding model and run 50 steps

aide agent.code.model=

claude-4-sonnet

agent.steps=50 \

data_dir=… goal=… eval=…

agent.code.model

LLM 用于编写代码

gpt-4-turbo

agent.steps

agent.search.num_drafts

在 Python 中使用 AIDE ML

basicConfig

'%(asctime)s - %(name)s - %(levelname)s - %(message)s'

aide_logger

aide_logger.

"Starting experiment..."

Experiment

"example_tasks/bitcoin_price"

# replace this with your own directory

"Build a time series forecasting model for bitcoin close price."

# replace with your own goal description

# replace with your own evaluation metric

best_solution

f"Best solution has validation metric:

best_solution

valid_metric

f"Best solution code:

best_solution

"Experiment finished."

'__main__'

本地LLM(Ollama示例)

OPENAI_BASE_URL=

http://localhost:11434/v1

aide agent.code.model=

data_dir=… goal=… eval=…

注意:评估器默认为 gpt-4o。

完全本地化(代码+评估器——无外部调用)

export OPENAI_BASE_URL="http://localhost:11434/v1"

aide agent.code.model="qwen2.5" agent.feedback.model="qwen2.5" data_dir=… goal=… eval=…

提示:使用完全本地化的模型时,性能可能会有所下降。

docker build -t aide

docker run -it --rm \

${LOGS_DIR

:/app/logs

${WORKSPACE_BASE

workspaces}

:/app/workspaces

/aide/example_tasks:/app/data

-e OPENAI_API_KEY=

your-actual-api-key

aide data_dir=/app/data/house_prices goal=

Predict price

git clone https://github.com/WecoAI/aideml.git

pip install -e

如果您在工作中使用 AIDE,请引用以下论文:

AIDE: AI-Driven Exploration in the Space of Code

Zhengyao Jiang and Dominik Schmidt and Dhruv Srikanth and Dixing Xu and Ian Kaplan and Deniss Jacenko and Yuxiang Wu

2502.13138

archivePrefix

primaryClass

https://arxiv.org/abs/2502.13138

相关文章

Unity 机器学习 基础

ML-Agents 资产导入 Unity 场景创建 Unity 代码部分 Anaconda 执行 rollerball_config.yaml 机器学习逻辑处理...

【DL】2023年你应该知道的 10 大深度学习算法

3. 循环神经网络 (RNN) 4. 生成对抗网络 (GAN) 5. 径向基函数网络 (RBFN) 6. 多层感知器 (MLP) 7. 自组织图 (SOM)...

神经网络中的单层神经网络

神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。 看一个经典的神经网络。这是一个包...

前端开发高级应用:MuleRun如何连接Slack通知 MuleRun消息推送集成配置步骤实战案例|Duuu笔记

若MuleRun无法向Slack推送通知,需依次配置Incoming Webhook或Bot Token、在MuleRun中设置对应通知目标参数,并通过最小化任务测试验证;常见失败原因包括凭据错误、权...

深入理解优化:如何利用 Gemini 3.1 的阶梯计费策略?企业级大规模调用实务完全指南|Duuu笔记

需深入理解Gemini 3.1阶梯计费与调用联动关系,通过识别阶梯区间、请求级Token预估截断、多模型路由调度、响应缓存去重、项目拆分配额绑定五种路径优化成本。 ☞☞☞AI 智能聊天, 问答助手,...

AI核心技巧:如何重置openclaw硬件设置 openclaw恢复出厂设置操作方法【操作】深度解析|Duuu笔记

重置 OpenClaw 配置有四种方法:一、交互式向导重置(openclaw onboard --reset);二、指定作用域的命令行重置(如--reset-scope config);三、手动删除~...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。