核心功能

DSLIGHTING 提供了完整的数据科学工作流自动化能力，采用分层架构设计。

📊 数据层

数据准备与处理

支持的数据源

MLE-Bench: OpenAI机器学习评估基准数据集
自定义任务: 支持用户自定义数据集和任务

数据布局结构

data/competitions/
  <竞赛ID>/
    config.yaml           # 竞赛配置文件
    prepared/
      public/            # 公开数据（训练集、样本提交）
      private/           # 私有数据（测试标签，用于评分）

数据预处理能力

自动数据清洗和格式转换
缺失值处理和异常值检测
特征编码和数据标准化
数据集自动分割（训练/验证/测试）

🤖 Workflow 层

DSLighting 支持多种智能体工作流，可根据任务类型灵活选择：

已支持的 Agent

🔄 AIDE

迭代式代码生成和审查

持续的代码改进和优化
自动代码审查和质量检查
性能驱动的迭代策略

🎯 DSAgent

结构化操作符流程

清晰的任务分解和执行
灵活的操作符组合
确定性的执行流程

⚡ Data Interpreter

快速代码执行和调试

快速代码迭代和测试
自动错误检测和修复
实时代码调试

🔄 AFlow

元优化工作流

自动选择最优工作流
性能评估和策略优化
多工作流组合

🔬 DeepAnalyze

深度分析工作流

数据和模型深入分析
性能瓶颈识别
优化建议生成

📈 评估层

自动化评估系统

评估指标

分类任务: accuracy, F1-score, AUC, precision, recall
回归任务: RMSE, MAE, R², MAPE
排名任务: NDCG, MRR, Hit Rate

模型选择

自动模型比较
超参数优化
性能基准测试
A/B测试支持

日志与追踪

完整的执行轨迹记录
所有中间产物保存
详细的性能报告
结果复现支持

日志结构

runs/benchmark_results/
  <workflow>_on_<benchmark>/
    <model_name>/
      <task_id>/
        config.json          # 任务配置
        trace.json           # 执行轨迹
        submission.csv       # 提交文件
        report.md            # 实验报告
        artifacts/           # 中间产物

🔧 系统特性

交互式 Web 界面

基于 Next.js + FastAPI 构建
实时任务进度监控
可视化结果展示
支持自定义任务配置

可扩展架构

灵活的任务注册机制
支持自定义工作流
可插拔的Agent系统
易于添加新的Benchmark

🚧 待更新

更多功能和特性正在开发中：

[ ] 更多 Agent 工作流支持
[ ] 分布式任务执行
[ ] 模型 ensemble 功能
[ ] 自动特征工程优化
[ ] 更多数据格式支持
[ ] 实时协作功能

查看快速开始来体验这些功能！

核心功能 ​

📊 数据层 ​

数据准备与处理 ​

支持的数据源 ​

数据布局结构 ​

数据预处理能力 ​

🤖 Workflow 层 ​

已支持的 Agent ​

🔄 AIDE ​

🎯 DSAgent ​

⚡ Data Interpreter ​

🔄 AFlow ​

🔬 DeepAnalyze ​

📈 评估层 ​

自动化评估系统 ​

评估指标 ​

模型选择 ​

日志与追踪 ​

日志结构 ​

🔧 系统特性 ​

交互式 Web 界面 ​

可扩展架构 ​

🚧 待更新 ​

核心功能

📊 数据层

数据准备与处理

支持的数据源

数据布局结构

数据预处理能力

🤖 Workflow 层

已支持的 Agent

🔄 AIDE

🎯 DSAgent

⚡ Data Interpreter

🔄 AFlow

🔬 DeepAnalyze

📈 评估层

自动化评估系统

评估指标

模型选择

日志与追踪

日志结构

🔧 系统特性

交互式 Web 界面

可扩展架构

🚧 待更新