You need to enable JavaScript to run this app.
导航

变更记录

最近更新时间2024.01.19 17:27:24

首次发布时间2021.11.30 20:32:36

1.2.34 - 2024-01-17

Added

  • 支持自定义任务自定义 VPC

Fixed

  • 修复导出任务的实例数量不全的问题

1.2.33- 2023-12-25

  • 支持自定义任务实时日志

1.2.32- 2023-12-20

  • 增加 debug 日志

1.2.31 - 2023-11-02

  • 支持从env获取HTTP_PROXY配置的代理

1.2.29 - 2023-07-11

Added

  • 新增 ml_service 指令,支持推理服务相关功能

Fixed

  • 强化了请求的安全性

1.2.28 - 2023-07-07

Added

  • 增加 ReadOnly 字段,支持以只读方式挂载拥有挂载权限的 vePFS 子目录

1.2.27 - 2023-06-05

Fixed

  • 修复某些worker看不到日志的问题

Added

  • volc ml_task get --output json 支持输出 RoleSpecs 字段
  • ml_task命令新增instance子命令:volc ml_task instance list, 支持列举instance

1.2.26 - 2023-05-30

Added

  • 新增 MetaCacheExpiryMinutes字段,支持挂载TOS时设置缓存文件刷新时间,单位为分钟

1.2.25 - 2023-05-19

Fixed

  • 修复找不到slurm默认镜像的问题

1.2.24 - 2023-05-11

Added

  • 新增 RetryOptions 字段,支持自定义任务重试
  • 新增 Envs.IsPrivate 字段,支持添加私有环境变量

1.2.23 - 2023-04-13

Added

  • 支持 cn-guangzhou region
  • 修复华东、华南命令行自定义训练连接webshell错误
  • Storage 新增 NasId 字段,当 Storage.Type=Nas 时选填
  • 新增 TensorBoardStorgae 字段,支持用户将TensorBoard日志写入NasvePFS,需要开白

1.2.22 - 2023-03-07

Added

  • 新增 Storages.MetaCacheCapacity字段, 支持挂载TOS时设置缓存文件数量
  • 新增 Storages.MetaCacheExpiryMesc字段,支持挂载TOS时设置缓存文件刷新时间

1.2.20 - 2023-02-14

Added

  • 支持任务优先级

Fixed

  • 修复无法下载全部日志的问题

1.2.19 - 2023-02-08

Added

  • 支持提交mgpu任务(支持切分GPU)

Fixed

  • 修复任务可见性配置有时不生效的问题

1.2.18 - 2023-01-09

Added

  • 新增子命令: volc ml_devinstance, 支持开发机 cli

1.2.17 - 2022-12-21

Added

  • 支持 cn-shanghai region

1.2.16 - 2022-12-17

Added

  • 存储配置支持 FsName
  • 支持挂载 vePFS 子路径

Fixed

  • 修复任务日志为空的问题
  • 更新使用文档

Removed

  • 废弃 register 子命令

1.2.15 - 2022-10-25

Added

  • ml_task get/list --format 输出字段支持用户名。
  • 保存AK、SK时会进行可用性校验。

1.2.14 - 2022-10-09

Added

  • ml_task 新增子命令: volc ml_task template, 导出 ml_task 样例配置文件。
  • ml_task 提交任务支持通过 --set variable=value 的方式续写配置文件中的字段或者变量。

1.2.13 - 2022-08-31

Added

  • 配置文件新增 auto_upgrade 字段,支持自动升级功能。使用volc configure set auto_upgrade=true开启自动升级功能。
  • ml_task logs 命令支持使用 --start-time--end-time 来指定查询日志的时间范围。

Fixed

  • 修复了 ml_task sbatch --parsable 参数报错的问题。

1.2.12 - 2022-08-10

Added

  • ml_task 提交任务禁用 Args 字段。
  • 配置文件新增 AccessTypeAccessUsers 字段,ml_task submit 命令新增 --access_type 和 --access_users 参数,用于设置任务可见范围和可见用户。

1.2.11 - 2022-07-18

Added

  • 进度条可显示正在上传/下载的文件名称。
  • ml_task 的 sbatch 和 submit 命令支持在 --image 中填写 imageUrl。

1.2.10 - 2022-07-12

Fixed

  • 修复了文件上传完成但进度条显示不全的问题。

1.2.9 - 2022-07-11

Added

  • ml_task sbatch 支持指定 master 或 worker 的 flavor ID。

1.2.8 - 2022-07-07

Added

  • ml_task sbatch 的 --use-default-queue 选项,支持提交任务到公共队列。
  • ml_task 提交任务时建议用户将 Args 字段中内容写入 Entrypoint 字段中,并将在后续几个版本中逐步禁用 Args 字段。

Fixed

  • 进度条在上传文件后再更新。
  • 提交任务时,ActiveDeadlineSeconds 字段的默认值修改为10天(240h)。

1.2.7 - 2022-06-23

Added

  • volc ml_task export 命令,支持导出任务配置及下载代码。
  • ml_task sbatch 的 --partition 选项支持填写队列名称,不再支持 resource group id。
  • ml_task submit 新增 --resource_queue_name 选项,以及该命令的配置文件新增 ResourceQueueName 字段,支持填写队列名称。

1.2.6 - 2022-06-18

Fixed

  • 修复shell登陆退出问题。

1.2.5 - 2022-06-07

Added

  • volc ml_service 命令。

Fixed

  • 修复了使用 submit 命令在指定 --user_code_path 时,出现的 "TOSCodePath and LocalCodePath are both required if either one is not empty" 问题。

1.2.4 - 2022-05-31

Fixed

  • 修复升级命令,在升级帮助文档中补充新旧架构的升级方法。
  • 补充了 ml_task submit 提示信息中的更新文档。
  • 修复了 ml_task list 命令的提示信息格式。

Added

  • ml_task sbatch 支持 --mem 选项,用于指定每个节点的 real memory。
  • ml_task 支持 --links 选项,可以直接上传指向任意路径(包括 user_code_path 之外)的软链接。
  • 支持 ml_task sbatch 提交的 slurm 脚本中使用 -J,-N,-p 的短命令。
  • ml_task get/list 命令支持 --output 输出不同格式的数据,--format 定制输出字段。

1.2.3 - 2022-05-18

Fixed

  • 修复使用 --log-level 时,指定的值不生效的问题。
  • 修复在zsh环境下安装时,PATH未更新导致volc命令找不到的问题。

1.2.2 - 2022-05-12

Fixed

  • 保存凭据失败时未展示错误原因。
  • 提交任务时,当未指定 ActiveDeadlineSeconds,则使用默认时长(5天)而非无限时长。
  • 修复安装时对当前shell类型识别不准确的问题。

Added

  • ml_task sbatch 新增参数 --use-preset-packages,用于指定是否在Slurm任务的节点上预置由机器学习平台提供的常用软件包。
  • 新增参数 --log-level,可指定日志的输出级别。

1.2.1 - 2022-05-07

Added

  • ml_task 支持使用 queue id 来进行任务提交. 使用 resource group id 提交仍支持, 但将在后续几个版本逐步禁止.

1.2.0 - 2022-04-28

Fixed

  • 调整提示文案

Added

  • 列表中支持d健下载自定义代码

1.1.9 - 2022-04-21

Fixed

  • volc 代码上传临时禁止 ivolces 网址优化, 规避代码上传失败问题.

1.1.8 - 2022-04-19

Fixed

  • ml_task sbatch 修复 job.yaml 中的 env 会覆盖 slurm 系统自带的 env 问题
  • ml_task 支持 sbatch-cluster 子命令, 允许创建调试集群
  • ml_task sbatch 修复无法挂载 tos 分布式存储问题

1.1.7 - 2022-04-11

Fixed

  • ml_task sbatch 使用 -c 配置时, 不再要求 image/image url 至少一个不为空
  • volc upgrade 展示的 changelog 网址进行修复, 使用火山引擎官网地址

Added

  • ml_task/ml_model 支持 --copy-links 选项, 将软链接当作实际的文件内容. 解决代码路径中存在绝对路径会报错的问题.
  • ml_task 支持 --entrypoint/-e, --args/-a 覆盖 job.conf 中 entrypoint 和 args 的配置, 其中 --args 支持多个叠加使用.

1.1.6 - 2022-04-02

Fixed

  • ml_task logs 支持将大 logs 请求拆分成多个请求, 减少请求大量 logs 出现超时错误.

1.1.5 - 2022-03-28

Added

  • volc ml_image 命令

1.1.4 - 2022-03-22

Added

  • sbatch: 提交多实例slurm任务时,支持通过conf指定master实例的flavor。默认值:ml.c1e.large

1.1.3 - 2022-03-15

Fixed

  • install.sh 增加 webide 环境适配
  • sbatch 子命令完善提交体验, 修复一些不符合预期行为: 如自动添加 sbatch 脚本的执行权限
  • ml_task 导出命令支持CacheType、SidecarMemoryRatio
  • ml_task 支持verbose选项
  • ml_task 输出错误优化

1.1.2 - 2022-02-23

Added

  • volc ml_model 命令

1.1.1 - 2022-02-10

Added

  • (experimental) ml_task 增加 sbatch 子命令,支持使用 sbatch 提交单节点 slurm 任务

Other

  • 由于依赖架构调整, 构架和安装过程过程发生调整。1.0.xx 版本将不会自动升级到 1.1.xx 版本,后续将会引导升级

1.0.11 - 2022-01-12

  • 支持任务挂载NAS
  • 支持导出storage的配置
  • 支持环境变量VOLC_ACCESS_KEY_ID、VOLC_SECRET_ACCESS_KEY、VOLC_REGION覆盖config配置

1.0.10 - 2021-12-27

Added

  • TaskList 添加创建人信息

Fixed

  • 帮助信息中volce 改为 volc

1.0.9 - 2021-12-02

Changed

  • volc ml_task submit 参数修改

    • job_config 改为 conf
    • 新增 task_name, resource_group_id, description 参数
    • 所有参数添加 alias
  • volc ml_task get、cancel、list 的参数增加 alias

  • volc ml_task logs 参数修改

    • job 改为 task,task 改为 instance
    • 部分参数添加 alias
  • volc ml_task top 的参数改为 task 和 instance,并添加 alias

  • volc configure 添加 ak/sk 的获取链接

  • 添加刷新任务 / 任务实例功能

1.0.8 - 2021-11-30

Added

  • JobDetail 加上各角色名称、规格、数量
  • TaskList 按照 task 名称排序,并添加状态列
  • TaskDetail 添加实例规格
  • TaskList 回车的时候,给两个可交互的选择,进入 WebShell 、查看日志(拉取最近3000条日志)
  • 日志命令行自我升级
  • cache 支持客户维度隔离
  • 通过按键 q 返回上一级、通过按键 q 退出整个命令行工具
  • 通过按键 e 导出任务配置

Changed

  • get/cancel 的参数 task_id -> id
  • volc ml_task logs 的参数 pod 改为 job,container 改为 task,同时新增 lines 参数

Fixed

  • 命令行翻动的时候,entryPoint 太长导致的 windowSize 错乱的问题

Removed

  • 删除 volc ml_task attach 命令

1.0.7 - 2021-11-17

Added

  • ml_task 上传代码支持软链,不支持绝对路径

Fixed

  • resize 过程支持 height 调整,fix vi 下长文件编辑换乱的问题
  • task list worker 添加 roleIndex
  • 支持 cacheType 配置

1.0.6 - 2021-10-26

Added

  • ml_task 支持更新命令 upgrade

1.0.5 - 2021-10-21

Added

  • ml_task OpenAPI 重构
  • 支持小流量、压测标, 压测不支持代码上传,仅用于容器调度压测,相关配置参考使用文档
  • 支持升级提醒

1.0.4 - 2021-10-13

Added

  • 支持任务文件配置文件独立
  • 支持 ini 格式配置,兼容旧版配置文件
  • 任务文件支持多 profile

Fixed

  • 命令行登陆之后窗口 size 固定,输入较长的命令之后显示混乱。目前命令行 WebShell支持 resize