最近更新时间:2024.01.19 17:27:24
首次发布时间:2021.11.30 20:32:36
ReadOnly
字段,支持以只读方式挂载拥有挂载权限的 vePFS 子目录volc ml_task get --output json
支持输出 RoleSpecs 字段volc ml_task instance list
, 支持列举instanceMetaCacheExpiryMinutes
字段,支持挂载TOS时设置缓存文件刷新时间,单位为分钟RetryOptions
字段,支持自定义任务重试Envs.IsPrivate
字段,支持添加私有环境变量Storage
新增 NasId
字段,当 Storage.Type=Nas
时选填TensorBoardStorgae
字段,支持用户将TensorBoard日志写入Nas
或vePFS
,需要开白Storages.MetaCacheCapacity
字段, 支持挂载TOS时设置缓存文件数量Storages.MetaCacheExpiryMesc
字段,支持挂载TOS时设置缓存文件刷新时间volc ml_devinstance
, 支持开发机 clivolc ml_task template
, 导出 ml_task 样例配置文件。--set variable=value
的方式续写配置文件中的字段或者变量。auto_upgrade
字段,支持自动升级功能。使用volc configure set auto_upgrade=true
开启自动升级功能。ml_task logs
命令支持使用 --start-time
和 --end-time
来指定查询日志的时间范围。ml_task sbatch --parsable
参数报错的问题。Args
字段。AccessType
和 AccessUsers
字段,ml_task submit 命令新增 --access_type 和 --access_users 参数,用于设置任务可见范围和可见用户。Args
字段中内容写入 Entrypoint
字段中,并将在后续几个版本中逐步禁用 Args
字段。ActiveDeadlineSeconds
字段的默认值修改为10天(240h)。ResourceQueueName
字段,支持填写队列名称。--log-level
时,指定的值不生效的问题。ActiveDeadlineSeconds
,则使用默认时长(5天)而非无限时长。--use-preset-packages
,用于指定是否在Slurm任务的节点上预置由机器学习平台提供的常用软件包。--log-level
,可指定日志的输出级别。slurm
系统自带的 env 问题sbatch-cluster
子命令, 允许创建调试集群ml.c1e.large
。sbatch
子命令,支持使用 sbatch
提交单节点 slurm 任务volc ml_task submit 参数修改
volc ml_task get、cancel、list 的参数增加 alias
volc ml_task logs 参数修改
volc ml_task top 的参数改为 task 和 instance,并添加 alias
volc configure 添加 ak/sk 的获取链接
添加刷新任务 / 任务实例功能