动态发布记录(2026年)
Magic 命令 | 含义说明 | 使用示例 |
%run | 运行指定的 Python 脚本或者 Notebook 文件 |
|
%pip | 安装指定的 Python 包 |
|
Magic 命令 | 含义说明 | 使用示例 |
%%python | 以 Python 语法执行当前单元格(通常不必要,默认为 Python ) |
|
%%markdown | 在单元格中渲染 Markdown 文本 |
|
%load_ext dlcmagic.kyuubikernel.magics.dlcenginemagics%load_ext dlcmagic.pythonkernel.magics
Magic 命令 | 含义说明 | 使用示例 |
%%py | 以 PySpark 语法执行当前单元格。使用前需要执行下面的初始化命令 |
|
%%scala | 以 Scala 语法执行当前单元格 |
|
%%sql | 以 Spark SQL 语法执行当前单元格 |
|
函数名称 | 含义说明 | 使用示例 |
summarize(df: Object): void | 对 DataFrame 的统计指标进行计算和展示,便于对数据结构进行了解。 适用于 Python 代码、PySpark 代码。 |
|
函数名称 | 含义说明 | 使用示例 |
exit(value: String): void | 退出当前 notebook ,并打印指定返回值,可以用这个方式将 notebook 的参数传递给下游任务。 |
|
run(path: String, timeoutSeconds: int, arguments: Map): String | 运行 notebook 文件 path:指定 notebook 文件路径 timeoutSeconds:超时时间 arguments:变量 |
|
函数名称 | 含义说明 | 使用示例 |
text(name: String, defaultValue: String, label: String): void | 设置变量值 |
|
get(name: String): String | 获取指定变量 |
|
remove(name: String): void | 清除指定变量 |
|
removeAll(): void | 清除当前上下文设置的变量 |
|
MLFlow 函数 | 函数名称 | 函数功能和用法 |
实验管理 | mlflow.create_experiment(name) | 创建一个新的实验。 需要保证实验名称的唯一性,如果实验名称已经存在,create_experiment 将引发异常。 |
| mlflow.set_experiment(name) | 设置当前实验。 它可以直接用于已存在的实验名,以便在后续的运行中记录参数和指标。 如果指定的实验不存在,则会自动创建一个新的实验。 |
| mlflow.start_run() | 开始一个新的运行。 返回一个 Run 对象,表示当前运行的上下文。 start_run() 通常与 with 语句一起使用,以确保在运行结束后自动调用 end_run()。 |
记录参数和指标 | mlflow.log_param(key, value) | 记录一个参数及其值。 key (str): 参数的名称。 value (str, int, float): 参数的值。可以是字符串、整数或浮点数。 |
| mlflow.log_metric(key, value, step=None) | 记录一个指标及其值。 |
| mlflow.log_artifact(local_path, artifact_path=None) | 记录本地文件或目录,例如模型的配置文件、数据文件、结果文件等。 local_path:要记录的本地文件或目录的路径; artifact_path:在 MLflow 服务器上存储该文件或目录的路径。 |
模型管理 | mlflow.sklearn.log_model(model, artifact_path) | 记录 Scikit-learn 模型。 |
| mlflow.pyfunc.log_model(artifact_path, python_model) | 记录自定义 Python 模型。 |
| mlflow.register_model(model_uri, name) | 注册模型到模型注册表。模型注册表是 MLflow 提供的模型管理和版本控制功能,便于模型的共享、部署和管理。 |
模型部署 | mlflow.pyfunc.serve(model_uri) | 部署模型为 REST API 服务。用于在本地启动一个 HTTP 服务器,以便提供注册的 MLflow 模型的预测服务,启动服务器后,可以通过 HTTP Post 请求发送数据进行预测。 model_uri:指向已注册模型的 URI ,可以是模型注册表中的 URI ,或已记录模型的路径。 |

# print project parametersprint(dlcutils.params.get("test_parameter"))# output 100


# get task_test_param value# When testing and running in the notebook space,# default values need to be set because the notebook file has not yet been associated with a task.try:task_test_param_value = dlcutils.params.get("task_test_param")if not task_test_param_value: # 如果获取到的值是空字符串task_test_param_value = 'task_default_value'except Exception: # 如果完全获取不到参数task_test_param_value = 'task_default_value'print(f"Using toy value: {task_test_param_value}")
# get workflow_test_param value# When testing and running in the notebook space,# default values need to be set because the notebook file has not yet been associated with a workflow.try:workflow_test_param_value = dlcutils.params.get("workflow_test_param")if not workflow_test_param_value: # 如果获取到的值是空字符串workflow_test_param_value = 'workflow_default_value'except Exception: # 如果完全获取不到参数workflow_test_param_value = 'workflow_default_value'print(f"Using toy value: {workflow_test_param_value}")
# Exit the notebook and output parametersdlcutils.notebook.exit('this is output parameter values')
# get task_input_param value# When testing and running in the notebook space,# default values need to be set because the notebook file has not yet been associated with a task.try:task_input_param = dlcutils.params.get("task_input_param")if not task_input_param: # 如果获取到的值是空字符串task_input_param = 'task_input_default_value'except Exception: # 如果完全获取不到参数task_input_param = 'task_input_default_value'print(f"Using toy value: {task_input_param}")




文档反馈